الصفحة الرئيسية
نبذة عن العمادة
نبذة عن العمادة
الرؤية والرسالة
الهيكل التنظيمي
الدراسات العليا بجامعة الملك عبد العزيز
الخدمات البحثية والدورات
وحدة الخدمات البحثية
ابحاث مهمة للمجتمع
خدمات العمادة
أسئلة متكررة
الأبحاث
دليل المنسوبين
مواقع مفضلة
دعم الطلاب
خريطة الوصول للعمادة
آلية توزيع الاستبانات
خدمة الاستبانات الطلابية
جوائز الدراسات العليا
التقديم على الجوائز
الفائزون بالجوائز للعام الجامعي 1440
منسوبو العمادة
دليل الموظفين
تواصل معنا
عربي
English
عن الجامعة
القبول
الأكاديمية
البحث والإبتكار
الحياة الجامعية
الخدمات الإلكترونية
صفحة البحث
عمادة الدراسات العليا
تفاصيل الوثيقة
نوع الوثيقة
:
رسالة جامعية
عنوان الوثيقة
:
تحليل هيكل المستندات العربية باستخدام التعلم العميق
LAYOUT ANALYSIS FOR ARABIC DOCUMENTS USING DEEP LEARNING
الموضوع
:
كلية الحاسبات وتقنية المعلومات
لغة الوثيقة
:
العربية
المستخلص
:
في الآونة الأخيرة اهتم الباحثون بمجال تحليل المستندات والتعرف الضوئي على الأحرف (OCR) ، حيث يمكننا أن نرى تحسنًا كبيرًا للغاية في أنواع مختلفة من محركات التعرف الضوئي على الحروف للغات مختلفة ، سواء بالنسبة للمستندات المطبوعة أو المستندات المكتوبة بخط اليد . كما نرى هناك اهتمام أقل بمعالجة المستندات باللغة العربية مقارنة باللغات الأخرى مثل اللغة الإنجليزية، ويمكن أن يكون ذلك لأسباب عديدة مثل صعوبة تحليل اللغة العربية ومحدودية قاعدات البيانات للمستندات العربية الموجودة. لتنفيذ أي محرك OCR، فإن الخطوة الأولى التي نحتاج إلى القيام بها هي تحليل تخطيط الصور المحددة قبل إرسال الصورة إلى OCR. تهتم دراسة الأطروحة هذه بتحليل تخطيط المستندات العربية باستخدام نهج التعلم العميق. نحن نستخدم في هذه الاطروحة نموذجين مختلفين للتعلم العميق، وهما الشبكة العصبية RCNN Faster وMask RCNN، حيث يتم تحديد استخدام كل نموذج لنوع مختلف من المستندات العربية. نحن نقوم بتجميع ثلاثة أنواع مختلفة من قاعدات البيانات للمستندات العربية وهم، المستندات المطبوعة قديما المسندات المطبوعة حديثا، والمستندات التاريخية، حيث إن لكل نوع من المستندات حجمها الخاص وهيكلها ومتطلبات خاصة لمعالجتها. نحن نقوم باستخدام RCNN Faster للمستندات العربية المطبوعة قديما والمطبوعة حديثا، وMask RCNN للمستندات التاريخية. معالجة المستندات العربية أصعب من معالجة المستندات الآخرى، وذلك بسبب الهيكل التخطيطي وصفات المستندات التاريخية مثل، نمط خط الكاتب عمر الورق المستخدم، الفترة الزمنية التي جاء منها المستند، الحبر المستخدم، وغيرها الكثير. نتائج هذه الأطروحة هي كالتالي، ٩٩.٥٩٪ للمستندات المطبوعة قديما، و٩٩.٥٦٪ للمستندات المطبوعة حديثا، وبالنسبة للوثائق التاريخية ٥١.١٤٪. مقارنة نتائجنا بنتائج النماذج الأخرى الموجودة، يمكننا القول إن عملنا يمكنه التغلب على الكثير من النماذج الموجودة في هذا المجال بنتائج رائعة. الكلمات المفتاحية: تحليل المستندات ، اللغة العربية ، منطقة الاهتمام ، Faster RCNN ، Mask RCNN
المشرف
:
د. الحسنين البرهمتوشي
نوع الرسالة
:
رسالة ماجستير
سنة النشر
:
1445 هـ
2023 م
تاريخ الاضافة على الموقع
:
Monday, November 13, 2023
الباحثون
اسم الباحث (عربي)
اسم الباحث (انجليزي)
نوع الباحث
المرتبة العلمية
البريد الالكتروني
لطيفه جلال الجفري
Al Jafri, Latifa Jalal
باحث
ماجستير
الملفات
اسم الملف
النوع
الوصف
49546.pdf
pdf
الرجوع إلى صفحة الأبحاث