Arabic Handwriting Recognition Using Deep Learning Neural Networks

Arabic Handwriting Recognition Using Deep Learning Neural Networks. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF (MS Thesis _ Reviewed + All signatures)
MS_Thesis_08-7-2020.pdf - Updated Version
Restricted to Repository staff only until 8 July 2021.

Download (2MB)

Arabic Abstract

إن التعرف على النصوص المكتوبة باليد باستخدام الحاسوب من المسائل التي نواجه فيها تحديات عظيمة ، ولا سيما التعرف على النصوص العربية المكتوبة باليد. وذلك لأن النص العربي عادة ً ما يكتب من اليمين إلى اليسار كما أن الحروف العربية تكون متشابكة مما يجعل عملية التعرف على الحروف مسألة صعبة تتطلب في بعض الاحيان القيام بتجزئة النص إلى أجزاء صغيرة ثم التعرف على كل جزء منفرداً. نظراً لقلة الأبحاث التي تعنى باللغة العربية فإننا في هذا البحث سوف نقوم ببناء نظام تعرف على النصوص العربية باستخدام الشبكات العصبية العميقة. بسبب التطور المذهل في قدرات المعالجة الحاسوبية والتطور السريع لأنظمة الشبكات العصبية فلقد أثبتت الشبكات العصبية خلال العقد الماضي أنها وسيلة فعالة للتعرف على النصوص المكتوبة باليد، خاصةً النصوص المتشابكة مثل اللغة العربية. إننا نهدف في هذا البحث في بناء نظام فعال وسريع قادر على التعرف على النصوص العربية المكتوبة باليد، والقيام بعدد من التجارب التي تثبت فعالية هذا النظام. لقد قمنا ايضا في هذا البحث بتقديم خوارزمية جديدة للتعامل مع مشكلة عدم وجود عناصر كافية لتدريب الشبكة العصبية. لقد أثبتت هذه الخوارزمية بأنها قادرة على رفع كفاءة التعرف على النصوص العربية المكتوبة. لقد استخدمنا في هذا البحث قاعدة البيانات المشهورة IFN/ENIT و قاعدة البيانات AHDB وذلك لإثبات أن كفاءة النظام الجديد الذي نقترحه مع استخدام الخوارزمية أفضل من بعض الأنظمة التي نشرها حديثاً

English Abstract

Recognition of cursive handwritten Arabic text is a difficult problem because of context-sensitive character shapes, the non-uniform spacing between words and within a word, diverse placements of dots, and diacritics, and very low inter-class variation among individual classes. In this paper, we review and investigate different deep learning architectures and modeling choices for Arabic handwriting recognition. Further, we address the problem that imbalanced data sets present to deep learning systems. In order to address this issue, we are presenting a novel adaptive data-augmentation algorithm to promote class diversity. This algorithm assigns a weight to each word in the database lexicon. This weight is calculated based on the average probability of each class in a word. Experimental results on the IFN/ENIT and AHDB databases have shown that our presented approach yields state-of-the-art results

Item Type: Thesis (Masters)
Subjects: Engineering
Electrical
Department: College of Engineering and Physics > Electrical Engineering
Committee Advisor: Zidouri, Abdelmalek
Committee Members: Ahmad, Irfan and Zerguine, Azzedine
Depositing User: MOHAMED ELTAY (g201410680)
Date Deposited: 13 Jul 2020 07:11
Last Modified: 13 Jul 2020 07:11
URI: http://eprints.kfupm.edu.sa/id/eprint/141562