ONLINE ARABIC TEXT RECOGNITION USING STATISTICAL TECHNIQUES

ONLINE ARABIC TEXT RECOGNITION USING STATISTICAL TECHNIQUES. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
Baligh_Al-Helai.pdf - Accepted Version

Download (3MB) | Preview

Arabic Abstract

زاد الانتشار الواسع لاجهزة اللمس والادوات التي تدعم الكتابة الالكترونية بالقلم او باليد من الطلب على انظمة التعرف على الكتابة الآنية. ان لهذه التقنية تطبيقات مهمة من ضمنها بيئات التعليم الذكي و التطبيقات التجارية و غيرها. ان الغرض من هذه الرسالة اجراء بحث علمي للتعرف على الكتابة الأنية العربية. يتضمن هذا البحث المراحل المختلفة من نظم التعرف على النصوص. على وجه الخصوص, مزيد من التركيز سيكون على التقنيات الاحصائية و قابليتها للتطبيق على التعرف على الكتابة الآنية العربية. قمنا في هذه الرسالة بمسح شامل للدراسات السابقة. كما قمنا أيضاً بتطوير العديد من الأساليب لاستخدامها في المراحل المختلفة للتعرف على الكتابة الآنية العربية. احدى اسهامات هذه الرسالة هو الطريقة المطورة للتعامل مع النقاط و الهمزات و ما في حكمها والتي تسمى "الكتابة المتأخرة" وذلك باخذها بالاعتبار في مختلف المراحل من اجل تحسين الاداء الاجمالي. وقد قمنا بالاختبار المكثف للعديد من المميزات الاحصائية الجديدة والمكون من مرحلتين, الاولى لاستخراج المميزات المحلية والثانية لحساب العديد من الاحصائيات عليها. كذلك فإن البيانات المستخدمة هي من قاعدة بيانات كتابة عربية آنية بدون قيود مما يعني الحاجة للتعامل مع صعوبات اضافية مثل الترابط و التغاير و صعوبات النقاط و علامات الترقيم. هذا وقد تم عرض نتائج التقنيات والطرق المقترحة وتحليلها بعد تطبيقها على مستوى الحروف المقسمة واجزاء الكلمات والنصوص المكتوبة. اضافة الى ذلك يمكن استخدام الطرق المقدمة في العديد من المجالات مثل التعرف والتحقق من الكاتب والتحليل والتقصي الجنائي للكتابة اليدوية وانظمة التحقق من التوقيع. اخيراً تختتم هذه الرسالة بتلخيص الاستنتاجات من عملنا هذا وكذلك اتجاهات البحث المستقبلية.

English Abstract

The widespread use of pen-based hand-held devices, such as PDAs, smart phones, and tablets, has increased the demand for online text recognition systems. This technology has great potential in markets that involve friendly learning environments, business applications, education and more. The purpose of this thesis is to conduct research on Arabic online text recognition. This implies addressing the different phases of text recognition systems. In particular, the main focus is on using statistical features and techniques. We investigate the applicability of statistical-based techniques to Arabic online text recognition. In this thesis, we present a comprehensive survey of the related work. We then develop recognition prototypes for both non-cursive and cursive online Arabic text recognition. We present several novel techniques for the different phases of online Arabic text recognition using statistical approach. One of the contributions of this research is the methodology of handling the delayed strokes. The delayed strokes are handled at the different phases of the recognition process differently to improve the overall performance. Another contribution is the intensive investigation of several novel statistical features using a developed framework for generating different statistical features. The framework consists of two main components. The first one is to extract the point-based features (local features). A statistical layer is then added to form statistical features. Moreover, the used dataset is extracted from a database of unconstrained online cursive text. Using such dataset implies the need of addressing additional difficulties such as connectivity, variability, and delayed strokes challenges.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Mahmoud, Sabri
Committee Members: Al-Khatib, Wasfi and Abdel-Aal, Radwan
Depositing User: AL-HELALI MOHAMMED AHMED (g201105170)
Date Deposited: 24 May 2016 08:47
Last Modified: 01 Nov 2019 16:34
URI: http://eprints.kfupm.edu.sa/id/eprint/139975