Writer Identification of Arabic Handwritten Documents

Writer Identification of Arabic Handwritten Documents. PhD thesis, King Fahd University of Petroleum and Minerals.

This is the latest version of this item.

[img]
Preview
PDF (Writer Identification of Arabic Handwritten Documents - Sameh Awaida)
Thesis_Writer_Identification_Sameh_Awaida_Final.pdf - Accepted Version

Download (7MB) | Preview

Arabic Abstract

أصبحت القضايا المتعلقة بالتعرف على هوية الشخص محط اهتمام في مجتمعنا العصري الحديث. إن مجال تحديد هوية صاحب الخط في الوثائق العربية يحظى باهتمام متجدد. من المتوقع أن تساعد تقنيات البحث والخوارزميات المتقدمة في هذه الأطروحة في تقدم مجال تحديد هوية صاحب الخط العربي من البحث العلمي. تتناول هذه الأطروحة الأساليب المختلفة لتحديد هوية صاحب الخط في الوثائق العربية المكتوبة بخط اليد من نصوص وأرقام من خلال الاستفادة من التقنيات والسمات وعناصر التصنيف الحديثة. وقد أظهرت الأبحاث المقيّمة لتمايز الأرقام المكتوبة بخط اليد قدرة كل رقم على تمييز صاحب الخط، وأظهرت الأبحاث أيضا إمكانية تصميم نظام لتحديد هوية صاحب الخط باستخدام الأرقام الأساسية العربية العشرة. تم تصميم وتطوير نظام فعال لتحديد هوية صاحب خط الأرقام والنصوص العربية المكتوبة بخط اليد. وقد شمل هذا العمل بناء قاعدة بيانات تتضمن نصوصا مكتوبة بخط اليد باللغة العربية من قبل250 كاتب اذ لا توجد أية قاعدة بيانات عربية متاحة لهذا الغرض. في هذا العمل تم استخراج عدة أنواع من السمات الهيكلية والإحصائية من نص الخط العربي، وهذه السمات هي: ميزات الاطارات المتصلة، وميزات توزيع التدرج المتراكب، وميزات توزيع التدرج المتراكب ذي النوافذ، وميزات توزيع الانحدار، وميزات سلاسل محيط الأشكال، وميزات سلاسل محيط الأشكال ذي النوافذ، وميزات قياس الكثافة، وميزات قياس طول المسار الأفقي والرأسي، وميزات قياس جرة القلم ، وميزات قياس تقعر الشكل. تمت مقارنة نتائج دقة النظام باستخدام الدلالة الإحصائية لكل سمة على حدة على النص العربي والأرقام العربية كما تم عرض النتائج التجريبية الحاصلة من تطبيق هذه الميزات. وقد تم تحليل وعرض آثار زيادة عدد الكتّاب على دقة النتائج، بالاضافة الى تطبيق وعرض تقنيات لتقليل واختيار السمات التفصيلية (مثل PCA ، LDA ، MDA ،...) لتحسين الدقة وتقليل الوقت اللازم لحساب نتائج نظام تحديد وهوية صاحب الخط.

English Abstract

The issues related to writer identification are currently at the heart of numerous concerns in our modern day’s society. Writer identification for Arabic text is receiving a renewed attention. We anticipate that the developed research techniques and algorithms in this thesis to help in establishing this area of research. Writer identification of off-line Arabic handwritten text and digits is addressed by utilizing the state of the art identification and verification techniques, features, and classifiers. The presented identifiability of handwritten digits provides quantitative measurements for the uniqueness of each digit. The research work has also shown that we can design a successful writer identification system from only the basic 10 Arabic digits given that other writers write the same digits. A successful writer identification system for handwritten Arabic text is designed and developed. Since there is no available Arabic database for this application, this research includes building a database for handwritten Arabic text by 250 writers. Several types of structural and statistical features are extracted. Connected component features as well as Overlapped gradient distribution features, gradient distribution features, windowed gradient distribution features, contour chain code distribution features, windowed contour chain code distribution features, density features, horizontal and vertical run length features, stroke features, and concavity shape features are implemented. The accuracy results of each feature type are compared using statistical significance. The effects of increasing the number of writers on the accuracy results are presented and analyzed. Experimental results of applying these features on Arabic text and digits are presented. Feature reduction and selection techniques (e.g. PCA, LDA, MDA, …) are applied and shown to improve both computation time and accuracy results.

Item Type: Thesis (PhD)
Department: College of Computing and Mathematics > Computer Engineering
College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Mahmoud, Sabri
Committee Members: Abdel-Al, Radwan and Elshafei, Mustafa and Siuwayel, Mohamad and Al-Khatib, Wasfi
Depositing User: SAMEH OWAIDAH (007073216)
Date Deposited: 21 Aug 2011 11:31
Last Modified: 01 Aug 2021 12:27
URI: http://eprints.kfupm.edu.sa/id/eprint/138491

Available Versions of this Item

  • Writer Identification of Arabic Handwritten Documents. (deposited 21 Aug 2011 11:31) [Currently Displayed]