Automatic Arabic Handwritten Check Recognition

Automatic Arabic Handwritten Check Recognition. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
Bellegdi_MS_Thesis.pdf - Accepted Version

Download (2MB) | Preview

Arabic Abstract

تطرقنا في هذه الأطروحة لموضوع التعرف الآلي على الصكوك العربية المكتوبة يدوياً. اقترحنا أساليب لاستخراج الأجزاء الخاصة بالمبالغ الرقمية والحرفية، والتعرف الآلي على الأرقام العربية المكتوبة يدوياً، والتعرف الآلي على المبالغ العربية الرقمية. وقد استخدمنا قاعدة بيانات حقيقية من "قاعدة بيانات سينبارمي (CENPARMI) للصكوك العربية" للتحقق من الطرق المقترحة. استخدمنا طرق تمدد الصورة والإساقطات الرأسية والأفقية ومقابلة الصور لاستخراج الأجزاء الخاصة بالمبالغ الرقمية والحرفية من الصكوك. حققنا معدل استخراج بلغ 100٪ لاستخراج أجزاء المبالغ الرقمية، و أكثر من 91٪ لاستخراج أجزاء المبالغ الحرفية. قمنا بالتركيز على موضوع التعرف الآلي على الأرقام العربية المكتوبة يدوياً واستحدثنا سمات تعتمد على بنية الأرقام العربية للتعرف الآلي على هذه الأرقام. كما طورنا قواعد للأرقام العربية للتعرف على هذه الأرقام تلقائياّ. وقد استخدمنا بعض تقنيات التعلم الآلي كآلات الدعم الإشعاعي وغيرها، مفردة ومع القواعد المطورة. وقد تحصلنا باستخدام طريقة أغلبية التصويت لدمج نتائج تقنيات التعلم الآلي مفردة على نسبة تعرف تبلغ 98.95٪، وفي المقابل، بدمج تقنيات التعلم الآلي مع القواعد المطورة كانت نسبة التعرف 99.08٪. وبذلك فقد فاقت نتائجنا كل نتائج الأبحاث المنشورة باستخدام نفس قاعدة البينات، كما بينت النتائج التجريبية فعالية السمات البنائية وقواعد التعرف على الأرقام العربية. يعتمد أسلوبنا المقترح للتعرف الآلي على المبالغ الرقمية على أربع مراحل رئيسية: مرحلة ما قبل المعالجة، والكشف عن محددات الأرقام، والكشف عن الفواصل، والتعرف على الأرقام. إضافة إلى أن مشكلة التعرف على المبالغ الرقمية لم يسبق معالجتها من قبل على قاعدة البيانات المستخدمة، فقد أظهرت التقنية المقترحة أداءً واعداً كما أنها تمتاز بإمكانية تطويرها وزيادة أدائها.

English Abstract

In this thesis, we address the problem of automatic processing of Arabic handwritten checks. We proposed techniques for automatic extraction of courtesy and legal amounts and Arabic handwritten digits and courtesy amount recognition. Real data from CENPARMI Arabic check database is used. For automatic extraction of courtesy and legal amount fields, we used image dilation, horizontal and vertical projections, and image registration. We achieved extraction rates of 100% and more than 91% for courtesy and legal amounts, respectively. More emphasis is given to Arabic handwritten digits recognition. Novel structural features that are based on the structure of Arabic digits are proposed for automatic recognition of Arabic (Indian) bank check digits. In addition, a rule-based classifier is implemented. Support Vector Machine (SVM), LogitBoost, and RandomForest classifiers are used in this work. Classifiers’ fusion with majority voting is used with and without the rule-based classifier. Recognition rates of 98.95% and 99.08% are achieved using fusion of the statistical classifiers alone and with the rule-based classifier, respectively. The achieved recognition rates outperform the published work using the same database. The experimental results indicate the effectiveness of the structural features and the rule-based classifier for recognizing Arabic digits. The proposed technique for automatic recognition of courtesy amounts has four main phases: preprocessing, delimiters detection, commas detection, and digits recognition. Through experimentations, the proposed technique has demonstrated promising performance. In addition, the proposed technique can be further extended. To the best of our knowledge, our work is the first to tackle this problem on the given database.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Mahmoud, Sabri A.
Committee Members: Abdel-Aal, Radwan E. and Adam, Salahadin
Depositing User: BELLEGDI S ABDULLAH (g200804260)
Date Deposited: 08 Jan 2013 08:34
Last Modified: 31 Dec 2020 07:19
URI: http://eprints.kfupm.edu.sa/id/eprint/138823