KFUPM ePrints

Arabic Database for Automatic Printed Arabic Text Recognition Research and Benchmarking

Al-Hashim, Amin Ghalib S. (2009) Arabic Database for Automatic Printed Arabic Text Recognition Research and Benchmarking. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF (A Thesis document wirtten by Amin Ghalib Al-Hashim for his MS degree in CS)
1247Kb

Arabic Abstract

احدى العقبات الرئيسية اللتي تواجه الباحثين في مجال التعرف الآلي على النصوص العربية هو عدم توفر قاعدة ببانات نصوص عربية تكون عامة وكبيرة وشاملة. هذا النوع من قاعدة البيانات يحفظ وقت وجهد الباحث المبذول في عملية إنشاء قاعدة بيانات خاصة عادةً ما تكون غير شاملة لجميع نواحي إتصالات الحياة اليومية المكتوبة. كما يمكن استخدام قاعدة بيانات النصوص العربية العامة والكبيرة والشاملة كقاعدة بيانات معيارية. من خلال قاعدة البيانات المعيارية هذه، يمكن مقارنة البحوث والتقنيات المختلفة. هدف هذا العمل هو إنشاء قاعدة بيانات للنصوص العربية المطبوعة مع الأخذ في عين الإعتبار فكرة التمديد المستقبلي. بالإضافة الى قاعدة البيانات، سوف يحتوي هذا العمل على البرمجيات الازمة لجعل عملية إدارة قاعدة البيانات المنشئة أكثر سهولة.

English Abstract

One of the major obstacles that face researchers in the automatic Arabic text recognition field is the lack of a public large-scale comprehensive Arabic text database. Such database saves the researcher’s time and effort since he will not be enforced to create a private database that most probably will not cover most of the aspects of real life written communications. Moreover, the public large-scale comprehensive Arabic text database can act as a benchmark database. Through this benchmark database, the research results of different researchers can be tested and verified. In addition, the different techniques and researches can be compared. The aim of this work is to construct such database for printed Arabic text with the idea of future extension in mind. This work includes software that makes the manipulation of the created database easier.



Item Type:Thesis (Masters)
Date:15 June 2009
Date Type:Completion
Subjects:Research > Information Technology
Engineering
Computer
Divisions:College Of Computer Sciences and Engineering > Information and Computer Science Dept
Creators:Al-Hashim, Amin Ghalib S.
Email:alhasha@kfupm.edu.sa
Committee Advisor:Mahmoud, Sabri
Committee Members:Alshayeb, Mohammad and Mohammed, Salahadin
ID Code:136140
Deposited By:AMIN ALHASHIM
Deposited On:02 Sep 2009 12:57
Last Modified:24 Nov 2014 10:44

Repository Staff Only: item control page