Arabic Database for Automatic Printed Arabic Text Recognition Research and Benchmarking

(2009) Arabic Database for Automatic Printed Arabic Text Recognition Research and Benchmarking. Masters thesis, King Fahd University of Petroleum and Minerals.

PDF (A Thesis document wirtten by Amin Ghalib Al-Hashim for his MS degree in CS)

Download (1MB) | Preview

Arabic Abstract

احدى العقبات الرئيسية اللتي تواجه الباحثين في مجال التعرف الآلي على النصوص العربية هو عدم توفر قاعدة ببانات نصوص عربية تكون عامة وكبيرة وشاملة. هذا النوع من قاعدة البيانات يحفظ وقت وجهد الباحث المبذول في عملية إنشاء قاعدة بيانات خاصة عادةً ما تكون غير شاملة لجميع نواحي إتصالات الحياة اليومية المكتوبة. كما يمكن استخدام قاعدة بيانات النصوص العربية العامة والكبيرة والشاملة كقاعدة بيانات معيارية. من خلال قاعدة البيانات المعيارية هذه، يمكن مقارنة البحوث والتقنيات المختلفة. هدف هذا العمل هو إنشاء قاعدة بيانات للنصوص العربية المطبوعة مع الأخذ في عين الإعتبار فكرة التمديد المستقبلي. بالإضافة الى قاعدة البيانات، سوف يحتوي هذا العمل على البرمجيات الازمة لجعل عملية إدارة قاعدة البيانات المنشئة أكثر سهولة.

English Abstract

One of the major obstacles that face researchers in the automatic Arabic text recognition field is the lack of a public large-scale comprehensive Arabic text database. Such database saves the researcher’s time and effort since he will not be enforced to create a private database that most probably will not cover most of the aspects of real life written communications. Moreover, the public large-scale comprehensive Arabic text database can act as a benchmark database. Through this benchmark database, the research results of different researchers can be tested and verified. In addition, the different techniques and researches can be compared. The aim of this work is to construct such database for printed Arabic text with the idea of future extension in mind. This work includes software that makes the manipulation of the created database easier.

Item Type: Thesis (Masters)
Subjects: Research > Information Technology
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Mahmoud, Sabri
Committee Members: Alshayeb, Mohammad and Mohammed, Salahadin
Depositing User: AMIN ALHASHIM
Date Deposited: 02 Sep 2009 09:57
Last Modified: 01 Nov 2019 14:11