An Object-oriented model for semantic analysis of natural languages

(2001) An Object-oriented model for semantic analysis of natural languages. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
10334.pdf

Download (3MB) | Preview

Arabic Abstract

تلعب أنظمة معالجة اللغات الطبيعية دوراً بارزاً في كثير من التطبيقات النافعة ، مثل واجهة قواعد البيانات ، الترجمة الآلية ، الاكتساب الآلي للمعرفة والتلخيص الآلي وغير ذلك . يمكن تقسيم أنظمة معالجة اللغات الطبيعية إلى عدة مراحل . يعتبر التحليل الدلالي للغات الطبيعية من أهم وأصعب المراحل . وتكمن مهمة هذه المرحلة في تحويل النص المعطى إلى بنية داخلية والتي تعكس المعاني والدلالات الموجودة في النص المعطى . ويعتمد نظام معالجة اللغات على قاموس يحوي معلومات لغوية من المفردات . تتقدم هذه الرسالة باقتراح نموذج للتحليل الدلالي للغات الطبيعية . وتتميز النموذج بتطبيق خاصية التنسيق الذاتي . وقد تم تسمية النموذج بـ (OSEMAN) . يفترض النموذج وجود قاموس ذات خاصية التنسيق الذاتي يقوم بتخزين المفردات على شكل فئات ضمن تصنيف دلالي . يتم إدخال النص المطلوب تحليله إلى النموذج . يقوم النموذج باستخراج الجذور من النص ثم ترتبط هذه الجذور مع بعضها لتكوين البنية الداخلية التي تعكس دلالات النص . ويمكن أن يكون هناك أكثر من بنية داخلية للنص الواحد . وفي هذه الحالة يتم تقييم كل احتمال بقيمة تعطي دلالة على مدى قوة الارتباط بين الجذور لإعطاء دلالات النص .

English Abstract

Natural Language Processing (NLP) has many applications such as Database user interfaces, Machine Translation, Knowledge Acquisition and Report Abstraction. Natural Language Processing can be subdivided into various stages. Semantic Analysis is regarded to be the most important and the most challenging stage. This stage concentrates on converting the input sentence into an internal representation that reflects the meaning of the sentence. Any NLP system relies on a lexicon that contains information about language vocabulary. The thesis proposes an Object-Oriented model for Semantic Analysis of Natural Languages. The model is named OSEMAN. OSEMAN assumes an object-oriented lexicon, where language words are stored as classes arranged in a semantic hierarchy. OSEMAN takes as input the stems of the sentence. Then it instantiates the stems from the sentence. These stems are combined to form an internal representation that reflects the meaning of the input sentence. These stems may combine in different ways that yields more than one internal representation for the same input sentence. Each representation is quantified by an overall weight that reflects the semantic consistency between the stems of the sentence.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Aref, Mostafa M.
Committee Members: Ahmed, Zulfiqar and Al-Mulhem, Mohammad Saleh
Depositing User: Mr. Admin Admin
Date Deposited: 22 Jun 2008 14:02
Last Modified: 01 Nov 2019 13:59
URI: http://eprints.kfupm.edu.sa/id/eprint/10334