MULTILINGUAL FRAMEWORK FOR ONTOLOGY-BASED SEMANTIC ANNOTATION OF HEALTH AND NUTRITION WEBSITES

MULTILINGUAL FRAMEWORK FOR ONTOLOGY-BASED SEMANTIC ANNOTATION OF HEALTH AND NUTRITION WEBSITES. PhD thesis, King Fahd University of Petroleum and Minerals.

This is the latest version of this item.

[img]
Preview
PDF
PhD_Thesis_of_Saeed_Albukhitan_2014.pdf

Download (5MB) | Preview

Arabic Abstract

إن نجاح تقنية الويب الدلالى يتطلب وجود كمية كافية من المحتوى الدلالي فى صفحات الويب. إحدى الطرق لإنتاج مثل هذا المحتوى هي من خلال الشرح الدلالي لمحتوى الويب الحالي. والمقصود بالشرح الدلالي هنا هو عملية إضافة علامات توضحية على المحتوى وذلك لمساعدة الحاسوب على فهم المحتوى النصي لصفحات الويب. وبالنظر للكمية الضخمة والمطّردة لمحتوى شبكة الانترنت فإن إتمام عملية الشرح الدلالى لمحتوي الويب بطريقة يدويه اصبح غير ممكن ولابد من اتمامه تلقائيا بواسطة برامج الحاسوب. في هذه الأطروحة، نقدم إطاريقوم تلقائيا بعملية الشرح الدلالي متعدد اللغات لصفحات الويب بإستخدام الانطولوجي (شبكة المعاني) الخاص بمحتوى صفحة. هذا الإطار المقترح هو جزء من إطارعام يستخدم شبكات الأنطولوجى للشرح الدلالي لمحتوى الويب وكذلك لفهمً أسئلة المستخدم دلالياً ومن ثم إسترجاع المعلومات التي تتناسب مع احتياجات المستخدم. تقدم الأطروحة ايضا طريقة لبناء الأنطولوجى متعدد اللغات بشكل تلقائي إعتماداً على مصادر عامة مثل الويكيبيديا والوردنت. علاوة على ذلك تقدم الأطروحة أداة للشرح التلقائى لصفحات الويب بإستخدام أساليب متعددة لإستخراج أسماء الكيانات والعلاقات فيما بينها من مصادر الويب المختلفة. كدراسة موجهة قمنا بتطويرمجموعة من الأنطولوجى متعددة اللغات في مجال التغذية والصحة، ومن ثمّ استخدمنا الاداة المقترحة لإتمام عملية الشرح الدلالى لمجموعة من صفحات الويب في مجال التغذية والصحة وذلك لإستخراج المعرفة من تلك الصفحات. وقد أجرينا عدة تجارب معملية بهدف دراسة كفائة وقدرة الإطار المقترح على التعرف على أسماء الكيانات والعلاقات فيما بينها من مصادر الويب المختلفة. حيث اظهرت النتائج كفائة عالية من حيث الدقة والشمولية فى إتمام عملية الشرح الدلالى لصفحات الويب في مجال التغذية والصحة. يمكن الاستفادة من مخرجات الإطار المقترح في تطبيقات البحث الدلالى للويب وذلك لإسترجاع إجابات دقيقة لإستفسارات المستخدمين وكذلك للإجابة على الاستفسارات المعقدة. علاوة على ذلك يساهم هذا العمل أيضا في تحقيق رؤية الويب الدلالي في المجالات المستهدفة خصوصا في اللغة العربية

English Abstract

In order to achieve the vision of the semantic Web, it is important to have enough amount of semantic content on the Web. To produce such content on the existing Web, semantic annotation on the Web content is required. Semantic annotation adds machine-readable content to the Web sources. Because the Web is growing at an expositional rate, annotating content semantically by hand is not possible. In this thesis, we present an automatic multilingual semantic annotation framework (MLSAF) for semantic annotation of Web sources based on the domain ontologies. The MLSAF is a sub-framework of an ontology-based semantic annotation and personalized information retrieval (OSAPIR) framework developed by the project team members, including me, during this thesis research work. We present a semi-automatic learning approach that utilizes public multilingual resources, such as Wikipedia and WordNet, for building multilingual ontology. Moreover, we present different approaches to extract name entities and relationships from Web sources. As a case study, we have developed and expanded a set of multilingual ontologies related to food, nutrition, and health through a set of processes. We have also developed the MLSAF prototype, and we show how it can utilize these ontologies to extract name entities and relationships from different Web sources in order to annotate and store them in the knowledgebase. We conducted several experiments to test the capability of MLSAF in recognizing the name entities and relationships using different approaches. Empirical evaluations of the MLSAF show promising performance results in terms of precision, recall, and F-measure. The outcome of the presented framework could be utilized by semantic Web searching applications to retrieve precise answers to the end user queries and to answer complex queries. An important feature of MLSAF is that it could be ported to other domains with minimal extension. This thesis also contributes to the vision of the semantic Web in the target domains, especially for Arabic Web sources

Item Type: Thesis (PhD)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: El-Basuny, Tarek
Committee Members: Al-Mulhem, Muhammed and Moataz, Ahmed and Mahmoud, Elish
Depositing User: AL-BUKHITA YOUSEF (g199128790)
Date Deposited: 17 Jun 2014 06:23
Last Modified: 01 Nov 2019 15:42
URI: http://eprints.kfupm.edu.sa/id/eprint/139278

Available Versions of this Item

  • MULTILINGUAL FRAMEWORK FOR ONTOLOGY-BASED SEMANTIC ANNOTATION OF HEALTH AND NUTRITION WEBSITES. (deposited 17 Jun 2014 06:23) [Currently Displayed]