Towards the retrieval of reusable software artifacts

Towards the retrieval of reusable software artifacts. PhD thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
Dissertation_Hamza_Salami.pdf

Download (1MB) | Preview

Arabic Abstract

هنالك العديد من الفوائد لإعادة استخدام البرمجيات ومنها التنمية المتسارعة، وانخفاض التكلفة، وانخفاض المخاطر والاستخدام الفعال للمتخصصين. لا سيما أن إعادة الإستخدام في مرحلة مبكرة من عملية تطوير البروجيات يزيد هذه الفوائد، لأنه يسمح بإعادة استخدام الإجزاء اللاحقة من البرمجيات بناء على إستخدام الاجزاء السابقة والتي بنيت عليها الاجزاء اللاحقة. وعادة ما يتم بناء البرمجيات من وجهات نظر مختلفة مثل عرض الهيكلية، وعرض السلوكية وعرض الوظيفة. لغة النمذجة الموحدة (UML) هو في الواقع لغة النمذجة المستخدمة من قبل مطوري البرمجيات خلال المراحل الأولى من تطوير البرمجيات مثل المتطلبات الهندسية والمعمارية والتصميم التفصيلي. في هذه الأطروحة، استعرضنا الاعمال السابقة المتاحة والمتعلقة بإعادة استخدام UML وقد قمنا بتصنيفها إلى صنفين رئيسين ذات وجهات النظر المتعددة أو ذات وجهة النظر وذلك إعتمادا على المنهجية المستخدمة لاسترجاع البرمجيات. الجدير بالذكر ان اجزاء البرمجيات ذات وجهات النظر المتعددة في المراحل المبكرة غالبا ما تتكون من مجموعة من النماذج، لذلك فقد قمنا بتحديد عددا من القضايا المهمة المتعلقة بربط كيانات نماذج UML المختلفة عند استرجاعها مع اعتماد وجهات النظر المتعددة. بناءا على المسائل التي تم مناقشتها، فقد قمنا بتوصيف نظام لإعادة استخدام اجزاء نماذج UML. بالاصافة الى ذلك ، ضمن منظومة إعادة الاستخدام، قمنا بعمل مرحلة ما قبل الترشيح والتي تساعد على تحديد مجموعة فرعية من نماذج المخزون والتي سيتم النظر فيها خلال مرحلة استرجاعها. في مرحلة الااسترجاع يتم تقييم و ترتيب التشابه بين الاستعلام والاجزاء المختصرة الموجوده في مخزن النماذج. ويتألف تقييم التشابه من جزئين رئيسين هما المطابقة و سجل التشابه. في المطابقة يتم ربط واحد الى واحد بين الكيانات المماثلة في نموذجين، في حين يقوم سجل التشابه بإرجاع قيمة التشابه بين النماذج القائمة على الكيانات المعينة. وبسبب ذلك التعقيد الحسابي الموجود في مطابقة كيانات موجوده في مجموعات من النماذج المراد مقارنتها، فإنه توجب علينا استخدام تقنيات البحث الارشادي لمطابقة الكيانات. بإستخدام تقنياتنا المقترحة فقد حصلنا على نتائج تصل في متوسط الدقة إلى 98.50٪، وبلغ الارتباط بين درجات التشابه والجهد المقدر لإعادة استخدامها 0.84.

English Abstract

The benefits of software reuse include accelerated development, reduced cost, reduced risk and effective use of specialists. Early-stage reuse maximizes these benefits, because it allows subsequent reuse of later stage artifacts derived from earlier artifacts. Software is typically modeled from different viewpoints such as structural view, behavioral view and functional view. Unified Modeling Language (UML) is the de facto modeling language used by software developers during the initial stages of software development such as requirements engineering, architectural and detailed design. In this dissertation, we reviewed existing UML reuse works and classified them as multi-view or non-multi-view, based on their retrieval approaches. Because early-stage multi-view artifacts often consist of a set of models, we identified a number of important issues regarding mapping of entities during multi-view retrieval of UML models. In response to the raised issues, we have described a system for reusing UML artifacts. Within the reuse system, a pre-filtering stage helps to select a subset of repository models which will be considered during the retrieval stage. A retrieval stage assesses the similarity of query and shortlisted repository artifacts, and ranks them. Similarity assessment comprises matching and similarity scoring. Matching establishes a one-to-one mapping between similar entities in two models, while similarity scoring returns a similarity value between the models based on the mapped entities. Due to the computational complexity involved in exhaustively matching entities in sets of models to be compared, heuristic search techniques are used for entity matching. Our techniques resulted in a Mean Average Precision of up to 98.50%, and the correlation between similarity scores and estimated reuse effort reached 0.84.

Item Type: Thesis (PhD)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Ahmed, Moataz
Committee Members: Alshayeb, Mohammad and Abdel-Aal, Radwan and Azzedin, Farag and Al-Darwish, Nasir
Depositing User: SALAMI HAM ONORUOIZA (g201002240)
Date Deposited: 02 Jul 2014 08:38
Last Modified: 01 Nov 2019 15:43
URI: http://eprints.kfupm.edu.sa/id/eprint/139317