AUTOMATIC RETRIEVAL AND ANALYSIS OF HIGH AVAILABILITY SCENARIOS FROM SYSTEM EXECUTION TRACES

AUTOMATIC RETRIEVAL AND ANALYSIS OF HIGH AVAILABILITY SCENARIOS FROM SYSTEM EXECUTION TRACES. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
Automatic_Retrieval_and_Analysis_of_High_Availability_Scenarios_from_System_Execution_Traces.pdf - Accepted Version

Download (2MB) | Preview

Arabic Abstract

أصبحت خاصية الإتاحة العالية مطلبا ذو أهمية كبيرة لأنظمة الشركات. بل هو إلزامي للأنظمة الحرجة التي لا تستطيع تحمل التوقف. وتنتج هذه الأنظمة كميات هائلة من بيانات التتبع، حيث تتشابك الجوانب الوظيفية وغير الوظيفية، مثل الإتاحة والأمن والسلامة؛ ومن ثم يصعب فصلها وتحليلها. التحليل الديناميكي يهدف إلى استخراج وتحليل سلوك تشغيل النظام اعتمادا على بيانات التتبع للتنفيذ. استرجاع وتحليل جوانب الإتاحة العالية من شأنه أن يساعد المحللين على فهم وإعداد تقرير عن كيفية استعادة النظام عند حدوث فشل. بالإضافة إلى ذلك، فإنه سيساعد القائمين بعملية الصيانة على التحقق من توافق السلوكيات الملاحظة مع متطلبات الإتاحة المقصودة. الهدف من هذه الرسالة هو تطبيق التحليل الديناميكي لاسترداد وتحليل سيناريوهات الإتاحة العالية من بيانات التتبع لتنفيذ النظام. قمنا بتطوير نهج آلي يقوم باسترداد وتحليل سيناريوهات الإتاحة العالية من بيانات التتبع لتنفيذ النظام. يتم تجميع بيانات التتبع أولا من أنظمة تتوفر فيها خاصية الإتاحة العالية، ثم يتم تصفيتها ودمجها وتقطيعها الى مراحل.بعد ذلك يتم ربط مراحل التنفيذ المستخرجة وتحليلها وعرضها، مما يسمح باكتشاف الأخطاء وتشخيصها. قمنا تجريبيا بتقييم فعالية نهجنا باستخدام أربع دراسات حالة واقعية للشبكات التي تقوم بتشغيل بروتوكول سيسكو الذي يسمى الموجه الاحتياطي الجاهز (HSRP). تشير النتائج إلى أن مشغلات الحدث المرتبطة بـ (HSRP) والإجراءات المرتبطة بها تم استردادها بنجاح، وتم ربطها، وعرضها. علاوة على ذلك، تظهر النتائج أن أداة النموذج الأولي (HAAnalyzer) كانت قادرة على اكتشاف وتشخيص الأعطال التي كانت مصنفة في بيانات التتبع التي تم جمعها، وتحقيق دقة واستدعاء عاليين.

English Abstract

High availability (HA) is becoming an increasingly important requirement for enterprise systems. It is even mandatory for critical systems who cannot afford downtime. Such systems produce huge amounts of trace data, where functional and non-functional aspects, such as availability, security, and safety, are intertwined; hence they are hard to dissociate and to analyze. Dynamic analysis aims at capturing and analyzing the run-time behavior of a system based on its execution traces. Retrieving and analyzing system high availability aspects would help analysts understand and report on how a system is recovering failures. In addition, it would help maintainers verify the compliance of observed behaviors with the intended availability requirements. The aim of this thesis is to apply dynamic analysis to retrieve and analyze high availability scenarios from system execution traces. We developed an automated approach that retrieves and analyzes high availability scenarios from system execution traces. Traces are first collected from systems running high availability features, then filtered, merged, and segmented. The extracted execution phases are then correlated, analyzed, and visualized, allowing for fault detection and diagnosis. We evaluated empirically the effectiveness of our approach using four real-world case studies of networks running the Cisco Hot Standby Router Protocol (HSRP). Results show that HSRP-related event triggers and associated actions were successfully retrieved, correlated, and visualized. Furthermore, results show that our prototype tool (HAAnalyzer) was able to detect and diagnose the faults that were seeded in the collected traces, achieving a high precision and recall.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Hassine, Jameleddine
Committee Members: Ahmed, Moataz and Niazi, Mahmood
Depositing User: MAGED SALE SHEGHDARA (g201304030)
Date Deposited: 21 Apr 2019 11:51
Last Modified: 31 Dec 2020 05:53
URI: http://eprints.kfupm.edu.sa/id/eprint/140895