Genetic Fuzzy System Frameworks for Transparent Multivariate Time Series Prediction and Classification with Focused Case Study on Multiple Sclerosis Disease

Genetic Fuzzy System Frameworks for Transparent Multivariate Time Series Prediction and Classification with Focused Case Study on Multiple Sclerosis Disease. PhD thesis, King Fahd University of Petroleum and Minerals.

[img] PDF (PhD Dissertation)
Faisal_Dissertation.pdf - Accepted Version
Restricted to Repository staff only until 24 August 2021.

Download (13MB)

Arabic Abstract

يعتبر التعلم من الماضي، وتقييم الحاضر، ومن ثم محاولة التنبؤ بالمستقبل من أحد سمات الجنس البشري. السلسلة الزمنية: هي سلسلة من البيانات التي يمكنها أن تمثل ظاهرة معينة عبر تمثيلها من خلال التسلسل الزمني لها في الماضي والحاضر والمستقبل. عادة ما تكون السلاسل الزمنية سلسلة من القياسات المأخوذة في نقاط زمنية متتالية. تحليل السلاسل الزمنية هو مجال تحليل البيانات الذي يركز بشكل خاص على تحليل الماضي والحاضر والمستقبل. يمكن أن يأخذ تحليل السلاسل الزمنية عدة أشكال بما في ذلك التنبؤ والتجميع والتصنيف. هناك عدة أسباب وتطبيقات للتنبؤ في عدد من المجالات مثل سوق الأسهم والطيران والتنبؤ باحتياجات السكان من سكن وغذاء ...الخ. ومن أحد المجالات التي يستخدم فيها تحليل السلاسل الزمنية وفقاً للدراسات البحثية هو مجال الرعاية الصحية، خاصةً في مجال التشخيص والتنبؤ بالأمراض. ويعتبر التنبؤ بتطور الأمراض النادرة من أكثر هذه المجالات صعوبةً نتيجةً لندرة عينات المرضى. يعد مرض التصلب المتعدد (Multiple Sclerosis (MS)) أحد هذه الأمراض النادرة حيث لا تتوفر بيانات كافية عن المرضى. الغرض من تحليل السلاسل الزمنية الضبابية (Fuzzy time series) هو التعامل مع السلاسل الزمنية للقياسات الغير الدقيقة. حيث يسمح هذا النوع من التحليل بدمج الأحكام والتقييمات البشرية التي تكون غير دقيقة ويتم تمثيلها عادةً بعبارات ضبابية. كما يقدم نماذج يمكن للبشر فهمها وتفسيرها بسهولة. هذا النوع من التحليل يعتبر مفيد للغاية للخبراء خاصةً في مجال العلوم الصحية حيث يقوم الأطباء بإصدار الأحكام والتقييمات فيما يتعلق بحالة المرضى. ولتحليل هذا النوع من السلاسل الزمنية يتم استخدام الأنظمة الضبابية (Fuzzy systems) التي تتكون من مجموعة من القواعد الضبابية. مع ذلك، يعتبر الإنشاء الآلي لقواعد دقيقة وقابلة للتفسير صعب نتيجةً لعدة اسباب. نتناول في هذا العمل مهمة إنشاء القواعد الضبابية من البيانات التاريخية باستخدام الخوارزميات الجينية. لقد طورنا إطار عمل للتنبؤ وتصنيف السلاسل الزمنية الضبابية وركزنا على تطوير نموذج لمرض التصلب العصبي المتعدد. بالإضافة الى إمكانية النماذج التي تم تطويرها باستخدام بنية أحادية ومتعددة المخرجات التنبؤ بدرجات الإعاقة المستقبلية، توفر النماذج أيضًا رؤية للخبراء حول العلاقة السببية بين الأنظمة الوظيفية المختلفة للجسم. اظهرت النتائج التي أجرينها على مرض التصلب العصبي المتعدد وأمراض أخرى باستخدام عدد من مجموعات البيانات نتائج واعدة للنظام الذي تم تطويره في هذه الاطروحة..

English Abstract

Learning from the past, assessing the present, and trying to predict the future has always been an important feature of human race. A time series is a sequence of discrete-time data that could represent the status of a phenomena of interest in the past, present, and future. A time series is, typically, a sequence of measurements taken at successive points in time. Time series analysis is the domain of data analysis that specifically focuses on analyzing the past, the present, and the future. Time series analysis can be in many forms including forecasting, clustering, and classification. The reason and purpose of forecasting varies from achieving wealth and fame to personal satisfaction. Hence it is applied in various domains from stock market prices to airline travelling habits to housing and food needs for the needy people. Studying previous research work shows that time series analysis has been highly applicable in the field of health care especially in diagnosing and predicting the progression of diseases. Predicting the progression of rare diseases has been a challenge due to the scarcity of patient samples. Multiple Sclerosis (MS) is one such rare disease where not enough patient data is available. Fuzzy time series analysis is meant to deal with time series of imprecise measurements rather than precise ones. This allows for the incorporation of human judgments and assessments which are naturally imprecise and typically represented in fuzzy terms. It also offers models that can be easily understood and interpreted by human. This is very useful for the experts especially in the field of health sciences where physicians make judgments and assessments regarding the status of patients. Moreover, they also have domain knowledge in a form of causal relationships that are inherently fuzzy in nature. Fuzzy systems are employed in fuzzy time series analysis. Fuzzy rules are the main component in fuzzy systems. Automatic generation of accurate and interpretable fuzzy rules is not an easy task due to the involvement of many factors. In this work we address the task of fuzzy rules generation from historical data with the use of genetic algorithms. We developed a framework that is applicable of fuzzy time series predication as well as classification. We focused on MS disease to develop the models for its progression. The models developed using single and multi-output architecture not only predict the future disability scores but provide insight to experts the causal relation between various functional systems of the body. Experimentation with MS and other disease progression problems and validation using other datasets together with classification problems shows the framework is promising.

Item Type: Thesis (PhD)
Subjects: Computer
Systems
Research
Department: College Of Computer Sciences and Engineering > Information and Computer Science Dept
Committee Advisor: Ahmed, Moataz
Committee Members: Al-Bunyan, Reem and Selim, S.Z. and Niazi, Mahmood
Depositing User: MUHAMMAD FAISAL (g199903170)
Date Deposited: 27 Aug 2020 06:24
Last Modified: 27 Aug 2020 06:24
URI: https://eprints.kfupm.edu.sa/id/eprint/141706