Change-Point Analysis and Pattern Tracking in Data

Change-Point Analysis and Pattern Tracking in Data. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
Dalal’s Thesis (3).pdf
Restricted to Repository staff only until 9 June 2025.

Download (3MB)

Arabic Abstract

يعد تحليل نقاط التغيير مجالًا نشطًا للدراسة في العديد من المجالات، بما في ذلك مجال الإحصاء. الغرض الرئيسي من هذه الأطروحة هو تحديد نقاط تغير النمط وتقدير عددها ومواقع التغييرات الهيكلية في مجموعات البيانات. لقد قمنا بتطوير أساليب إحصائية جديدة لمعالجة القيود المفروضة على الطرق الحالية والتحديات المرتبطة باكتشاف نقاط التغيير، مما يساعدنا على فهم أفضل لطبيعة العمليات التي تكمن وراء البيانات. باستخدام الطريقة المقترحة الأولى، تم تحديد نقاط التغيير وتقسيم البيانات بالاعتماد على أسلوب التحسين لتقليل الأخطاء وذلك بحساب المسافة الإقليدية . توفر الطريقة المقترحة الثانية إطارًا ديناميكيًا للتعامل مع البيانات المتغيرة، فهي تركز على الطبيعة المعقدة للبيانات حيث تعمل على مجموعة البيانات بغض النظر عن محدوديتها. تناولت هذه الأطروحة تحديد نقطة التغيير وذلك بالتطبيق على مجموعة بيانات حقيقية لاستهلاك الطاقة وتم مقارنة أداء نموذج الانحدار المحلي بنموذج الانحدار العام. أظهرت نتائج الدراسة أن المسافة الإقليدية الناتجة عن نموذج الانحدار المحلي أصغر بكثير من المسافة الإقليدية الناتجة عن نموذج الانحدار العام وذلك باستخدام الطرق الإحصائية المقترحة. كما أظهرت الدراسة أن النتائج السابقة قابلة للتطبيق على مجموعة واسعة من البيانات. علاوة على ذلك، تم دراسة البيانات المتعلقة باستهلاك الطاقة باستخدام الشبكات العصبية العميقة وذلك لإثبات فعاليتها لتدعيم الهدف البحثي. حققت طريقة الشبكة العصبية نتيجة مماثلة، وهذا يوضح فعالية الطرق الاحصائية المقترحة، لا سيما في الحالات التي يكون فيها تقسيم البيانات مهمًا لتحسين أداء النماذج الاحصائية.

English Abstract

Change point analysis is an active area of study in various domains, including statistics. The main purpose of this thesis is to identify change points and estimate the number and location of structural changes in data sets. We have developed novel statistical methods to address the limitations of existing methodologies and the challenges associated with change point detection, helping us to understand better the nature of the processes that underlie observable data. In the first proposed method, change points are found and data is partitioned using an optimization approach to minimize errors using the Euclidean Distance. Furthermore, the second proposed method provides a dynamic framework for handling changing data. It takes into account the complicated nature of real-time data evolution and operates on a dataset regardless of its finiteness. This thesis examines change point detection in real datasets (power consumption) and compares the performance of local regression to global regression. Using advanced statistical techniques and bootstrapping by R software, the study shows that local regression produces considerably smaller Euclidean distances than global regression. These findings apply to a wide range of datasets. Moreover, the data was examined using Deep Neural Networks (DNNs) in the same real data (power consumption) to demonstrate their effectiveness in addressing the research challenge. The neural network approach achieved a similar outcome, providing comparable accuracy. This demonstrates our method's efficacy and validity, particularly in cases when data separating is important to improving statistical models' performance.

Item Type: Thesis (Masters)
Subjects: Math
Department: College of Computing and Mathematics > Mathematics
Committee Advisor: Boudabra, Maher
Committee Members: Afuecheta, Emmanuel and Sarumi, Ibrahim
Depositing User: DALAL ALZAHRANI (g202103290)
Date Deposited: 09 Jun 2024 10:47
Last Modified: 09 Jun 2024 10:47
URI: http://eprints.kfupm.edu.sa/id/eprint/142957