Spatio-Temporal Analysis of Property Damage Only Accidents Using Machine Learning Approaches

Spatio-Temporal Analysis of Property Damage Only Accidents Using Machine Learning Approaches. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
Final Thesis Paper by Makides Tesfaye.pdf
Restricted to Repository staff only until 31 December 2026.

Download (4MB)

Arabic Abstract

تُعد حوادث الطرق تحديًا صحيًا عامًا عالميًا كبيرًا، إذ تسبب سنويًا خسائر بشرية واجتماعية واقتصادية واسعة. وقد شهدت المملكة العربية السعودية تاريخيًا معدلات مرتفعة من حوادث المرور. ورغم أن معظم الأبحاث الوطنية ركزت على الحوادث المميتة أو المصحوبة بإصابات، فإن حوادث التلفيات فقط (PDO) لا تزال قليلة الدراسة نسبيًا. ويُعزى ذلك في الغالب إلى انخفاض معدلات الإبلاغ عنها وإعطائها أولوية بحثية أقل مقارنة بالحوادث التي تؤدي إلى إصابات أو وفيات. ومع ذلك، فإن فهم العوامل المرتبطة بحوادث التلفيات يُعد أمرًا ذا قيمة، إذ يمكن أن يسهم في تحسين استراتيجيات إدارة المخاطر ومنع تطور الحوادث إلى نتائج أكثر خطورة. علاوة على ذلك، تعتمد العديد من نماذج التعلّم الآلي المستخدمة في التنبؤ بشدة الحوادث على التدريب والتحقق الشاملين أو العرضيين، متجاهلةً الانجراف الزمني، والتغايرية المكانية، واختلاف تأثير العوامل المختلفة على وقوع الحوادث. وفي هذا السياق، تقترح هذه الدراسة إطارًا للتعلّم الآلي القابل للتفسير (XML) لتحليل شدة حوادث التلفيات على الطرق الريفية السريعة بين المدن في المملكة العربية السعودية باستخدام بيانات الفترة 2017–2022. وقد أبرز تحليل النقاط الساخنة باستخدام نظم المعلومات الجغرافية وجود تكتلات في مناطق الرياض، المدينة المنورة، مكة المكرمة، القصيم، والمنطقة الشرقية. ونظرًا لأن اختيار معاملات الضبط (Hyperparameters) يؤثر بدرجة كبيرة على أداء النماذج، استخدمت الدراسة منصة Optuna المتقدمة لتحسين معاملات جميع نماذج التعلّم الآلي. وقد حقق نموذج XGBoost أفضل أداء. أظهر التقييم الزمني ثباتًا في أداء النموذج عبر السنوات، مع انخفاض مؤقت في عام 2020 يُرجَّح أنه يعكس التغيرات في أنماط الحركة المرورية خلال جائحة كوفيد-19. كما أظهر التقييم المكاني قدرة تنبؤية متسقة عبر المناطق (بدقة تراوحت بين 0.66 و0.74)، حيث سجلت منطقتا جازان وحائل أعلى أداء، بينما لوحظ انخفاض طفيف في الدقة في الرياض ومكة المكرمة والمنطقة الشرقية. ولتعزيز قابلية التفسير، تم استخدام قيم SHAP لتوفير تفسير عالمي يحدد ترتيب أهمية الخصائص وتحليل الأهمية الزمانية والمكانية. وقد أظهرت النتائج أن نوع الحادث، سبب الحادث، وعدد المركبات المتورطة تُعد من أكثر العوامل تأثيرًا على شدة حوادث التلفيات وغير التلفيات. كما برزت عوامل أخرى مؤثرة على نتائج حوادث التلفيات تشمل: عدد المركبات، نوع الطريق السريع، حالة سطح الطريق، الانحراف المفاجئ، وتورط الشاحنات الثقيلة. وفي المقابل، كانت حوادث النوم أو الإرهاق، والانقلاب، واحتراق المركبة أكثر ارتباطًا بالحوادث غير المرتبطة بالتلفيات فقط. وبالإضافة إلى ذلك، استُخدم مخطط الاعتماد (SHAP dependence plot) لدراسة العلاقة والتفاعل بين الخصائص وتأثيرها في التنبؤ بشدة الحادث. وأشارت النتائج إلى تفاعلات مهمة تزيد من شدة الحوادث في حالات الإرهاق أثناء الليل وفي التصادمات متعددة المركبات عندما يحدث احتراق في المركبات المتورطة. كما أكد التحليل الزمني لقيم SHAP وجود اتجاهات متغيرة عبر السنوات: إذ بدأ تأثير حوادث الانحراف المفاجئ بالانخفاض بعد عام 2019، بينما ازدادت أهمية عوامل تورط المركبات الثقيلة، واحتراق المركبات، وحوادث الليل، والعوامل المرتبطة بالمشاة بعد عام 2019

English Abstract

Road accidents remain a major global public health challenge, causing extensive human, social, and economic losses each year. Saudi Arabia has historically experienced high rates of road traffic accidents. While most national research has focused on fatal and injury crashes, property damage only (PDO) crashes remain relatively understudied. This largely due to frequent underreporting and the lower research priority given to minor crashes compared to those resulting in injuries or fatalities. However, gaining a deeper understanding of the factors associated with PDO crashes is valuable, as it can improve risk-management strategies and help prevent situations from escalating into more severe outcomes. Furthermore, most existing machine learning (ML) models for crash severity prediction are often trained and validated globally or cross-sectionally, overlooking temporal drift, spatial heterogeneity, and the varying contributions of different factors to road crashes. This study proposes an explainable ML (XML) framework. To analyze PDO crash severity on Saudi interstate/cities rural highways using data from 2017–2022. GIS-based hotspot analysis highlighted clusters in Riyadh, Madinah, Makkah, Qassim, and the Eastern Region. Because hyperparameter selection critically influences model performance, this study employs Optuna TPE method, an advanced optimization framework, to tune the hyperparameters of all ML models. XGBoost achieved the best performance compared to other models. Temporal assessments showed stable model performance across years, with a temporary decline around 2020, likely reflecting COVID-19-related changes in traffic patterns. Spatial evaluation demonstrated consistent predictive capability across regions (accuracy: 0.66–0.74), with Jazan and Hail performing highest and slightly lower accuracy observed in Riyadh, Makkah, and the Eastern Region. To enhance interpretability, SHapley Additive exPlanations (SHAP) were applied for global explanation provides the rank of importance features, temporal, and spatial feature importance analysis. Results identified accident type, accident cause, and number of vehicles involved in an accident significantly impact PDO and Non-PDO severity. The number of vehicles; wet road surface condition; sudden-deviation, and heavy-truck involvement as the most influential determinants on PDO outcomes while sleep or fatigue, rollover accident and vehicle burnt accident type more likely to non-PDO accident. Furthermore, The SHAP dependence plot is utilized to examine the relationship and interaction of features with respect to the prediction of the target variable. The findings indicated very important interactions that increase severity in fatigue-related crashes at nighttime and multi vehicle collisions with vehicle fire involved. Temporal SHAP analysis confirmed evolving trends: sudden-deviation crashes began decreasing post-2019 while heavy-vehicle, vehicle burn, and pedestrian related factors increased influence after 2019.

Item Type: Thesis (Masters)
Subjects: Civil Engineering > Transportation Engineering
Department: College of Design and Built Environment > Civil and Environmental Engineering
Committee Advisor: Abdullah, Muhammad
Committee Members: Al-Ahmadi, Hassan and Basheer, Muhammad Aamir
Depositing User: MAKIDES DAMENE (g202303870)
Date Deposited: 31 Dec 2025 10:19
Last Modified: 31 Dec 2025 10:19
URI: http://eprints.kfupm.edu.sa/id/eprint/143962