INVESTIGATING THE FACTORS AFFECTING CRASH SEVERITY OF VULNERABLE ROAD USERS INVOLVED IN CRASHES. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF (MS Thesis)
Ms Thesis (Sayed Abdul Jabar Rahmani) 202319710.pdf - Accepted Version Restricted to Repository staff only until 1 January 2027. Download (9MB) |
Arabic Abstract
أصبحت سلامة راكبي الدراجات قضية صحية عامة ملحّة، إذ لا يزال مستخدمو الطريق الأكثر عرضة للخطر يتأثرون بشكل غير متناسب بالإصابات المرورية الشديدة. تبحث هذه الدراسة في محددات خطورة حوادث راكبي الدراجات في فرنسا من خلال الاستفادة من ثمانية عشر عامًا من بيانات قاعدة بيانات الحوادث الجسدية على الطرق (BAAC) الوطنية للفترة (2005–2022) ومن خلال إطار متقدم لنمذجة التعلّم الآلي. تتمثل الأهداف في تطوير وتحسين ومقارنة مجموعة من النماذج التجميعية ونماذج المحولات للتنبؤ بنتائج خطورة الحوادث الثنائية، إضافةً إلى تحديد وشرح العوامل السياقية والبنيوية والسلوكية التي تؤثر على خطورة الحوادث التي يتعرض لها مستخدمو الطريق الأكثر عرضة للخطر. تم تنفيذ منهجية موحّدة شملت معالجة بيانات واسعة، وهندسة متغيرات مستهدفة، ومعالجة اختلال توازن الفئات، وتدريب عدة نماذج تعلم آلي تشمل الغابة العشوائية (Random Forest) والاكسجبوست (XGBoost) ولايت جبوست (LightGBM) وتاب ترانسفورمر وFT-Transformer، والتي تم تحسينها باستخدام البحث العشوائي مع التحقق المتقاطع وخوارزمية التطور التفاضلي مع هايبر باند (DEHB) وخوارزمية صقور هاريس (HHO). تم تقييم أداء النماذج باستخدام مقاييس شاملة، كما تم تحقيق قابلية التفسير من خلال طريقتي SHAP وLIME لتوليد تفسيرات عامة ومحلية. وتشير النتائج إلى أن نموذج LightGBM–HHO يقدّم أفضل توازن بين الدقة التنبؤية والقدرة على التعميم وحساسية فئة الإصابات الشديدة، كما تكشف تحليلات التفسير أن فئة الطريق ونوع الموقع (خصوصاً البيئات الريفية) وفئة عمر الضحية ونمط التصادم وتفاعلات المناورات ومعدات السلامة تُعد من أكثر المتغيرات تأثيراً في تحديد مدى خطورة الإصابة. وتؤكد هذه النتائج على التداخل المعقّد بين البنية التحتية والسياق البيئي وخصائص مستخدم الطريق في تشكيل نتائج الإصابات. وبشكل عام، تقدم هذه الدراسة إطاراً محسّناً وقابلاً للتفسير يعتمد على التعلّم الآلي لتحليل شدة حوادث راكبي الدراجات، كما توفر رؤى عملية لدعم التدخلات المعتمدة على البيانات في مجال السلامة المرورية، وتدعم تحسينات البنية التحتية المستهدفة واستراتيجيات أكثر دقة لإدارة السرعة ومبادرات سلامة مخصصة للفئات ذات الخطورة العالية، إضافةً إلى تمهيد الطريق لأبحاث مستقبلية في نمذجة الخطورة الزمانية–المكانية وأنظمة السلامة الذكية لراكبي الدراجات
English Abstract
Cyclist safety remains a critical public health concern as vulnerable road users (VRUs) continue to experience disproportionately severe traffic injuries. This study investigates the determinants of cyclist crash severity in France using eighteen years of national crash records from the Base de Données des Accidents Corporels de la Circulation (BAAC) covering 2005–2022. An advanced machine learning framework was developed to predict binary crash severity outcomes and to identify the key human, environmental, and roadway factors shaping injury severity. The methodological pipeline integrated comprehensive data preprocessing, targeted feature engineering, and class balancing, followed by the development and optimization of ensemble models (Random Forest, XGBoost, and LightGBM) and transformer-based architectures (Tab Transformer and FT-Transformer). Hyperparameters were optimized using Random Search Cross-Validation, Differential Evolution with Hyperband (DEHB), and Harris Hawks Optimization (HHO). Model performance was evaluated using accuracy, precision, recall, F1-score, and ROC metrics. Results demonstrate that the LightGBM model optimized with HHO achieved the most balanced performance in terms of predictive accuracy, generalization capability, and sensitivity to severe crashes. Explainability was ensured through SHapley Additive exPlanations (SHAP) and Local Interpretable Model-agnostic Explanations (LIME), providing both global and local interpretive insight. The analysis revealed that road category, rural location type, victim age group, collision configuration, maneuver interactions, and safety equipment usage are among the most influential predictors of severity. These findings highlight the complex interplay between infrastructure characteristics, contextual conditions, and user vulnerability. Overall, this study contributes a rigorously optimized and interpretable ML framework for cyclist crash severity analysis and offers actionable insights to support data-driven safety interventions. The outcomes reinforce the need for targeted infrastructure improvements, enhanced speed management, and tailored safety strategies for high-risk user groups, while establishing a foundation for future research in spatiotemporal severity modeling and intelligent cyclist safety systems.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: | Computer Environmental Construction Civil Engineering Civil Engineering > Transportation Engineering Engineering |
| Department: | College of Design and Built Environment > Civil and Environmental Engineering |
| Committee Advisor: | AL-AHMADI, HASSAN M. |
| Committee Members: | ABDULLAH, MUHAMMAD and RAHMAN, SYED MASIUR |
| Depositing User: | SAYED RAHMANI (g202319710) |
| Date Deposited: | 04 Jan 2026 07:39 |
| Last Modified: | 04 Jan 2026 07:39 |
| URI: | http://eprints.kfupm.edu.sa/id/eprint/143974 |