Crash Severity Prediction and Reporting by Integrating Explainable Agentic AI

Crash Severity Prediction and Reporting by Integrating Explainable Agentic AI. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
Aws's Thesis - Final.pdf - Accepted Version
Restricted to Repository staff only until 4 June 2027.

Download (8MB)

Arabic Abstract

لا تزال حوادث المرور على الطرق تمثل تحديًا كبيرًا للسلامة العامة، لما تسببه من خسائر في الأرواح وآثار اجتماعية واقتصادية جسيمة. ويعد التنبؤ الدقيق بشدة الحوادث وتفسيرها أمرًا أساسيًا لدعم الاستجابة الطارئة، وتوجيه تحسينات السلامة، وتعزيز فعالية اتخاذ القرار. ومع ذلك، فإن كثيرًا من الأساليب الحالية تركز فقط على دقة التنبؤ دون تقديم تفسير واضح يدعم القرارات الوقائية، أو تعتمد بصورة كبيرة على الأنماط النصية دون أن تعكس بشكل كافٍ السلوك الحقيقي للحوادث واحتياجات الوقاية العملية. تعالج هذه الرسالة هذه التحديات من خلال تطوير إطار متكامل للتنبؤ بشدة الحوادث، وتحليل المخاطر القابل للتفسير، وإعداد التقارير باستخدام تقنيات الذكاء الاصطناعي المتقدمة. تجمع هذه الدراسة بين ثلاثة أبحاث مترابطة ومتكاملة. يدرس البحث الأول التقييم الآلي لشدة الحوادث باستخدام النماذج اللغوية الكبيرة، ويقارن بين أساليب التوجيه بالنصوص (Prompting)، والتوليد المعزز بالاسترجاع (RAG)، والتعلّم بالنقل المتكيف مع المجال. وتُظهر النتائج أنه في حين قدمت النماذج اللغوية العامة أداءً محدودًا في التنبؤ، فإن أساليب الاسترجاع المعزز حسّنت من موثوقية النتائج، بينما حقق الضبط الدقيق المتخصص أفضل أداء إجمالي، إذ بلغ معدل الدقة 84.1% مع القدرة على التعرف على 91.8% من الحوادث الشديدة، إلى جانب تقليل الإنذارات الخاطئة. أما البحث الثاني، فيوسّع نطاق التنبؤ ليشمل دعم القرار من خلال تطبيق المقارنة التنافسية بين النماذج، والتحليل الواعي بعدم اليقين، وتقارير “ماذا لو” المجمعة لحوادث الدراجات النارية مع المشاة. وقد حقق نموذج البيانات الجدولية العميق المحسّن أداءً قويًا بدقة بلغت 93.41% مع قدرة مرتفعة على اكتشاف الحالات الشديدة، في حين أظهرت تحليلات “ماذا لو” أن أكبر الانخفاضات في خطر الإصابة الشديدة تركزت في البيئات المتكررة عالية الخطورة التي تلعب فيها تحسينات معابر المشاة والتحكم بالتقاطعات الدور الأبرز. أما البحث الثالث، فيعزز موثوقية التنبؤ النصي بشدة الإصابة من خلال إدخال الضبط الدقيق الموجّه بالمبادئ الفيزيائية في نموذج لغوي كبير، وذلك عبر توجيه النموذج بعلاقة واقعية بسيطة تربط بين زيادة السرعة وارتفاع شدة الإصابة. وقد أدى هذا النهج إلى رفع دقة التنبؤ من 84.07% إلى 87.71%، كما عزز بدرجة كبيرة اتساق النموذج في ظروف الخطر المتزايد. وتُظهر النتائج مجتمعة أن التنبؤ بشدة الحوادث يمكن تحسينه بصورة ملحوظة عندما يُدمج النمذجة التنبؤية مع التكيف مع المجال، والاستدلال القائم على سيناريوهات “ماذا لو”، والتوجيه المبني على علاقات واقعية ذات معنى فيزيائي. وتتمثل مساهمة هذه الرسالة في تقديم إطار موحد وقابل للتفسير قائم على الذكاء الاصطناعي، يدعم التقييم الدقيق لشدة الحوادث وإعداد تقارير عملية تسهم في تعزيز أنظمة السلامة المرورية، وتوجيه التدخلات المستهدفة للحد من مخاطر الحوادث على الطرق.

English Abstract

Road traffic crashes remain a major public safety challenge, resulting in significant loss of life and substantial social and economic consequences. Accurate prediction and interpretation of crash severity are essential for supporting emergency response, guiding safety improvements, and enabling more effective decision-making. However, many existing approaches either focus only on prediction accuracy without providing interpretable reasoning or rely heavily on textual patterns without adequately reflecting real-world crash behavior and practical prevention needs. This thesis addresses these limitations by developing an integrated framework for crash severity prediction, explainable risk analysis, and reporting through advanced artificial intelligence techniques. The research combines three complementary studies. The first study investigates automated crash severity assessment using large language models and compares Prompting, Retrieval-Augmented Generation, and domain-adaptive transfer learning. Results show that while general-purpose large language models provide limited predictive performance, retrieval-enhanced methods improve reliability, and specialized fine-tuning achieves the best overall results, reaching 84.1% accuracy and identifying 91.8% of severe crashes while reducing false alarms. The second study extends prediction toward decision support by applying competitive model benchmarking, uncertainty-aware analysis, and aggregated what-if reporting for motorcycle-pedestrian crashes. The optimized deep tabular model demonstrates strong performance, achieving 93.41% accuracy with high severe-case detection, while the what-if analysis identifies recurring high-risk contexts in which changes in crossing provision and junction control yield the greatest reduction in severe injury risk. The third study enhances trustworthiness in text-based severity prediction by incorporating physics-informed fine-tuning into a large language model, guiding the model through a real-world speed-severity relationship. This approach improves predictive accuracy from 84.07% to 87.71% and substantially strengthens consistency under increasing crash risk conditions. Taken together, the findings demonstrate that crash severity prediction can be significantly improved when predictive modeling is combined with domain adaptation, evidence-based what-if reasoning, and physically meaningful guidance. The thesis contributes a unified and explainable AI-driven framework that supports both accurate severity assessment and practical safety reporting, offering valuable potential for deployment in traffic safety systems and for informing targeted road safety interventions.

Item Type: Thesis (Masters)
Subjects: Civil Engineering > Transportation Engineering
Department: College of Design and Built Environment > Civil and Environmental Engineering
Thesis Advisor:
Syed Rahman,
Thesis Committee Members:
Hassan Al-ahmadi, Muhammad Abdullah,
Depositing User: AWS KAFFINI
Date Deposited: 09 Jun 2026 06:05
Last Modified: 09 Jun 2026 06:05
URI: https://eprints.kfupm.edu.sa/id/eprint/144489