MODELING AND PREDICTING TRAFFIC CRASH SEVERITY USING ARTIFICIAL INTELLIGENCE TECHNIQUES

MODELING AND PREDICTING TRAFFIC CRASH SEVERITY USING ARTIFICIAL INTELLIGENCE TECHNIQUES. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF (thesis)
Umer Thesis Final.pdf - Accepted Version
Restricted to Repository staff only until 10 January 2021.

Download (3MB) | Request a copy

Arabic Abstract

تعتبر حوادث الطرق المرورية من المهددات حول العالم و تأتي في المرتبة الثامنة في الاسباب المؤدية للوفاة طبقاً لتقرير منظمة الصحة العالمية. العديد من ضحايا حوادث الطرق لا يحصلون على التعامل الطبي الأمثل بسبب سوء تقدير شدة إصابتهم في مرحلة مبكرة. التبؤ بخطورة الحادث المروري مفيد لمراكز علاج الحوادث لتقدير الضرر المحتمل الناتج عن الحادث و تقديم العلاج المناسب لحالات الطوارئ. في هذه الدراسة تم اقتراح نموذج ذو طبقتين(two-layer ensemble) للتنبؤ بخطورة حوادث المرور. تضم الطبقة الأولى اربعة نماذج تصنيف اساسية وهي(K Nearest Neighbor) و(Decision Tree) و(AdaBoost) و (Support Vector Machine). الطبقة الثانية تقوم بتصنيف خطورة الحادث باستخدام نموذج الشبكة العصبية الاصطناعية (Artificial Neural Network). تم تطوير النماذج باستخدام بيانات حوادث المرور في بريطانيا العظمى لفترة 6 سنوات (2011-2016) لجميع المواقع بشكل جماعي وللتقاطعات على وجه التحديد. تم بناء النماذج باستخدام خصائص الحادث التي يمكن الحصول عليها بسهولة وبسرعة كمدخلات. تم استخدام أسلوب تحليل المكون الرئيسي (Principal Component Analysis) لتقليل الأبعاد في الطبقة الثانية من النموذج . تم التحقق من صحة النموذج عن طريق مقارنة أداء نموذج(Two-layer Ensemble) بخمسة نماذج أساسية وهي: (K Nearest Neighbor)و (Decision Tree)و (AdaBoost) و (Support Vector Machine) و (Artificial Neural Network). كشفت نتائج التنبؤ أن نموذج (Two-layer Ensemble)يتفوق على نماذج التصنيف الأساسية الخمسة بناءً على مؤشرين للأداء: مؤشر الدقة ومؤشر تقييمF1 . للتحقق من قابلية استخدام النماذج المبنية في أماكن اخرى ، تم إعادة معايرة النماذج واختبارها باستخدام بيانات حوادث حركة المرور لفترة 3 سنوات (2014-2016) من قاعدة بيانات التصادم الوطنية (NCDB) في كندا. أوضح اختبار النماذج لمجموعة البيانات الكندية أن جميع النماذج تؤدي أداءً مشابهاً لأدائها في بيانات بريطانيا العظمى. وخلصت الدراسة أيضًا إلى أنه لا توجد حاجة إلى نماذج منفصلة لتقاطعات الطرق , حيث أن النماذج لجميع المواقع تعمل بشكل أفضل وأكثر دقة في التنبؤ بخطورة التصادم. النماذج المقترحة في هذه الدراسة مفيدة في التنبؤ بخطورة التصادم بدقة عالية استنادًا على خصائص محدودة للحادث المروري. وبالتالي، بناءً على هذه المعلومات، ستكون مراكز الصدمات قادرة على الاستعداد للعلاج الطبي المناسب والسريع.

English Abstract

Road traffic crashes are considered a threat across the globe and are the 8th leading cause of fatality according to World Health Organization (WHO) report. Numerous unfortunate victims in traffic crashes don't get ideal treatment because their injury severity isn't understood at an early stage. Crash severity prediction is beneficial for trauma centers to estimate the potential damage resulting from a traffic crash and provide the appropriate emergency treatment. A two-layer ensemble model is proposed in this study to predict the traffic crash severity. The first layer integrates four basic machine learning classification models: K Nearest Neighbor (KNN), Decision Tree (DT), Adaptive Boosting (AdaBoost), and Support Vector Machine (SVM); the second layer classifies the crash severity based on Artificial Neural Network (ANN) model. The models are developed using Great Britain’s traffic crash data for a 6-year period (2011-2016) for all locations collectively and for road intersections specifically. Only the features which can be easily obtained within no time of a crash are used as an input. To simplify the two-layer ensemble model Principal component analysis (PCA) technique is used for dimensionality reduction in the second layer of the model. In model validation, the performance of the two-layer ensemble model is compared with five base models namely; KNN, DT, AdaBoost, SVM, and ANN model. The prediction results reveal that the ensemble model outperforms the five base classification models based on two performance indicators: accuracy and F1 score. To check the transferability of the developed models, the models are recalibrated and tested using the Traffic crash data for the 3-year period (2014-2016) from the National Collision Database (NCDB) Canada. Model testing for the Canadian dataset reveals that all the models perform in the same line as that for Great Britain. Just like Great Britain’s dataset, the two-layer ensemble model outperforms all the other models in terms of accuracy and F1 score for the Canadian dataset. The study also concluded that there is no need of separate models for road intersections, as the models for all locations perform better and are more robust in predicting crash severity. The proposed ensemble technique would be beneficial in predicting crash severity with high accuracy based on limited initial crash information obtained from the crash location. Thus, based on this information the trauma centers would be able to prepare for suitable and prompt medical treatment.

Item Type: Thesis (Masters)
Subjects: Civil Engineering
Civil Engineering > Transportation Engineering
Divisions: College Of Engineering Sciences > Civil Engineering Dept
Committee Advisor: Ratrout, Nedal
Committee Members: Assi, Khaled and Rahman, Syed
Depositing User: UMER MANSOOR (g201707430)
Date Deposited: 19 Jan 2020 10:51
Last Modified: 19 Jan 2020 10:51
URI: http://eprints.kfupm.edu.sa/id/eprint/141435