Machine Learning and Hybrid Quantum models for Crash Severity Prediction. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF (Thesis)
Thesis_Draft_Syed_Fayez_Ali_g202419680_.pdf Restricted to Repository staff only until 15 June 2027. Download (8MB) |
Arabic Abstract
تسجل حوادث المرور على الطرق عدة أرواح سنويًا، مما يجعل التنبؤ الدقيق بشدة الحوادث أمرًا أساسيًا لإدارة السلامة بفعالية. وعلى الرغم من فعالية أساليب التعلم الآلي التقليدية الحالية، فإنها تواجه تحديات في نمذجة بيانات الحوادث عالية الأبعاد، وغير الخطية، وغير المتوازنة فئويًا، ولا سيما في حالات الوفيات والإصابات الشديدة. وتبرز هذه التحديات الحاجة إلى نماذج حاسوبية جديدة قادرة على التعامل مع الحجم والتعقيد الكامنين في هندسة النقل. ومن الأساليب الحاسوبية الناشئة التعلم الآلي الكمي (QML)، الذي يقع عند تقاطع الحوسبة الكمية (QC) والتعلم الآلي التقليدي. في هذه الدراسة، نبحث ما إذا كانت أساليب التعلم الآلي الكمي الهجينة، وبالتحديد الشبكات العصبية الكمية (QNNs) وآلات المتجهات الداعمة الكمية (QSVMs)، يمكن أن تقدم تنبؤًا بشدة الحوادث بمستوى تنافسي أو أفضل من الخطوط الأساسية التقليدية، وما إذا كان يمكن جعل قراراتها قابلة للتفسير في تطبيقات السلامة المرورية. وقد أُجريت هذه الدراسة باستخدام مجموعة بيانات مستمدة من قاعدة بيانات حوادث وزارة النقل في المملكة المتحدة. وتمت صياغة مجموعة البيانات إلى متنبئين ثنائيين للحوادث: «شديد» و«غير شديد». وتمت مقارنة ثلاثة تحولات للبيانات في QNN (الزاوية، الأساس، السعة) وعدة متغيرات لنوى QSVM (المُسقطة، نواة دقة الهاملتونيان) على ميزات كامنة ذات ثمانية أبعاد تم تعلمها من مجموعة البيانات الكاملة بواسطة مُشفّر تلقائي تبايني مدعوم بالانتباه (AM-VAE). ثم جرى شرح النماذج المختارة، أي QNN ذو التضمين بالسعة وQSVM ذو دقة الهاملتونيان، على الميزات الكامنة نفسها ذات الثمانية أبعاد، حيث أعطى QNN علاقة غير خطية معقدة بين المتغيرات والمتنبئ، بينما أعطى QSVM اتجاهًا خطيًا. وقد حقق التضمين بالسعة أفضل أداء لـ QNN مع ROC-AUC = 0.713 وPR-AUC = 0.764، في حين حقق QSVM ذو دقة الهاملتونيان ذو 4 كيوبتات ROC-AUC = 0.761 وPR-AUC = 0.7230. كما طابق QSVM الهاملتونيان آلة SVM التقليدية المضبوطة بالمعلمات على ROC-AUC (0.761)، مع تفوقه في الاستدعاء ودرجة F1 ودرجة F2 على 4 كيوبتات. وأظهر ذلك بوضوح أن التمثيل الكامن المضغوط يمكن أن يقلل متطلبات الدوائر الكمية. وقد كشفت تحليلات إضافية للتفسير باستخدام مقابلات مضادة داخل الفضاء الكامن، ثم فك ترميزها إلى متغيرات الحوادث، عن محركات للشدة ذات صلة بالسياسات، بما في ذلك إدارة السرعة، وتصنيف الطريق، والبنية التحتية للمشاة، ومزيج المركبات. وتؤكد هذه النتائج أن التكافؤ بين الأساليب الكمية والتقليدية قابل للتحقق على بيانات الحوادث المنظمة مع الحفاظ على مزايا السلامة المرتبطة بالحساسية، كما تُظهر إطارًا قابلًا لإعادة الإنتاج لدمج التعلم الآلي الكمي، وتعلم التمثيل، وقابلية التفسير في سلامة النقل.
English Abstract
Road traffic crashes claim several lives annually, making accurate crash severity prediction essential for effective safety management. Existing classical machine learning methods, while effective, face challenges in modelling high-dimensional, nonlinear, and class-imbalanced crash data, particularly for fatal and ‘Severe’ outcomes. These challenges highlight the need for new computational paradigms capable of addressing the scale and complexity inherent in transportation engineering. An emerging computation method is Quantum Machine Learning (QML) that sits at the intersection of Quantum Computing (QC) and classical Machine Learning. In this study we investigate whether hybrid QML approaches, specifically Quantum Neural Networks (QNNs) and Quantum Support Vector Machines (QSVMs), can provide competitive or improved crash severity prediction compared to classical baselines, and whether their decisions can be made interpretable for road safety practice. This study was conducted using a dataset derived from the United Kingdom’s department of transport crash dataset. The dataset was formulated into binary crash predictors ‘Severe’ and ‘Non – Severe’. Three QNN data transformations were compared (Angle, Basis, Amplitude) and multiple QSVM kernel variants (projected, Hamiltonian fidelity) on eight-dimensional latent features learned from the full dataset by an attention-enabled Variational Autoencoder (AM-VAE). The shortlisted models were then explained, i.e. Amplitude Embedding QNN and Hamiltonian fidelity QSVM on the same eight-dimensional latent features with QNN giving us a complex non-linear relationship of variables with the predictor and QSVM giving us a linear trend. Amplitude embedding achieved the strongest QNN performance with ROC-AUC = 0.713 and PR-AUC = 0.764, while the 4-qubit Hamiltonian fidelity QSVM reached ROC-AUC = 0.761, and PR-AUC = 0.7230. The Hamiltonian QSVM matched the hyperparameter-tuned classical SVM on ROC-AUC (0.761) while exceeding it on recall, F1, and F2-Score on 4 qubits. This made evident that a compact latent representation can reduce quantum circuit requirements. Further explainability analyses using latent-space counterfactuals decoded into crash variables identified policy-relevant severity drivers including speed management, road classification, pedestrian infrastructure, and vehicle mix. These findings establish that quantum-classical parity is achievable on structured crash data while retaining safety-oriented advantages in sensitivity, and demonstrate a reproducible framework for integrating QML, representation learning, and explainability in transportation safety.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: |
Civil Engineering Civil Engineering > Transportation Engineering |
| Department: | College of Design and Built Environment > Civil and Environmental Engineering |
| Thesis Advisor: |
Syed Rahman,
|
| Thesis Committee Members: |
Hassan Al-ahmadi,
Muhammad Abdullah,
|
| Depositing User: | SYED FAYEZ ALI |
| Date Deposited: | 16 Jun 2026 04:49 |
| Last Modified: | 16 Jun 2026 04:49 |
| URI: | https://eprints.kfupm.edu.sa/id/eprint/144572 |