AN EXPLAINABLE MACHINE LEARNING FRAMEWORK FOR DRIVER BEHAVIOR CLASSIFICATION

AN EXPLAINABLE MACHINE LEARNING FRAMEWORK FOR DRIVER BEHAVIOR CLASSIFICATION. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
Ahmad Thesis - Signed .pdf - Accepted Version
Restricted to Repository staff only until 23 December 2026.

Download (6MB)

Arabic Abstract

منهجيّة قابلة للتفسير لتصنيف سلوك السائق اعتمادًا على بيانات الهواتف الذكيّة تعمل ضمن خطّ بيانات وتقييم موحَّد يتيح فهم قرارات النماذج وتبريرها. ندمج تدفّقات مقياس التسارع ثلاثيّ المحاور والالتفاف والدوران من مصدرين عامّين ونحوّلها إلى سمات جدولية، ثم نوسِّم القيادة إلى ثلاث فئات بطيئة، عادية، عدوانية باستخدام نوافذ زمنية قصيرة للحفاظ على الديناميات القريبة زمنيًا. وتُنظَّم الدراسة بما يطابق هيكل الرسالة. الجزء الأول (Ensemble Models) يقيم ثلاثة نماذج مختلفة (LightGBM, Extra Trees and Random Forest) بعد ضبطها وتغيير بعض المتغيرات التي بإمكانها تحسين النماذج وتقديم نتائج أفضل، وبعد عدة محاولات وتقييم للنماذج فقد حقق أفضل نموذج وأعلى نتائج، (Extra Trees with Bayesian) حيث كانت دقة نتائج الاختبار 0.72 وقيمةF1 0.734 والتي تربط بين الدقة والإستدعاء وكانت نتائج هذا النموذج قابلة للتفسير وتقييم حركة السائق. الجزء الثاني (Transformer Models) أيضا باستخدام نماذج وضبط المغيرات والمحاولة في تقديم نتائج ذو دقة عالية وتساعد في تحسين النماذج بعد استخدام خوارزميات تعمل على ضبط المتغيرات وتحسين أداءها، حيت حصل (Tab Transformer Model) على أفضل نتائج بدقة اختبار 0.73 وقيمةF1 0.7349 مع القدرة على معرفة وتصنيف حركة السائق العشوائية. الجزء الثالث (TabNet) يعاير نموذجًا عميقًا معتمدًا على الانتباه عبر استراتيجيات تسيطر على النموذج وتحسن من ادائه وقد قدم هذا النموذج نتائج وتفاسير بإمكانها تفسير حركة السائق والتصرفات العشوائية مع تميز ملحوظ في كشف القيادة العدوانية وبعد عدة محاولات في تحسين النموذج وتغيير بعض القيم التي تسيطر على النموذج حصل (TabNet with Bayesian) على أفضل نتائج بدقة اختبار ≈ 0.7306 وF1 ≈ 0.7415 . يُمكّن دمج الذكاء الاصطناعي القابل للتفسير (XAI) في منظومات تصنيف سلوك السائق من تحويل تنبؤات النماذج إلى أدلّة قابلة للفهم والتحقّق تربط القرار بخصائص حركيّة ذات معنى فيزيائي. فعلى مستوى التحليل العالمي والمحلي، تبيّن تقنيّات feature attribution و attention maps كيف تُسهم إشارات tri-axial accelerometer و gyroscopeمثل تذبذبات التسارع الجانبي/الطولي ومعدّل الانعطاف yaw rate) في تصنيف مقاطع القيادة إلى بطيئة أو عادية أو عدوانية عبر نوافذٍ زمنية قصيرة. ويساعد ذلك فرق السلامة والهندسة على التدقيق، وتشخيص الانحياز والانجراف (bias/drift)، ومعايرة عتبات الإنذار والتدخّل، وتفسير حالات الالتباس بين الأنماط المتجاورة (مثل العادي والعدواني). كما يُتيح XAI التخصيص المُعايَر عبر كشف بصمة السائق الحركيّة وتكييف التوصيات أو التنبيهات وفق السياق (الطريق، الازدحام، الطقس)، مع دعم لتوليد شروحات موجّهة للمستخدم أو للمُراجع الفني. بهذه الطريقة لا يقتصر دور XAI على شرح «ماذا قرّر النموذج»، بل يمتدّ إلى لماذا وكيف تتغيّر النتيجة تحت سيناريوهات الحسّاسية، بما يعزّز الثقة والامتثال التنظيمي ويقرّب حلول تحليل حركة السائق وسلوكياته من نشرٍ موثوق وقابل للمراجعة داخل أنظمة النقل الذكية.

English Abstract

This work proposes an explainable framework for smartphone-based driver-behavior classification that unifies three complementary model families within a single, consistent preprocessing and evaluation pipeline. Tri-axial accelerometer and gyroscope streams from two public datasets are fused into tabular features, and behavior is labeled into three classes—slow, normal, and aggressive using short-horizon windowing to preserve recent kinematic dynamics. First, tree-based ensemble models that aggregate multiple decision trees to improve robustness and generalization while remaining comparatively interpretable are benchmarked by evaluating Light Gradient-Boosting Machine (LightGBM), Random Forest, and Extra Trees under identical preprocessing and optimizing their hyperparameters via Puma Optimizer, Snake Optimizer, and Bayesian optimization; the best setting (Extra Trees + Bayesian) achieves accuracy ≈ 0.720, balanced accuracy ≈ 0.719, and weighted-F1 ≈ 0.734. Second, Transformer-based tabular models (FT-Transformer and TabTransformer) are optimized using Equilibrium Optimizer, Puma Optimizer, and Volcano Eruption Algorithm, where the top variant (FT-Transformer + VEA) reaches accuracy ≈ 0.7282 and weighted-F1 ≈ 0.7349, with strong performance for aggressive driving (F1 ≈ 0.8089). Third, TabNet is optimized using Bayesian optimization, Nuclear Reaction Optimizer, and Tasmanian Devil Optimizer, and the best configuration (TabNet + Bayesian) attains accuracy ≈ 0.7306, balanced accuracy ≈ 0.735, and weighted-F1 ≈ 0.7415. Explainable Artificial Intelligence is applied across all families to provide feature- and attention-level explanations global attributions and response curves for ensembles, attention-map analyses for Transformers, and attentive masks for TabNet supporting auditability and trustworthy deployment; explanations consistently emphasize physically meaningful kinematics, including bursts in GyroX and vertical/longitudinal impulses (notably AccZ) during aggressive periods and more balanced acceleration patterns during normal driving.

Item Type: Thesis (Masters)
Subjects: Civil Engineering > Transportation Engineering
Department: College of Design and Built Environment > Civil and Environmental Engineering
Committee Advisor: Rahman, Syed Masiur
Committee Members: Al-Ahmadi, H.M and Shafiullah, MD
Depositing User: AHMAD ALRABABAH (g202321570)
Date Deposited: 23 Dec 2025 11:45
Last Modified: 23 Dec 2025 11:45
URI: http://eprints.kfupm.edu.sa/id/eprint/143839