Misbehavior Detection for Connected Vehicles using Federated Learning

Misbehavior Detection for Connected Vehicles using Federated Learning. Masters thesis, King Fahd University of Petroleum and Minerals.

WarningThere is a more recent version of this item available.
[img] PDF
KFUPM_MSc_Thesis_Muradi_Alotabi.pdf
Restricted to Repository staff only until 5 April 2027.

Download (2MB)

Arabic Abstract

تُعدّ شبكات المركبات اللاسلكية VANETs من المكوّنات الحيوية في أنظمة النقل الذكية، حيث تُمكّن الاتصال التعاوني والفوري بين المركبات، مما يسهم في تحسين السلامة المرورية وكفاءة النقل. ونظرًا لطبيعتها المفتوحة والديناميكية، فإن هذه الشبكات تكون عرضة للسلوكيات الشاذة والهجمات الخبيثة، الأمر الذي يجعل اكتشاف الهجمات بشكل موثوق تحديًا أساسيًا للحفاظ على الثقة والأمان. وعلى الرغم من أن أساليب التعلم المركزي أظهرت أداءً جيدًا في اكتشاف الشذوذ، إلا أنها تواجه تحديات كبيرة تتعلق بخصوصية البيانات، وقابلية التوسع، والاعتمادية عند تطبيقها في البيئات الموزعة الخاصة بشبكات المركبات. تهدف هذه الدراسة إلى استكشاف استخدام التعلم الاتحادي المعروف بـ Learning Federated كإطار لامركزي يحافظ على خصوصية البيانات، من أجل اكتشاف السلوكيات الشاذة وسوء السلوك في شبكات VANETs. وبالاعتماد على مجموعة بيانات سلوك المركبات المرجعي Vehicular Reference Misbehavior - VeReMi، تم صياغة مسألة تصنيف متعددة الفئات لاكتشاف أنواع مختلفة من الهجمات، مع دراسة تأثير توزيعات البيانات المتجانسة (IID) وغير المتجانسة (Non-IID)، واختبار أعداد مختلفة من العملاء (5، 10، 15، و20 عميلًا). وتم اعتماد إعداد التعلم الاتحادي الأفقي، حيث يحتفظ كل عميل ببيانات محلية غير متجانسة مع مشاركة مساحة خصائص مشتركة. تم تقييم نموذجين من نماذج التعلم العميق، وهما الشبكة العصبية متعددة الطبقات (MLP) والشبكة العصبية المتكررة (RNN)، وذلك ضمن إطاري التعلم المركزي والتعلم الاتحادي. أظهرت النتائج التجريبية أن التعلم الاتحادي يتفوق بشكل واضح على التعلم المركزي، خصوصًا في سيناريوهات البيانات غير المتجانسة التي تعكس الواقع العملي لشبكات المركبات. فقد أظهر نموذج MLP أداءً مستقرًا ومتفوقًا عبر جميع إعدادات العملاء، حيث تحسنت قيمة مقياس F1 من 85.47% إلى 89.36% عند استخدام 5 عملاء بتوزيع IID، وبلغت قيم F1 نحو 91.34% و91.88% و91.83% عند استخدام 10 و15 و20 عميلًا بتوزيع Non-IID على التوالي، مع تحقيق دقة تصنيف تجاوزت 91%. في المقابل، حقق التعلم المركزي قيم F1 أقل تراوحت بين 78.23% و88.85%. أما نموذج RNN، فقد حقق تحسنًا محدودًا نسبيًا في مقياس F1 عند تطبيق التعلم الاتحادي عبر جميع إعدادات العملاء، إلا أن الدقة أظهرت انخفاضًا طفيفًا تحت ظروف البيانات غير المتجانسة ومع زيادة عدد العملاء، مما يشير إلى حساسيته لتباين البيانات مقارنةً بنموذج MLP. وبشكل عام، تؤكد نتائج هذه الدراسة أن التعلم الاتحادي يُعد حلًا فعالًا وقابلًا للتوسع لاكتشاف الهجمات في شبكات VANETs، حيث ينجح في التعامل مع البيانات الموزعة وغير المتجانسة مع الحفاظ على خصوصية البيانات. كما تُظهر النتائج أن الجمع بين التعلم الاتحادي ونموذج MLP يمثل الخيار الأكثر متانة واستقرارًا لاكتشاف السلوكيات الشاذة في البيئات الذكية للمركبات

English Abstract

Vehicular Ad-Hoc Networks (VANETs) are a core component of intelligent transportation systems, enabling cooperative and real-time communication among vehicles. Due to their open and dynamic nature, VANETs are vulnerable to anomalous and malicious behaviors, making reliable attack detection essential for safety and trust. While centralized learning approaches have shown strong detection capability, they suffer from limitations related to data privacy, scalability, and robustness when deployed in distributed vehicular environments. This thesis investigates Federated Learning (FL) as a decentralized and privacy-preserving framework for anomaly and misbehavior detection in VANETs. Using the VeReMi dataset, a multi-class classification task is formulated to detect various attack types under both IID and Non-IID data distributions, considering multiple client configurations (5, 10, 15, and 20). A horizontal FL setting is adopted, where each client trains locally on heterogeneous data while sharing a common feature space. Two deep learning models, namely a Multilayer Perceptron (MLP) and a Recurrent Neural Network (RNN), are evaluated under centralized and federated learning paradigms. Experimental results show that FL consistently outperforms centralized learning, particularly under realistic Non-IID conditions. For the MLP model, FL improves the F1-score from 85.47\% to 89.36\% with 5 IID clients, and further achieves F1-scores of 91.34\%, 91.88\%, and 91.83\% with 10, 15, and 20 Non-IID clients, respectively, with corresponding accuracy values exceeding 91\%. In contrast, centralized learning achieves lower F1-scores ranging between 78.23\% and 88.85\%. The RNN model exhibits more modest gains under FL, with F1-score improvements across all client configurations; however, its accuracy shows slight degradation under Non-IID conditions and larger client counts, indicating sensitivity to data heterogeneity. Overall, the results confirm that FL effectively handles decentralized and heterogeneous vehicular data while preserving data privacy, and that MLP-based FL provides the most robust, stable, and scalable solution for anomaly detection in VANETs.

Item Type: Thesis (Masters)
Subjects: Computer
Systems
Research
Research > Information Technology
Research > Engineering
Department: College of Computing and Mathematics > Computer Engineering
Thesis Advisor:
Muhamad Felemban,
Thesis Committee Members:
Abdel-aziz Tabakh, Tarek Sheltami,
Depositing User: MURADI ALOTABI (g202008920)
Date Deposited: 05 Apr 2026 10:23
Last Modified: 05 Apr 2026 10:23
URI: http://eprints.kfupm.edu.sa/id/eprint/144113

Available Versions of this Item