BACKDOOR ATTACK DETECTION IN FEDERATED LEARNING. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
Ekhlas_Thesis_202301610.pdf Restricted to Repository staff only until 12 March 2027. Download (6MB) |
Arabic Abstract
تُشكّل هجمات الأبواب الخلفية في التعلم الموحد تهديدًا كبيرًا لموثوقية النماذج الموزعة، لا سيما في ظل البيانات غير متطابقة التوزيع (non-IID) وارتفاع نسبة المهاجمين. يُعدّ FilterFL نظام دفاع حديث يعمل في الخادم و يعتمد على شبكتين توليديتين تنافسيتين شرطيتين (CGANs) لتوليد عينات تستخدم للكشف عن نماذج العملاء الخبيثة، مما يُغني عن الحاجة إلى بيانات نظيفة على الخادم. مع ذلك، فإن اعتماده على تشغيل الشبكتين في كل جولة اتصال يُؤدي إلى تكلفة حسابية عالية، ويُحدّ من جدواه في جولات التدريب الطويلة أو في بيئات واسعة النطاق. تُركّز هذه الأطروحة على تحسين نظام الدفاع FilterFL من خلال جدولة تشغيل الشبكات التوليدية التنافسية بالإضافة إلى آلية سجل الثقة، مع الحفاظ على دقة المهمة الرئيسية واكتشاف الأبواب الخلفية بأكبر قدر ممكن. تُظهر النتائج المُستخلصة من مجموعات بيانات MNIST وCIFAR-10 وGTSRB أن الطريقة المُحسّنة تُقلل من عبء الحوسبة على الخادم بنسبة ٨٠% تقريبًا، مع الحفاظ على دقة المهمة الرئيسية ضمن هامش مقبول (أقل من ٤% في أصعب حالات عدم التطابق والتوزيع المتساوي). في الوقت نفسه، ينخفض معدل نجاح الهجوم بشكل ملحوظ، حيث تصل التحسينات إلى انخفاض بنسبة ٩٧% تقريبًا مقارنةً بنظام الدفاع الأصلي. كما يظل النظام الدفاعي المُحسَّن مستقرًا في بيئات البيانات غير متطابقة التوزيع (non-IID) وحتى مع ارتفاع نسبة المُهاجمين، حيث يُصبح نظام الدفاع الأصلي ضعيفًا. وقد أثبت الدفاع المُحسَّن أنه يُوفر حلاً أكثر عملية وقوة للكشف عن الثغرات الخلفية في التعلم المُوحَّد، خاصةً عند محدودية وقت التدريب والموارد.
English Abstract
Backdoor attacks in Federated Learning (FL) introduce a significant threat to the reliability of distributed models, particularly under non-identically distributed (non-IID) data and high attacker ratios. Recently, several papers have addressed backdoor attacks on FL. For example, FilterFL proposed a server-side defence that leverages two Conditional Generative Adversarial Networks (CGANs) to generate validation samples and detect malicious client models, eliminating the need for clean data on the server. However, its reliance on running both GANs in every communication round results in a high computational cost and limits its practicality in either long training rounds or large-scale settings. In this thesis, we focus on optimizing FilterFL by introducing scheduled GAN execution and a trust-history mechanism, while preserving the main task's accuracy and backdoor detection as effectively as possible. The experimental results using MNIST, CIFAR-10, and GTSRB datasets demonstrate that the optimized method can reduce the server computation overhead by approximately 80% while maintaining main task accuracy within a small acceptable drop (less than 4% in the most challenging non-IID cases). At the same time, the attack success rate is significantly reduced, with improvements reaching approximately a 97% decrease compared to the original baseline. The optimized FilterFL also remains stable under non-IID settings and high attacker ratios, where the original FilterFL becomes weak. The optimized framework has been proven to provide a more practical and robust solution for backdoor detection in federated learning, especially when limited training time and resources are concerns.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: |
Computer Systems Engineering |
| Department: | College of Computing and Mathematics > Computer Engineering |
| Committee Advisor: |
Muhamad Felemban,
|
| Committee Members: |
Sajjad Mahmood,
Abdulaziz Barnawi,
|
| Depositing User: | EKHLAS ZAID (g202301610) |
| Date Deposited: | 12 Mar 2026 07:39 |
| Last Modified: | 12 Mar 2026 07:39 |
| URI: | http://eprints.kfupm.edu.sa/id/eprint/144082 |