SAFE AND AGILE UAV NAVIGATION IN CONFINED AND TIGHT SPACES VIA DEEP REINFORCEMENT LEARNING. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
KFUPM_Thesis_desertation_Ziad_Shoeib.pdf Restricted to Repository staff only until 13 May 2027. Download (20MB) |
Arabic Abstract
يشهد تفتيشُ البنى التحتية المحصورة، مثل مجاري التهوية والأنفاق الخدمية تحت الأرض، اعتمادًا متزايدًا على المركبات الجوية غير المأهولة الصغيرة وتنبع صعوبة هذه المهام من ضرورة الجمع بين رشاقة الطيران والحفاظ على مسافة أمان كافية عن الجدران، في ظل اضطرابات هوائية .(UAVs) معقدة تنشأ من القرب الشديد من الأسطح المحيطة. تقدّم هذه الرسالة إطارًا تعلّميًا يراعي السلامة لملاحة طائرة رباعية المراوح داخل أنفاق دائرية ويرتكز .PyBullet داخل بيئة محاكاة مخصّ صة مبنية على (PPO) ضيقة. وقد دُرِّب هذا الإ طار باستخدام خوارزمية التحسين القريب للسياسات الإ طار على استخدام دالة جزاء سلسة قائمة على حاجز لوغاريتمي لانحراف الطائرة عن خط المركز، مع آلية تعديل ديناميكي للهامش الآمن اعتمادًا دُرِّبت على بيانات ديناميكا الموائع (MLP) ولتحقيق ذلك، استُخدمت شبكة عصبية متعددة الطبقات .(EDL) على مستوى الاضطراب المقدَّر لتضييق الممر الآمن في المقاطع الأكثر تأثرًا بالاضطرابات الهوائية. كما بيّنت النتائج أن تنعيم أفعال السياسة أثناء التدريب (CFD) الحسابية كان ضروريًا للحد من أوامر المحركات المتذبذبة والحادة. وحققت أفضل تهيئة للنظام اجتياز جميع (EMA) باستخدام المتوسط المتحرك الأسي كما انخفضت نسبة التشبع المتزامن للمحركات cm 4.2 مع متوسط انحراف عن خط المركز بلغ m/s 2.23 نقاط الطريق (95/95) بسرعة .0.7% من %84.5 إلى
English Abstract
Small UAVs are increasingly deployed for inspection in confined infrastructure such as ventilation ducts and underground service tunnels, where agile flight must be reconciled with tight clearances and strong proximity-induced aerodynamic disturbances. This thesis develops a learning-based, safety-aware framework for agile quadrotor navigation in narrow circular tunnels, trained with Proximal Policy Optimization (PPO) in a custom PyBullet environment. At its core, the framework couples a smoothed log-barrier centreline penalty with an Estimated Disturbance Level (EDL)-modulated barrier in which a Computational Fluid Dynamics (CFD)-trained Multilayer Perceptron (MLP) dynamically tightens the safe corridor in aerodynamically demanding sections, unifying geometric and aerodynamic safety into a single signal. Training-time Exponential Moving Average (EMA) filtering of the policy’s actions proves essential for suppressing bang-bang motor commands; the resulting flagship configuration completes 95/95 waypoints at 2.23ms−1 with 4.2cm mean centerline deviation, reducing simultaneous motor saturation from 84.5% to 0.7%.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: |
Computer Systems Engineering Aerospace Electrical |
| Department: | College of Engineering and Physics > Control and Instrumentation Engineering |
| Thesis Advisor: |
Muhammad Faizan Mysorewala,
|
| Thesis Committee Members: |
Hassan Almubarak,
Ramy Rashad,
|
| Depositing User: | ZIAD SHOEIB (g202417960) |
| Date Deposited: | 13 May 2026 10:17 |
| Last Modified: | 13 May 2026 10:17 |
| URI: | https://eprints.kfupm.edu.sa/id/eprint/144269 |