Adaptive Radio Environment Map Generation for Aerial Networks Using UAV Vision and Reinforcement Learning. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
MSc_Thesis_Raneem_Riad_Attar (13).pdf Restricted to Repository staff only until 6 January 2027. Download (1MB) |
Arabic Abstract
ملخص الرسالة الاسم الكامل: رنيم رياض أحمد عطار عنوان الرسالة: توليد خريطة البيئة الراديوية للشبكات الجوية باستخدام رؤية الطائرة بدون طيار والتعلم المعزز التخصص: هندسه الحاسوب تاريخ الحصول على الدرجة: ديسمبر 2025 .تلعب خرائط البيئة الراديوية دورًا رئيسيًا في فهم وتحسين التغطية اللاسلكية، خصوصًا في البيئات الحضرية يوفر إطار إنشاء خريطة البيئة الراديوية عبر رؤية الطائرة بدون طيار للشبكات الجوية منهجًا مدعومًا بالرؤية لتنبؤ خريطة البيئة الراديوية باستخدام نمذجة عدم اليقين والشبكات العصبية العميقة؛ إلا أنه يعتمد على مخطِّط مسار قائم على خوارزمية ديكسترا، مما يحد من قابلية التكيف والأداء في .مهام القياس باستخدام الطائرات بدون طيار في هذه الرسالة، يتم إعادة إنتاج او اعاده خطوات العمل إنشاء خريطة البيئة الراديوية عبر رؤية الطائرة بدون طيار للشبكات الجوية بالكامل، بما في ذلك عملية توليد البيانات، حيث يتم إنشاء خرائط ارتفاعات المباني وخرائط البيئة الراديوية باستخدام نموذج Walfisch-Ikegami 231 COST. تتمثل مساهمة هذه الرسالة في استبدال مخطِّط المسار القائم على خوارزمية ديكسترا في إطار إنشاء خريطة البيئة الراديوية عبر رؤية الطائرة بدون طيار للشبكات الجوية بمخطط مسار يعتمد على التعلم المعزز باستخدام خوارزمية تحسين السياسه القريبه مع بنية الممثل-الناقد. يعمل وكيل تحسين السياسه القريبه داخل بيئة مخصّصة تمكّن الطائرة بدون طيار من تعديل مسار القياس خطوة بخطوة. بعد إعادة إنتاج سلوك إطار إنشاء خريطة البيئة الراديوية عبر رؤية الطائرة بدون طيار للشبكات الجوية الأصلي، قمنا باستبدال مخطط ديكسترا بخوارزمية تحسين السياسه القريبه، وقارنا بين الطريقتين عبر عدة معايير، بما في ذلك الوقت إلى الدقة. حيث ادركنا أن مخطط تحسين السياسه القريبه حسّن قيمة الوقت الى الدقه من 5.1 ديسيبل/دقيقة إلى 3.2 ديسيبل/دقيقة، مما يعكس تحسنًا بنسبة 3.%53 في مدى فعالية تقليل مقدار الخطا بتوقع لخريطة البيئة الراديوية للشبكات الجوية التي تنشأها الطائرة بدون طيار أثناء الطيران.
English Abstract
Radio Environment Maps (REMs) play a key role in understanding and improving wireless coverage, especially in urban environments. A recent study, called the OREMAN framework, provides a vision assisted approach for REM prediction using uncertainty modeling and deep neural networks; however, it relies on a Dijkstra based trajectory planner, which limits adaptability and performance in UAV measurement tasks. In this thesis, the complete OREMAN pipeline is reproduced, including the data generation process, where building height maps and radio environment maps are generated using the COST 231 Walfisch Ikegami model. The contribution of this thesis is the replacement of OREMAN’s heuristic Dijkstra path planner with a deep reinforcement learning planner based on Proximal Policy Optimization (PPO) with an Actor–Critic architecture. The PPO agent operates within a custom environment that enables the UAV to adapt its measurement trajectory step by step. After reproducing the original OREMAN behavior, we replace its Dijkstra based planner with PPO and compare both methods across several criteria, including Time to Accuracy (TtA). We recognize that the PPO planner increased the TtA from 1.5 dB/min to 2.3 dB/min, reflecting a 53.3% improvement in how effectively the UAV reduces REM RMSE during flight.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: | Computer |
| Department: | College of Computing and Mathematics > Computer Engineering |
| Committee Advisor: | Sheltami, Tarek |
| Committee Members: | Mahmoud, Ashraf and Barnawi, Abdulaziz |
| Depositing User: | RANEEM ATTAR (g202309770) |
| Date Deposited: | 06 Jan 2026 12:23 |
| Last Modified: | 06 Jan 2026 12:23 |
| URI: | http://eprints.kfupm.edu.sa/id/eprint/143991 |