Reinforcement Learning and Beamforming Design for Multi-User Multi-Target UAV-enabled ISAC System

Reinforcement Learning and Beamforming Design for Multi-User Multi-Target UAV-enabled ISAC System. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
Final book.pdf - Accepted Version
Restricted to Repository staff only until 25 January 2026.

Download (5MB)

Arabic Abstract

من المتوقع أن تلعب الطائرات بدون طيار دوراً مهماً في أنظمة الاستشعار والاتصالات المتكاملة المستقبلية . ومع ذلك، فإن أداء الاتصالات متعددة المستخدمين مع القيام بمهام الاستشعار متعددة الأهداف في الطائرات المدعومة بدون طيار يعتمد بشكل كبير على موقع الطائرة، وتصميم تشكيل حزم موجات الراديو، ومسار الطيران، وكذلك على نموذجٍ دقيقٍ لقناة الانتشار الراديوي للمشهد/البيئة. في هذه الأطروحة، نقترح نموذجاً غير معقد لنظام الاستشعار والاتصالات المتكامل مدعوم بالطائرات بدون طيار، وندرس أداءه الاتصالي من حيث الكفاءة الطيفية واحتمال انقطاع المعلومات، وأداءه في مجال الاستشعار من حيث كشف الأهداف وتحديد مواقعها وتعقبها، بالإضافة إلى الموازنة بين الاستشعار والاتصالات في ظل قيود الطاقة المحدودة للطائرة. يعتمد النموذج المقترح على نموذج تشكيل حزم موجات الراديو الهجين وتقنية التصفير القسري للحزم، مما يمكّن الطائرة بدون طيار من التواصل مع عدة مستخدمين بالتوازي، مع القدرة على الاستشعار المتزامن للأهداف ذات الاهتمام. نناقش نماذج احتمال وجود خط نظر مباشر بين المرسل و المستلم ونقترح نموذجاً هندسياً معممًا يأخذ بعين الاعتبار زوايا الارتفاع والأفق بين المستخدم والطائرة، بالإضافة إلى عدم انتظام البيئة المحيطة بالمستخدم. كما نقترح نموذجاً للتعلم العميق المُعزَّز بالاعتماد على تحسين السياسة المُقاربة لتخطيط مسار الطائرة، مع الأخذ في الاعتبار معدل فقدان قوة الاشارة و نموذج احتمالية وجود خط نظر مباشر المقترح. بالإضافة إلى ذلك، نقوم بتحسين عوامل النموذج باستخدام طريقة التحسين البايزي. وأخيراً، نحلل سلوك النموذج المُدرَّب في بيئات عشوائية، بضمان عدم تأثّر أداء الاستشعار سلباً بحركة الطائرة.

English Abstract

Unmanned Aerial Vehicles (UAVs) are becoming crucial in future Integrated Sensing and Communication (ISAC) systems, leveraging their unique capabilities in complex environments. The performance of multi-user communications while sensing multi-target in UAV-enabled ISAC systems relies significantly on the UAV position, beamforming design, flight trajectory, and accurate radio propagation channel model for the scene/environment. In this thesis, we investigate the system-level performance for UAV-enabled ISAC systems in terms of main communications and sensing metrics. This includes spectral efficiency, information outage probability, probability of detecting target(s), localization and tracking of target(s), and their associated trade-offs. We further propose a low-complexity hybrid beamforming (HBF) design enabling multi-user aerial communications and sensing of non-stationary targets simultaneously. Due to the unique nature of air-to-ground channels for UAVs in urban areas, we propose a generalized geometrical model to characterize the probability of line-of-sight (LoS) for regular and irregular built-up environments. Moreover, we investigate and propose a deep reinforcement learning (DRL)-based model using the proximal policy optimization (PPO) algorithm to plan UAV trajectory and enhance the overall system performance. Hyperparameters for the DRL-based model are obtained using Bayesian optimization method, and we finally provide a comparative analysis of the UAV trajectory and overall system performance under diverse conditions.

Item Type: Thesis (Masters)
Subjects: Research > Engineering
Electrical
Department: College of Engineering and Physics > Electrical Engineering
Committee Advisor: Al-Dharrab, Suhail
Committee Members: Muqaibel, Ali and Masood, Mudassir
Depositing User: ABDALLA SALIH (g202201220)
Date Deposited: 26 Jan 2025 05:59
Last Modified: 26 Jan 2025 05:59
URI: http://eprints.kfupm.edu.sa/id/eprint/143259