MULTI-ROBOT SOCIALLY AWARE NAVIGATION WITH DEEP REINFORCEMENT LEARNING

MULTI-ROBOT SOCIALLY AWARE NAVIGATION WITH DEEP REINFORCEMENT LEARNING. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
IBRAHIM KABIR THESIS REPORT.pdf - Accepted Version
Restricted to Repository staff only until 15 June 2026.

Download (3MB)

Arabic Abstract

وتيرة التقدم السريعة في التكنولوجيا أدّت إلى إدخال الروبوتات، التي كانت تُستخدم سابقًا فقط في المختبرات والمصانع، إلى حياة البشر اليومية للتفاعل في الأماكن المشتركة. وأصبح من الشائع رؤية الروبوتات وهي تتنقل في وجود البشر، ومن المتوقع أن تصبح هذه المشاهد أكثر شيوعًا في السنوات القادمة. وهذا يجعل من الضروري جدًا تطوير أُطر تنقل تُوجّه الروبوتات للتحرك بطرق يمكن اعتبارها غير مُهددة وودّية للبشر، من خلال أخذ العوامل الاجتماعية بعين الاعتبار. كما يجب أن تكون هذه الأطر قادرة على التوسع لتشمل البيئات التي يتواجد فيها عدد كبير من البشر والروبوتات ويتنقلون فيها في الوقت نفسه. يُعرف هذا المجال من البحث عادةً باسم "التنقل الواعي اجتماعيًا"، وهو مجال واعد وسريع التطور في علم الروبوتات. يهدف هذا المجال إلى توجيه حركة الروبوتات داخل البيئات البشرية مع الالتزام بالقواعد الاجتماعية الضمنية التي تحكم عادةً حركة وتفاعل البشر مع بعضهم البعض. وقد مكّن ظهور التعلم العميق المعزز (Deep Reinforcement Learning - DRL) من تطوير سياسات تنقل للروبوتات تراعي هذه الأعراف الاجتماعية مع تحقيق الأهداف المرجوة بكفاءة. يعمل هذا البحث على تطوير إطار تنقل اجتماعي متعدد الروبوتات من خلال نمذجة التفاعلات بين البشر وبعضهم، وبين البشر والروبوتات، وبين الروبوتات وبعضها، في سيناريوهات يتواجد فيها عدد كبير من البشر والروبوتات. تم استخدام نهج التعلم العميق المعزز، كما تم تضمين آلية انتباه لتحديد الأهمية النسبية لكل عامل (إنسان أو روبوت) في عملية التنقل. يُستخدم نهج DRL لتدريب الإطار باستخدام دالة مكافأة توازن بين إتمام المهمة وتجنب الاصطدام والحفاظ على مسافات مريحة من البشر. وقد تم اختبار الإطار المطوّر في سيناريوهات متعددة، وتم تقييم أدائه مقارنةً بأساليب مشابهة باستخدام مؤشرات قياس ذات صلة.

English Abstract

The rapid pace of advancement of technology is bringing robots, which were previously only used in laboratories and factories into the daily lives of humans to interact in shared spaces. The sight of robots navigating in the presence of humans is now a common scene and one that will become much more common in the years to come. This makes it absolutely crucial to develop navigation frameworks that guide robots to move in ways that can be considered non-threatening and friendly to humans, by taking social factors into consideration. Such navigation frameworks must also be able to scale up to environments where multiple number of humans and robots are present and navigating all at once. This field of research is commonly termed socially aware navigation, and it is a promising and rapidly evolving research area in robotics. It guides the motion of robots within human environments while adhering to the implicit social norms that traditionally define the motion and interaction between humans. The advent of Deep Reinforcement Learning (DRL) has enabled the development of navigation policies for robots that incorporate these conventions while effectively reaching their objectives. This work develops a multi-robot socially aware navigation framework by modelling of human-human, human-robot, and robot-robot interactions in scenarios where there are multiple humans and robots. A Deep Reinforcement Learning (DRL) approach is used, and an attention mechanism is used to identify the relative importance of each agent to the navigation process. The DRL approach is used to train the framework with a reward function that balances task completion, collision avoidance, and the maintenance of comfortable distances from humans. The developed framework is tested in multiple scenarios, and its performance is evaluated against similar methods using relevant metrics.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Engineering and Physics > Control and Instrumentation Engineering
Committee Advisor: Mysorewala, Muhammad Faizan
Committee Members: Osais, Yahya E. and Nasir, Ali
Depositing User: IBRAHIM KABIR (g202214320)
Date Deposited: 15 Jun 2025 11:30
Last Modified: 15 Jun 2025 11:30
URI: http://eprints.kfupm.edu.sa/id/eprint/143528