Intelligent Adaptive User Interface using Reinforcement Learning. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
g202315510-Thesis-QurratulAin.pdf Restricted to Repository staff only until 23 December 2026. Download (6MB) |
Arabic Abstract
أصبحت الواجهات التكيفية أكثر أهمية في دعم المستخدمين داخل البيئات الرقمية المعقدة، ومع ذلك لا تزال معظم الأنظمة الحالية تعتمد على قواعد ثابتة لا تستطيع الاستجابة للسلوك المتغير للمستخدمين. ويظهر هذا القصور بوضوح في مجال التقنية المالية، حيث يتبع المستخدمون مسارات سلوكية متنوعة ويحتاجون إلى إرشاد يتكيف مع حالتهم اللحظية. لمعالجة هذه الفجوة، تبحث هذه الأطروحة في كيفية دمج بيانات السلوك البشري مع التعلم التعزيزي غير المتصل لتطوير استراتيجيات تخصيص ذكية وآمنة دون الحاجة إلى أي تفاعل مباشر أثناء التدريب. وبالاعتماد على شهر كامل من سجلات التفاعل المجهولة الهوية والمأخوذة من تطبيق تقني مالي فعلي، تطور الدراسة خط أنابيب نمذجة متكاملاً يحول أحداث المستخدم الخام إلى تسلسلات سلوكية منظمة وتمثيلات عميقة للسلوك. يتم بعد ذلك بناء عملية قرار ماركوف تجريبية باستخدام هذه التمثيلات كحالات، وإجراءات واجهة المستخدم الدلالية كحيز للأفعال، وإشارات مكافأة مشتقة من السلوك المرتبط بالمستثمرين. كما يتم تدريب خوارزمية التعلم التعزيزي المحافظ (Conservative Q-Learning) على أكثر من مليوني انتقال مسجل. ويُظهر النموذج المتعلم توافقاً قوياً مع الأنماط السلوكية عالية القيمة، ويتفوق على خط الأساس العشوائي بمقدار أربعة عشر ضعفاً، مما يثبت أن التعلم التعزيزي غير المتصل قادر على إنتاج توصيات مستقرة وذات أساس سلوكي. وتقدم هذه الأطروحة إطاراً عملياً وقابلاً للتوسع لبناء واجهات مستخدم تكيفية ذكية، وتسهم في مجال التفاعل بين الإنسان والحاسوب من خلال توضيح كيفية استخدام بيانات السلوك الفعلية والتعلم التعزيزي غير المتصل في دعم تصميم واجهات شخصية وواعية بالسياق في تطبيقات التقنية المالية.
English Abstract
Adaptive user interfaces are increasingly important for supporting users in complex digital environments, yet most existing systems still rely on static rules that cannot respond to evolving user behavior. This limitation is especially visible in financial technology, where users follow diverse behavioral paths and require guidance that adapts to their current state. To address this gap, this thesis investigates how behavioral data and Offline Reinforcement Learning can be combined to create safe and intelligent personalization strategies without real time experimentation. Using one month of anonymized interaction logs from a deployed FinTech application, the study develops a complete modeling pipeline that transforms raw user events into structured behavioral sequences and deep behavioral embeddings. An empirical Markov Decision Process is constructed using these embeddings as states, semantic UI actions as the action space, and reward signals derived from investor related behavior. A Conservative Q Learning agent is then trained on more than two million logged transitions. The learned policy aligns strongly with high value behavioral patterns and outperforms random baselines by a factor of fourteen, demonstrating that Offline RL can produce stable and behaviorally grounded recommendations. This thesis provides a practical and scalable framework for intelligent adaptive user interfaces and contributes to HCI by showing how real behavioral data and Offline RL can support personalized, context aware interaction design in FinTech applications.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: | Computer Engineering Research |
| Department: | College of Computing and Mathematics > Information and Computer Science |
| Committee Advisor: | Hammad, Omar |
| Committee Co-Advisor: | Osais, Yahya |
| Committee Members: | Alshayeb, Mohammad |
| Depositing User: | QURRAT UL AIN NAHEED (g202315510) |
| Date Deposited: | 23 Dec 2025 12:13 |
| Last Modified: | 23 Dec 2025 12:13 |
| URI: | http://eprints.kfupm.edu.sa/id/eprint/143849 |