UPL-GAT: Unified Protein–Ligand Graph Attention Networks in Virtual Screening. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF (Thesis)
MS_Thesis_Oulaya_Elargab_g202320310_VF.pdf - Accepted Version Restricted to Repository staff only until 19 May 2027. Download (8MB) |
Arabic Abstract
لا يزال التنبؤ الدقيق بتفاعلات البروتين–الربيطة يمثل تحديًا محوريًا في اكتشاف الأدوية المعتمد على البنية، خاصة ًعند وجود عدة أوضاع ارتباط محتملة لنفس الربيطة. تعتمد الأساليب التقليدية عادة ًعلى وضع ارتباط واحد لإجراء التنبؤ، مما يحد من فعاليتها في الحالات التي تتضمن بروتينات مرنة، أو تأثير التلاؤم المستحث، أو نتائج الالتحام غير المؤكدة. وغالبًا ما تفشل هذه التبسيطات في التقاط التباين البنيوي الكامن في سير عمل الفحص الظاهري Screening) (Virtual في الظروف الواقعية. ولمعالجة هذه القيود، نقدم محوِّلًا رسوميًا متعدد الأوضاع Graph (Multipose ،)Transformer حيث نمثل أوضاع الربيطة كبُنى رسومية، ونعالجها باستخدام تمرير رسائل قائم على المحوِّلات لالتقاط كل ٍمن التفاعلات المحلية وبعيدة المدى. ولمحاكاة ظروف الفحص الظاهري الواقعية بشكل أدق، نقوم ببناء مجموعة بيانات من خلال توليد وتنقيح عدة أوضاع التحام لكل ربيطة باستخدام الالتحام المعتمد على الخصائص الفيزيائية. يتيح هذا الإعداد للنموذج التعلم من فرضيات تشكيلية متنوعة بدلًا من الاعتماد على بنية ثابتة واحدة. كما ندمج درجات الالتحام Scores) (Docking ضمن آلية انتباه متعلمة لتحديد الأوضاع الأكثر صلة ًوإفادة ًكجزء من استراتيجية تجميع متعددة الأوضاع. بالإضافة إلى ذلك، نُمكّن النموذج من تحقيق توازن بين المعارف المسبقة المستمدة من الالتحام والتمثيلات الهندسية والكيميائية التي يتعلمها لكل ربيطة من خلال مخطط وزن تكيفي. نُقيّم النموذج على عدة بروتينات ضمن مجموعة ،PCBA ونقارنه بأحدث الأساليب المعتمدة على البنية، بما في ذلك FAST وEGNN وGIGN وEIGN وAKSCORE. تُظهر النتائج أداء ًتنافسيًا قويًا، مع تحقيق تحسينات متسقة مقارنة ًبالأساليب الحالية، لا سيما من حيث .EF1% ونلاحظ بشكل خاص مكاسب ملحوظة في البروتينات المرنة ومتعددة الأنماط.
English Abstract
Accurate prediction of protein–ligand interactions remains a central challenge in structure-based drug discovery, particularly when multiple plausible binding poses exist for a single ligand. Classical approaches typically rely on a single pose for prediction, limiting their effectiveness in scenarios involving flexible proteins, induced fit effects, or uncertain docking outcomes. Such simplifications often fail to capture the structural variability inherent in real-world screening pipelines. To address these limitations, we introduce a multi-pose graph transformer, in which we represent ligand poses as graphs and process them using transformer-based message passing to capture both local and long-range interactions. To better reflect realistic virtual screening conditions, we construct a dataset by generating and curating multiple docking poses per ligand using physics-based docking methods. This setup enables the model to learn from diverse conformational hypotheses rather than relying on a single static structure. We integrate docking scores into a learned attention mechanism to identify the most relevant and informative poses as part of a multi-pose aggregation strategy. An adaptive weighting scheme further enables the model to balance docking-derived priors with learned geometric and chemical representations on a per-ligand basis. We evaluate the model on multiple PCBA targets and compare it with state-of-the-art structure-based approaches, including GIGN, EIGN, EGNN, FAST, and AKSCORE. The results demonstrate strong competitive performance, with consistent improvements over existing methods, particularly in terms of EF1\%. Notably, we observe substantial gains for flexible and multimodal targets.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: |
Computer Research > Information Technology |
| Department: | College of Computing and Mathematics > Information and Computer Science |
| Thesis Advisor: |
Moayad Alnammi,
|
| Thesis Committee Members: |
Moataz Ahmed,
Azzam Alfarraj,
|
| Depositing User: | OULAYA ELARGAB (g202320310) |
| Date Deposited: | 19 May 2026 10:40 |
| Last Modified: | 19 May 2026 10:40 |
| URI: | https://eprints.kfupm.edu.sa/id/eprint/144370 |