Graph Neural Networks Models for Real Estate Valuation in Saudi Arabia

Graph Neural Networks Models for Real Estate Valuation in Saudi Arabia. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF (Final version of the master thesis submitted to the Department of Mathematics)
Final-Thesis.pdf - Accepted Version
Restricted to Repository staff only until 21 May 2027.

Download (2MB)

Arabic Abstract

تتناول هذه الدراسة تقييم أداء نماذج التعلم الآ لي والشبكات العصبية البيانية في التنبؤ بأسعار العقارات باستخدام بيانات من مدينتي الرياض GraphSAGE. مع نموذج بياني يعتمد على ،CatBoostو XGBoost والمنطقة الشرقية. تم تطبيق إطار تجريبي موحد لمقارنة النماذج الشجرية، مثلأظهرت النتائج تفوق النماذج الشجرية من حيث الدقة والاستقرار عبر مختلف التجارب، في حين أظهر نموذج GraphSAGE أداء ً متغير ً ا يعتمد على حجم البيانات وخصائصها. كما بي ّن تحليل أهمية المتغيرات أن مساحة العقار تُعد العامل الأكثر تأثير ً ا على الأسعار، تليها العوامل المكانية مثل الإحداثيات الجغرافية، في حين يظهر تأثير الحي والمدينة بدرجة أقل. تم كذلك تحليل سلوك البواقي ، حيث اتسمت النماذج الشجرية باستقرار أكبر مقارنة بالنموذج البياني. كما تبين أن تأثير التحويل اللوغاريتمي ليس ثابت ً ا عبر النماذج وقواعد البيانات المختلفة. بشكل عام، تشير النتائج إلى ملاءمة النماذج الشجرية للبيانات الجدولية، في حين قد تستفيد النماذج البيانية من توفر معلومات مكانية وسياقية أكثر ثراء ً

English Abstract

This study investigates the performance of graph neural network models compared with machine learning models for real estate price prediction using datasets from Riyadh and the Eastern Province of Saudi Arabia. A unified experimental framework is applied to compare tree-based models, namely XGBoost and CatBoost, with a graph-based model based on GraphSAGE. The results show that tree-based models consistently achieve strong and stable performance across both datasets, while the GraphSAGE model exhibits more variable behavior depending on dataset size and data characteristics. The analysis further demonstrates that model performance is influenced by feature structure and the availability of relational information. Feature importance analysis shows that area is the most influential factor, followed by spatial coordinates, while district and city have a smaller impact. Residual analysis highlights differences in model stability, with tree-based models showing more consistent error behavior. The effect of logarithmic transformation is also examined, showing that its impact is not consistent across models and datasets. Overall, the findings suggest that tree-based models are well-suited for tabular real estate data, while graph-based approaches may benefit from richer spatial and contextual information.

Item Type: Thesis (Masters)
Subjects: General
Research
Math
Department: College of Computing and Mathematics > Mathematics
Thesis Advisor:
Azzam Alfarraj,
Thesis Committee Members:
Nasir Abbas, Ridwan Sanusi,
Depositing User: FATIMAH ALALI (g202404960)
Date Deposited: 02 Jun 2026 06:24
Last Modified: 02 Jun 2026 06:24
URI: https://eprints.kfupm.edu.sa/id/eprint/144446