INSIGHTS INTO GROUNDWATER QUALITY ASSESSMENT IN SAUDI ARABIAN COASTAL AQUIFERS: APPLICATIONS OF GEOSPATIAL MAPPING AND MACHINE LEARNING. Masters thesis, King Fahd University of Petroleum and Minerals.
![]() |
PDF
Abdulhayat Jibrin's Thesis 202303890.pdf Restricted to Repository staff only until 16 June 2026. Download (4MB) |
Arabic Abstract
تُعدّ عملية تقييم جودة المياه الجوفية ضرورية في المناطق القاحلة التي تعاني من ندرة الموارد المائية وتتعرض لمخاطر التدهور الناجم عن تسرب مياه البحر والأنشطة البشرية. يقدم هذا البحث نهجًا متكاملاً لتقييم جودة المياه الجوفية في منطقة القطيف باستخدام تحليل المكونات الرئيسية للنواة (Kernel PCA) و التجميع المكاني القائم على الكثافة مع الكشف عن الضوضاء (DBSCAN). قلّل تحليل المكونات الرئيسية بالنواة من الأبعاد وحسّن الفصل بين المجموعات، وأظهرت النواة متعددة الحدود الأداء الأفضل. حدّدت طريقة التجميع المكاني القائم على الكثافة مع الكشف عن الضوضاء (DBSCAN) المجموعات المكانية والبيانات الشاذة باستخدام المعايير المثلى (eps = 0.05 وminPts = 3)، وكشفت عن مستويات ملوحة مرتفعة ناتجة عن تسرب مياه البحر والاستخراج المفرط. قدّم التوزيع المكاني رؤى واضحة حول المناطق الساخنة لجودة المياه الجوفية. تم تطوير مؤشر جديد لجودة المياه (WQI) مبني على تحليل المكونات الرئيسية بالنواة (Kernel PCA) لتصنيف جودة المياه إلى فئات مثل «سيئة جدًا» و«سيئة» و«متوسطة». شملت النتائج الرئيسية درجات مؤشر جودة المياه (WQI) حيث بلغت 25.51 لفئة «سيئة جدًا»، و46.7 لفئة «سيئة»، و56.75 لفئة «متوسطة»، مما يبرز تأثير الأنشطة البشرية على جودة المياه الجوفية. تم التحقق من صحة مؤشر جودة المياه (WQI) باستخدام دراسة مرجعية في وادي النطرون بمصر، حيث حقق المؤشر نتائج أداء قوية تمثلت في معامل التحديد R² = 0.8938، وخطأ متوسط التربيع MSE = 27.1193، وجذر متوسط مربع الأخطاء RMSE = 5.2076. تؤكد هذه النتائج قدرة مؤشر جودة المياه (WQI) على التعميم وقابليته للتطبيق في ظروف هيدروجيولوجية متنوعة. بالإضافة إلى ذلك، تم توليد بيانات اصطناعية باستخدام نماذج الخليط الغاوسي (GMMs)، حيث تم إنتاج 700 عينة تم التحقق من صحتها باستخدام تباعد جنسن-شانون (Jensen-Shannon Divergence) بقيمة بلغت 0.23. من بين أربعة نماذج للتعلم الآلي (ML)، أظهر نموذج التعزيز المتدرج (Gradient Boosting Machine - GBM) أفضل أداء، حيث حقق أقل قيمة للخطأ النسبي الجذري (rRMSE) بلغت 1.5133%، وأقل قيمة للخطأ النسبي المطلق المتماثل (sMAPE) بلغت 1.9163%. وأوضح تحليل SHAP أن أكثر العوامل تأثيراً على جودة المياه هما تركيز الكلوريد (Cl⁻) والتوصيلية الكهربائية (EC). توفر هذه النتائج والمنهجيات حلولاً قابلة للتوسع لدعم استراتيجيات الإدارة المستدامة للمياه الجوفية.
English Abstract
Groundwater quality (GWQ) assessment is critical in arid regions where water resources are scarce and vulnerable to degradation due to seawater intrusion and anthropogenic activities. This research presents an integrated approach to assess GWQ in Al-Qatif using Kernel Principal Component Analysis (Kernel PCA) and Density-Based Spatial Clustering of Applications with Noise (DBSCAN). Kernel PCA reduced dimensionality and improved cluster separation, with the polynomial kernel showing the best performance. DBSCAN identified spatial clusters and anomalies, using optimal parameters of eps = 0.05 and minPts = 3, revealing high salinity levels due to seawater intrusion and over-extraction. The spatial distribution provided insights into GWQ hotspots. A new Water Quality Index (WQI) based on Kernel PCA was developed to classify water quality into categories such as ‘Very Bad,’ ‘Bad,’ and ‘Medium’. Key findings included WQI scores of 25.51 for ‘Very Bad’, 46.7 for ‘Bad’, and 56.75 for ‘Medium’, highlighting the impacts of anthropogenic activities. The WQI was validated using a reference study in Wadi El-Natrun, Egypt, achieving strong performance metrics: R² = 0.8938, MSE = 27.1193, and RMSE = 5.2076. These results confirm the generalization and scalability of the WQI across diverse hydrogeological conditions. Furthermore, synthetic data was generated using Gaussian Mixture Models (GMMs), producing 700 samples validated by Jensen-Shannon Divergence (0.23). Among four machine learning (ML) models, Gradient Boosting Machine (GBM) performed best with the lowest rRMSE (1.5133%) and sMAPE (1.9163%). SHAP analysis identified chloride (Cl⁻) and electrical conductivity (EC) as the most influential parameters. The findings and approaches offer scalable solutions to support sustainable groundwater management strategies.
Item Type: | Thesis (Masters) |
---|---|
Subjects: | Civil Engineering > Water and Environmental Engineering |
Department: | College of Design and Built Environment > Civil and Environmental Engineering |
Committee Advisor: | Al-suwaiyan, Mohammad |
Committee Co-Advisor: | Yaseen, Zaher |
Committee Members: | Vohra, Muhammad |
Depositing User: | ABDULHAYAT JIBRIN (g202303890) |
Date Deposited: | 16 Jun 2025 12:22 |
Last Modified: | 16 Jun 2025 12:22 |
URI: | http://eprints.kfupm.edu.sa/id/eprint/143531 |