MACHINE LEARNING BASED WATER DISTRIBUTION SYSTEM LEAKAGE TYPE DETERMINATION AND SEVERITY ASSESSMENT. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
AhmadAlnouti_Thesis.pdf Restricted to Repository staff only until 29 May 2026. Download (8MB) |
Arabic Abstract
تتسبب تسربات الأنابيب في أنظمة توزيع المياه (أنظمة توزيع المياه – WDS) في خسائر مائية كبيرة، وارتفاع في التكاليف التشغيلية، وأضرار بيئية، مما يؤدي إلى تفاقم التحديات المتعلقة بندرة المياه. تتناول هذه الأطروحة هذه المشكلات من خلال تطبيق تقنيات التعلم الآلي المتقدم (الذكاء الاصطناعي المعتمد على البيانات) بهدف تصنيف أنواع التسربات تلقائيًا وتقييم مدى حدّتها في أنابيب شبكات توزيع المياه .أظهرت دراسات حديثة الإمكانيات العالية للتقنيات الذكية القائمة على التعلم الآلي في اكتشاف التسربات، حيث حققت نماذج مثل "غابة القرارات العشوائية" و"الشبكات العصبية الالتفافية" دقة مرتفعة غالبًا ما تتجاوز 90٪ في التعرف على التسربات. ومع ذلك، فإن معظم الأبحاث السابقة تعاملت مع التسرب باعتباره حدثًا ثنائياً (يوجد أو لا يوجد) أو ركزت فقط على تحديد موقعه، مما يترك فجوة في القدرة على التمييز بين أوضاع فشل التسرب المختلفة وتقدير شدته. وتهدف هذه الدراسة إلى سد هذه الفجوة. طورت الدراسة إطارًا منهجيًا يعتمد على بيانات متعددة المستشعرات باستخدام مقاييس التسارع (لقياس الاهتزازات)، والهيدروفونات (لالتقاط الصوتيات)، ومحولات الضغط لالتقاط بصمات التسرب في شبكات أنابيب ذات تكوينات متفرعة وحلقية. وقد أُجريت التجارب على منصة اختبار خاضعة للرقابة تحاكي سيناريوهات حقيقية، وشملت ظروفًا متنوعة من معدلات تدفق مختلفة (تدفق مستقر وتدفق متغير) وضوضاء خلفية تم تمثيلها بشكل مصطنع. وتضم قاعدة البيانات الناتجة حالات تشغيل طبيعية (دون تسرب) وأربعة أنواع مختلفة من التسربات: شق طولي، شق دائري، تسرب من الجوان (الكاوتشوك)، وتسرب عبر فتحة، بالإضافة إلى مستويات شدة التسرب المصنفة إلى: طفيف، متوسط، وشديد، اعتمادًا على معدل تدفق التسرب. تم تدريب نماذج تعلم آلي تحت إشراف بشري شملت: نموذج التعزيز المتدرج الشديد (Extreme Gradient Boosting - XGB)، ونموذج غابة القرارات العشوائية، ونموذج التعلّم الخفيف المعزز (LightGBM)، إلى جانب نماذج التعلم العميق مثل الشبكات العصبية المتكررة (RNN)، وشبكات الذاكرة طويلة وقصيرة الأمد (LSTM)، والوحدات التكرارية البوابية (GRU)، وذلك لتقييم أدائها في تصنيف نوع التسرب وشدته. وقد تم تطبيق معالجة مسبقة دقيقة للبيانات شملت إزالة القيم المتطرفة باستخدام نطاق الربيعيات وتطبيع الخصائص بهدف تحسين قدرة النماذج على التعميم. أظهرت النتائج أن تصنيف أنواع التسربات يمكن تحقيقه بدقة عالية جدًا؛ حيث حقق النموذج الأفضل (XGB) دقة موزونة بلغت حوالي 99.9٪ ودرجة F1 بلغت ≈0.99 عند التمييز بين الأنواع الخمسة (بما في ذلك حالة عدم التسرب). أما بالنسبة لتوقع شدة التسرب، فقد تمكن النموذج الأعلى أداءً (LightGBM) من تحقيق دقة إجمالية تقدر بحوالي 93٪ (معامل كابا ≈ 0.85)، وتمكن من التعرف على التسربات الشديدة بنسبة استدعاء ≈97٪، رغم انخفاض دقته في تحديد التسربات الطفيفة. تُظهر هذه النتائج أن النهج متعدد المستشعرات المعتمد على التعلم الآلي قادر على تحديد ليس فقط وجود التسرب، بل أيضًا نوعه وشدته بدقة. كما أظهرت النماذج المدربة أداءً قويًا في كل من تكوينات الشبكات المتفرعة والحلقية. وفضلاً عن ذلك، فإن نتائج التحقق والاختبار كانت متقاربة، مما يشير إلى أن مشكلة الإفراط في التكيف (Overfitting) كانت طفيفة، كما أن النماذج كانت قادرة على التعميم بشكل جيد في ظل ظروف تدفق غير مستقرة وضجيج أجهزة الاستشعار. ومع ذلك، بقيت التسربات الطفيفة هي الأصعب في التصنيف، حيث أنتجت إشارات استشعار تتداخل مع الخلفية الطبيعية، مما أدى إلى بعض حالات التصنيف الخاطئ، ما يبرز الحاجة إلى تحسين خصائص البيانات لزيادة الحساسية. بصورة عامة، يقدم نظام تشخيص التسربات المقترح والقائم على تقنيات الذكاء الاصطناعي أداة فعّالة لمؤسسات المياه لتمكينها من إعطاء الأولوية لإصلاح التسربات الحرجة، وتحسين جدول الصيانة، وتقليل فاقد المياه غير المفوترة. وتسهم هذه الدراسة في تقديم حل قابل للتوسع وذو كفاءة من حيث التكلفة لمراقبة الأنابيب، مما يعزز من استدامة ومرونة شبكات توزيع المياه، ويمهد الطريق لتطويرات مستقبلية في الكشف الذكي عن الأعطال والصيانة التنبؤية.
English Abstract
Pipeline leakages in water distribution systems (WDS) cause substantial water losses, elevated operational costs, and environmental damage, exacerbating water scarcity challenges. This thesis addresses these issues by applying advanced machine learning (ML) techniques to automatically classify leak types and assess leak severity in WDS pipelines. Recent studies have demonstrated the potential of ML-based leak detection, with models like Random Forest and Convolutional Neural Networks achieving high accuracy (often above 90%) in identifying leaks. However, prior work typically treats leakage as a binary event or focuses on localization, leaving a gap in distinguishing specific leak failure modes and quantifying leak severity, which this research aims to fill. This study develops a multi-sensor data-driven framework using accelerometers (vibration), hydrophones (acoustic), and pressure transducers to capture leak signatures in both branched and looped pipeline network configurations. Experiments were conducted on a controlled pipeline testbed under diverse conditions, including varying flow rates (steady and transient flows) and simulated background noise, to emulate real-world scenarios. The acquired dataset encompasses scenarios with no leak (normal operation) and four distinct leak types – longitudinal crack, circumferential crack, gasket leak, and orifice leak – along with leak severity labels of minor, moderate, and severe determined by leak flow rate. Supervised ML classifiers including Extreme Gradient Boosting (XGB), Random Forest, and LightGBM were trained alongside deep learning models (recurrent neural networks, LSTM and GRU) to evaluate their performance in leak type determination and severity classification. Rigorous preprocessing (interquartile range outlier removal and feature normalization) was applied to improve model generalization. The results show that leak type classification can be achieved with very high accuracy: the best model (XGB) attained nearly 99.9% balanced accuracy and an F1-score of ≈0.99 in distinguishing the five leak classes (including the non-leak case). For leak severity prediction, the top-performing model (LightGBM) reached about 93% overall accuracy (κ ≈ 0.85), correctly identifying severe leaks with ≈ 97% recall, although its precision for minor leaks was lower. These findings demonstrate that a multi-sensor ML approach can reliably identify not only the presence of a leak but also the specific leak type and its severity. The trained models maintained robust performance across both branched and looped network layouts. Furthermore, validation and test results were closely aligned, indicating minimal overfitting and strong generalization under transient flow conditions and sensor noise. Notably, minor leaks remained the most challenging to classify: these small leaks often produced sensor signals that overlap with normal background variations, leading to occasional misclassification and indicating the need for further feature refinement to improve sensitivity. Overall, the proposed ML-based leakage diagnosis system enables water utilities to prioritize repairs for critical leaks, optimize maintenance scheduling, and reduce non-revenue water losses. This research contributes a scalable, cost-effective pipeline monitoring solution that enhances the sustainability and resilience of water distribution networks, laying the groundwork for future advancements in intelligent leak detection and predictive maintenance.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: | Civil Engineering > Water and Environmental Engineering Research > Management |
| Department: | College of Design and Built Environment > Civil and Environmental Engineering |
| Committee Advisor: | Yaseen, Zaher Mundher |
| Committee Members: | Al-Suwaiyan, Mohammad Saleh Mohammad and Ahmed, Moataz Aly Kamaleldin |
| Depositing User: | AHMAD ALNOUTI (g202308830) |
| Date Deposited: | 29 Jun 2025 11:03 |
| Last Modified: | 29 Jun 2025 11:03 |
| URI: | http://eprints.kfupm.edu.sa/id/eprint/143514 |