Synthetic Leakage Current Data Generation for Machine Learning-Based Pollution Classification in High Voltage Insulators

Synthetic Leakage Current Data Generation for Machine Learning-Based Pollution Classification in High Voltage Insulators. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
Thesis_Report_Final_v3.pdf - Accepted Version
Restricted to Repository staff only until 5 January 2027.

Download (13MB)

Arabic Abstract

يتسبب التلوث البيئي للعوازل ذات الجهد العالي في ٣٠-٥٠٪ من انقطاعات خطوط النقل، إلا أن مراقبة تيار التسرب القائمة على التعلم الآلي تواجه عوائق كبيرة بسبب محدودية مجموعات البيانات المتاحة لتكوينات الأقراص المتعددة، نظراً لاعتبارات السلامة وارتفاع تكاليف الاختبار. تطور هذه الرسالة إطار عمل قائم على الشبكات التوليدية التنافسية المشروطة (cGAN) لتوليد بيانات تيار تسرب اصطناعية ذات مصداقية إحصائية لتكوينات العوازل غير المختبرة. تم التحقق من صحة الإطار باستخدام بيانات تجريبية من عوازل سيراميكية تحت ثلاثة مستويات من التلوث (عالٍ، متوسط، منخفض) وثلاثة تكوينات (قرص واحد، قرصان، ثلاثة أقراص). تم استخلاص السمات في النطاقين الزمني والترددي، حيث حدد تحليل أهمية السمات أن درجة الحرارة والرطوبة والقيم القصوى ومعدلات عبور الصفر والخصائص الطيفية هي المؤشرات الرئيسية للتلوث. تم تقييم ستة مصنفات، وهي: XGBoost وLightGBM وCatBoost والشبكة العصبية العميقة (DNN) والشبكة العصبية التلافيفية أحادية البعد (1D CNN) والمحول (Transformer)، في سيناريوهين: الحالة الأولى تم التدريب فيها حصرياً على بيانات حقيقية لقرص واحد وقرصين، والحالة الثانية تم تعزيزها ببيانات اصطناعية لثلاثة أقراص. أظهرت البيانات المولدة بواسطة cGAN تطابقاً إحصائياً مع القياسات الحقيقية من خلال مخططات Q-Q ومنحنيات تقدير كثافة النواة (KDE). أدى تعزيز البيانات الاصطناعية إلى القضاء على الانزياح الحاد في المجال، حيث تحسنت دقة الاختبار من ٤٣٫٠٠-٥٩٫١١٪ في الحالة الأولى إلى ٨٩٫٣٣-٩٨٫٨٩٪ في الحالة الثانية، محققاً المحول دقة ٩٨٫٨٩٪ والشبكة العصبية العميقة ٩٨٫٦٧٪. تحسن تصنيف التلوث المتوسط بشكل ملحوظ من استدعاء ٠٫٠٠-١١٫٣٣٪ في الحالة الأولى إلى ٦٨٫٦٧-٩٦٫٦٧٪ في الحالة الثانية، مما يمثل المحرك الرئيسي لتحسين الدقة. انخفضت أخطاء التصنيف بنسبة ٧٧-٩٨٪ عبر جميع النماذج. تؤسس هذه النتائج توليد البيانات الاصطناعية القائم على الشبكات التوليدية التنافسية كحل عملي لمراقبة العوازل القوية المعتمدة على الذكاء الاصطناعي عبر تكوينات تشغيلية متنوعة، مع إمكانية التوسع مستقبلاً لتشمل أنواعاً أخرى من العوازل والقياسات الميدانية المعتمدة على الظروف الجوية.

English Abstract

Environmental contamination of high-voltage insulators causes 30–50% of transmission line outages, yet machine learning-based leakage current monitoring is severely hindered by limited datasets for multi-disc configurations due to safety concerns and high testing costs. This thesis develops a Conditional Generative Adversarial Network (cGAN) framework to generate statistically authentic synthetic leakage current data for untested insulator configurations. The framework was validated using experimental data from ceramic insulators under three contamination levels (high, medium, low) and three configurations (1-disc, 2-disc, 3-disc). Time-domain and frequency-domain features were extracted, with feature importance analysis identifying temperature, humidity, peak values, zero-crossing rates, and spectral characteristics as dominant contamination indicators. Six classifiers, XGBoost, LightGBM, CatBoost, Deep Neural Network (DNN), 1D Convolutional Neural Network (CNN), and Transformer were evaluated under two scenarios: Case 1 trained exclusively on real 1–2 disc data, and Case 2 augmented with synthetic 3-disc data. cGAN-generated data statistically matched real measurements through Q-Q plots and KDE. Synthetic data augmentation eliminated severe domain shift, improving test accuracy from 43.00–59.11% in Case 1 to 89.33–98.89% in Case 2, with Transformer achieving 98.89% and DNN reaching 98.67%. Medium contamination classification improved dramatically from 0.00–11.33% recall in Case 1 to 68.67–96.67% in Case 2, representing the primary accuracy driver. Misclassifications reduced by 77–98% across all models. These findings establish GAN-based synthetic data generation as a practical solution for robust AI-based insulator monitoring across diverse operational configurations, with future extensions to other insulator types and weather-dependent field measurements.

Item Type: Thesis (Masters)
Subjects: Electrical
Department: College of Engineering and Physics > Electrical Engineering
Committee Advisor: Khan, U. A.
Committee Members: Abido, M. A. and Shaik, S. M.
Depositing User: IMRAN ABUBAKAR (g202303350)
Date Deposited: 05 Jan 2026 07:11
Last Modified: 05 Jan 2026 07:11
URI: http://eprints.kfupm.edu.sa/id/eprint/143981