DATA COMPRESSION OVER SEISMIC SENSOR NETWORKS

DATA COMPRESSION OVER SEISMIC SENSOR NETWORKS. PhD thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF (PhD Thesis Seismic Data Compression Over Seismic Sensor Networks)
thesis_full_page_hilal.pdf - Published Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (7MB) | Preview

Arabic Abstract

عمليات المسح الجيوفيزيائي تنتج كميات كبيرة من البيانات التي يجب ان ترسل بانتظام إلى مركز المعالجة الرئيسي .إن نقل هذه البيانات باستخدام البنية التحتية الحالية يتطلب ذاكرة كبيرة وعمليات حسابية مكثفة. تقترح هذه الأطروحة مجموعة من تقنيات الضغط لتقليل حجم البيانات مع الحفاظ على الجودة بدون خسارة تقريبا. وبشكل أكثر تحديدًا، تتضمن الطرق المطورة في هذه الرسالة ما يلي: تحليل المكون الرئيسي الموزع(DPCA) و ضغط الإشارة الجيوفيزيائية القائمة على نموذج ، والضغط باستخدام التعلم الآلي العميق. لقد تم استخدام الـ PCA تقليديا كأسلوب فعال لتقليل الأبعاد. هنا، يتم إعادة صياغة PCA في إطار موزع بحيث لا تحتاج أجهزة الاستشعار الفردية لنقل أساسها الخاص إلى مركز الدمج. يستخدم كل مستشعر بياناته الخاصة لتحديث إحصاءات من الدرجة الثانية متراكمة من أجهزة الاستشعار السابقة وإرسالها إلى المستشعر التالي في الشبكة. ويقوم مركز الدمج بحساب الأساس العام ويعيد بثه إلى كافة أجهزة الاستشعار الفردية للاستخدام في إسقاط بياناته. يؤدي النهج المقترح إلى انخفاض كبير في كمية البيانات المنقولة عبر الشبكة مقارنةً بـ PCA المحلية. يظهر تحليل النتائج التجريبية باستخدام بيانات مسح جيوفيزيائي حقيقية تحسن نسب الضغط وانخفاض الحمل الحسابي. وعلى النقيض من التقنيات القائمة على التحويل، تم تطوير طريقة تعتمد على نموذج. في هذه الحالة، يتم نمذجة إشارة المسح من مستشعر على أنه تراكب لموجات جيبية متناقصة (EDSWs). يعتبر كل EDSW مكونًا في النموذج ويتم تمثيله بواسطة معلمات قليلة. يتم تقدير هذه المعلمات باستخدام خوارزمية تجسيم سرب الجسيمات (PSO) على أساس كل اشارة على حدة حتى يتحقق مستوى معين من الدقة (الطاقة المتبقية). وبمجرد أن يتم تقدير كل المعلمات، يتم نقلها بدلاً من بيانات اشارة المسح، وبالتالي يتم تحقيق نسبة ضغط عالية. ولتحقيق الضغط بدون فقدان معلومات، يتم ترميز المتبقي من الاشارة باستخدام ترقيم بكلمة ترميز ثابتة. ولكن، يؤدي استخدام ترتيب عالي للنموذج واستخدام PSO إلى زيادة التعقيد الحسابي. في الآونة الأخيرة ، اكتسبت الشبكات العصبية العميقة , (DNN) الكثير من الشعبية على تطبيقات متنوعة. هنا، يتم تطوير نظام ضغط بيانات المسح الجيوفيزيائي باستخدام نموذج DNN. يتم تدريب DNN باستخدام خوارزمية آلة بولتزمان التقليدية المقيدة (RBM). تم تقييم مشبكات DNN المختلفة للحصول على التكوين المناسب للتطبيق الحالي. DNN قادرة على تحقيق نسبة ضغط محددة مسبقا عن طريق اختيار عدد الوحدات في الطبقة الوسطى المخفية (طبقة الكود). لمزيد من تحسين وقت تدريب DNN، تم تقديم آلة التعلم المتطرفة (ELM) بدلاً منRBM . علاوة على ذلك ، تعمل ELM أيضًا على تحسين وثوقية DNN دون المساس بجودة إشارة المسح الجيوفيزيائية التي أعيد بناؤها. تتم مقارنة أداء الطرق المطورة في هذه الاطروحة مع العديد من التقنيات الكلاسيكية بما في ذلك تحويل كوسين المنفصل (DCT) والنماذج الخطية للتشفير.(LPC) استخدمت كل من بيانات المسح الصطناعية والحقيقية للتحقق من صحة النتائج التي تم الحصول عليها. تظهر الطرق المطورة انها تحقق جودة أفضل للإشارات المستردة مع نسب ضغط أعلى من الطرق المقارنة.

English Abstract

Seismic surveys produce substantial amounts of data. Such data needs to be sent regularly to main processing center. The transmission of this data using current infrastructure is space and computation intensive. This thesis proposes a suit of compression techniques to reduce the data volume while maintaining near lossless quality. More specifically, the approaches developed in this thesis include: Distributed Principal Component Analysis (DPCA), model based seismic signal compression, and deep machine learning. PCA has traditionally been used as a robust dimension reduction technique. Here, PCA is reformulated under a distributed framework, in which the individual sensors do not need to transmit their own basis to the fusion center. Each sensor uses its own data to update the second order statistics accumulated from previous sensors and forward these to the next sensor in the network. The fusion center estimates the global basis and broadcasts them back to the individual sensors for projection. The proposed approach results in substantial reduction in data transmission across the network as compared to the local PCA. The analysis of experimental results using real seismic data show improved compression ratios and reduced computational load. In contrast to transform based techniques, a model based approach is developed. In this case, a seismic trace is modeled as a superposition of Exponentially Decaying Sinusoidal Waves (EDSWs). Each EDSW is considered as a component in the model and is represented by few parameters. These parameters are estimated using a Particle Swarm Optimization (PSO) algorithm on a component-by-component basis until a certain level of significance (residual energy) is achieved. Once all the parameters are estimated, they are transmitted instead of the trace data, thus achieving a high compression ratio. To achieve near lossless compression, the residuals are encoded using fixed length code-word scalar quantization. However, high order of the model and the use of PSO lead to increased computational complexity. In recent times, deep neural networks (DNN) have gained a lot of popularity over diverse applications. Here, a seismic data compression scheme is developed using a DNN model. The DNN is trained using the traditional Restricted Boltzmann machine (RBM) algorithm. Different DNN architectures were evaluated to obtain an appropriate configuration for the application of interest. DNN is capable of achieving a predetermined compression ratio by selecting the number of units in the middle hidden layer (code layer). To further improve the training time of the DNN, Extreme Learning Machine (ELM) is introduced instead of RBM. Furthermore, ELM also improves the robustness of the DNN without compromising the quality of the reconstructed traces. The performances of the developed approaches are compared with several classical techniques including Discrete Cosine Transform (DCT) and the Linear Predictive Coding (LPC) models. Both synthetic and real seismic data sets were used to validate the obtained results. The developed approaches are shown to achieve better reconstruction quality with higher compression ratios than comparative methods.

Item Type: Thesis (PhD)
Subjects: Electrical
Department: College Of Engineering Sciences > Electrical Engineering Dept
Committee Advisor: Mohandes, Mohamed
Committee Members: Fekri, Faramarz and Zerguine, Azzedine and Al-Shuhail, Abdullatif
Depositing User: HILAL NUHA (g201309210)
Date Deposited: 29 Apr 2019 10:41
Last Modified: 30 Dec 2020 12:13
URI: https://eprints.kfupm.edu.sa/id/eprint/140939