Fingerprinting Virtual Private Networks (VPN) Traffic. Masters thesis, King Fahd University of Petroleum and Minerals.
PDF
Kamal_MSc_Thesis_Final_2.1.18.pdf - Accepted Version Restricted to Repository staff only until 26 January 2021. Download (17MB) |
Arabic Abstract
يتواصل الناس مع بعضهم البعض باستخدام مزودي خدمات الإنترنت العامة. يوجد ما يدعى برجل متوسط(Middle man)، مثل مزود الخدمة، حيث لديه القدرة أن ينظر في حركة المرور من خلال أي مستخدم. لذلك فإن هذا هو تحد كبير لمجال الخصوصية. ونتيجة لذلك، فإن الحفاظ على السرية في الإنترنت هو الخطر الرئيسي للعالم الحالي. لتجنب التنص، واستخدام خدمات تعزيز الخصوصية مثل شبكة خاصة افتراضية (VPN), فإنه يتم وضع حركة مرور مشفرة من نوع نهاية إلى نهاية لإخفاء المحتوى والوجهة والتفاصيل من التنصت. وتظهر الاحصاءات الحديثة أن 72٪ من مستخدمي VPN قد استخدمه للوصول إلى المحتوى المحظور. تحتاج الحكومة إلى تحليل حركة المرور المشفرة في شبكات VPN لمراقبة ما إذا كان الناس يستخدمون المحتوى المحظور أم لا. تم فشل تحليل حركة المرور بالطريقة التقليدية وفي هذه الحالة يتم تشفير حركة المرور ويتم إخفاء IP الوجهة من طرف المستخدم. ومع ذلك، فإن البيانات الشرحية للحركة، مثل حجم الرزمة، ووجهة الرزم، وما إلى ذلك، ستعتبر بصمات اكتشاف لأي خدمة ويب معينة. في هذه الأطروحة: (1) قمنا بتحليل خمس شبكات VPN ومعرفة أي خدمة VPN هي أكثر عرضة لطريقة الاكشتاف Cai وآخرون معه في نهج البصمات. وجدنا أن أنواع VPN المفتوحة هي عرضة للكشف بمعدل دقة 72٪. هذا النوع من الشبكات لديه أعلى معدل دقة بالمقارنة مع غيرها من الشبكات الافتراضية الخاصة المدروسة. (2) قدّرنا كفاءة تصنيف حركة المرور على شبكة الإنترنت من خلال VPN لأربعة خدمات ويب مختلفة باستخدام طريقة Cai وآخرون معه. وتظهر النتائج دقة 82٪ تقريبا. (3) قمنا باتباع نهج جديد لاكتشاف البصمات للمواقع باستخدام VPN psiphon باستخدام ثلاثة مصنفات المختلفة. ومن المثير للاهتمام أن النتيجة تظهر دقة عالية جدا من 94.50٪، 96٪ و 97٪ في خوارزميات شجرة القرار (J48)، الشبكة العصبية الاصطناعية (NN) و (K-NN) على التوالي. وعلاوة على ذلك، حققنا مقياس ارتفاع F 0.91، 0.96 و 0.95 في J48، الشبكة العصبية الاصطناعية(NN) وخوارزمية KNN على التوالي. قمنا لاحقاّ بتطبيق التقنيات الإحصائية Kruskal-Wallis لمقارنة المصنفات. أظهرت النتائج أن الفرق بين المصنفين ليس بليغا بمستوى ثقة 95٪.
English Abstract
People communicate with each other by using public internet service providers. A middle man, like the service provider, can look into the traffic of any user. Therefore, this is a great challenge to the field of privacy. As a result, maintaining secrecy in internet is the principal risk of the present world. To avoid eavesdropping, people use privacy enhancing services like virtual private network (VPN). It makes an end to end encrypted traffic to hide the content and destination details from the eavesdropper. A recent statistics shows that, 72% of VPN users use it to access blocked content and to hide identity from government etc. Government needs to analyze the encrypted traffic of VPN to observe whether people are using blocked content or not. Typical traffic analysis fails in this case as traffic is encrypted and destination IP is hidden. In addition, features like, traffic metadata packet size, packet destination, etc. would be considered as fingerprint of any specific web service. In this thesis : (1) we carried out analysis of five VPN services and assessed which VPN service is more vulnerable to Cai et al. fingerprinting approach. We found that Open VPN is vulnerable with 72% accuracy rate. This VPN has the highest accuracy rate as compared to the other studied VPNs. (2) we estimated the efficiency of the web traffic classification through VPN for four different web services with Cai et al. The results show the accuracy is to be about 82%. (3) a new approach for websites fingerprinting for psiphon VPN was developed using three different classifiers. Interestingly, the result shows very high accuracy of 94.50%, 96%, and 97% in Decision tree (J48), Artificial Neural network (NN), and k nearest neighbour (k-NN) algorithm respectively. Moreover, we achieved high F-measure of 0.91, 0.96 and 0.95 in J48, Artificial Neural network and k-NN algorithm respectively. Then we applied Kruskal-wallis statistical techniques to compare the classifiers. The results show that the difference between the classifiers is insignificant with the 95% confidence level.
Item Type: | Thesis (Masters) |
---|---|
Subjects: | Computer |
Department: | College of Computing and Mathematics > Information and Computer Science |
Committee Advisor: | Al Muhammadi, Dr. Sultan |
Committee Members: | Zhioua, Dr. Sami and Hassine, Dr. Jameleddine |
Depositing User: | KHALEQUE KAMAL (g201409480) |
Date Deposited: | 07 Jan 2018 05:39 |
Last Modified: | 01 Nov 2019 16:39 |
URI: | http://eprints.kfupm.edu.sa/id/eprint/140577 |