FINGERPRINTING TOR PROTOCOL NETWORK TRAFFIC

FINGERPRINTING TOR PROTOCOL NETWORK TRAFFIC. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
MS_Thesis.pdf - Submitted Version

Download (8MB) | Preview
[img]
Preview
PDF
MS_Thesis.pdf - Accepted Version

Download (8MB) | Preview

Arabic Abstract

ملخص الرسالة الاسم الكامل: مجدي سعيد محمد ين سلمان عنوان الرسالة: التعرف على حركة بيانات الإرسال لنظام التور التخصص: علوم الحاسب الآلي تاريخ الدرجة العلمية: نوفمبر 2014 آلية التعرف على هوية المواقع الالكترونية هو هجوم إلكتروني على أنظمة إخفاء الهوية التي تؤثر على خصوصية التصفح لمستخدمي الانترنت . عدد من الدراسات والبحوث أستخدمت آلية التعرف على هوية المواقع الالكترونية لمهاجمة مستخدمي الانترنت الذين يستخدمون أنظمة إخفاء الهوية وبالتحديد نظام التور. معظم تلك الدراسات والبحوث أعتمدت في دراساتها على على قاعدة بيانات تم إنشائها بإستخدام متصفح إنترنت وحيد وهو متصفح تور فايرفوكس ( إصدار خاص بنظام التور). في هذه الدراسة تم إنشاء قاعدة بيانات لحركة بيانات الإرسال لعدد من مواقع الانترنت عبر نظام التور بإستخدام عدد من متصفحات المواقع الأكثر شيوعاً في الإستخدام وهي متصفح الفايرفوكس, متصفح الجوجل كروم, متصفح الانترنت إكسبلورور, متصفح الاوبرا, متصفح السفاري وأخير المتصفح الخاص بنظام التور. كما تم إستخدام وتطبيق طريقتين مختلفتين لإستخراج الميزات والسمات من بيانات حركة الإرسال للمواقع وهما طريقة خوارزمية مسافة ليفنشتاين وطريقة تحليل المويجات . تم إستخدام خوارزمية مسافة ليفنشتاين لحساب التشابه بين مجموعتين من بيانات حركة الارسال لنفس الموقع أو موقعين مختلفين وتدريب المصنفات للقيام بالتمييز ومعرفة مدى التشابه في بيانات الحركة للموقعين . كما تم تطبيق عدد من المصنفات على السمات والميزات المستخرجة بطريقة خوارزمية مسافة ليفنشتاين وتم مقارنة نتائج دقة التمييز للمصنفات المستخدمة في الدراسة. كما تم أيضاً تطبيق طريقة جديدة في هذه الدراسة وهي طريقة تحليل المويجات لاستخراج الميزات والسمات من بيانات حركة الارسال للمواقع من قاعدة البيانات المنشئة. طريقة تحليل المويجات تعتمد على إستخراج معاملات التقريب ومعاملات التفاصيل من متسلسلة تضم أحجام مختلفة لحزمة من البيانات لكل موقع إنترنت في قاعدة البيانات. كما تم في هذا العمل عرض النتائج التجريبية الحاصلة من تطبيق الميزات السابقة بإستخدام قاعدة البيانات التي تم تطويرها في هذا العمل وكذلك بإستخدام قاعدة بيانات أخرى متوفرة ( قاعدة بيانات تم إستخدامها في دراسة سابقة). وتعد هذه المرة الأولى - وذلك على حد علمنا - التي تتم فيها إنشاء قاعدة بيانات لدراسة آلية التعرف على هوية المواقع الالكترونية بإستخدام عدد من متصفحات المواقع الأكثر شيوعاً وكذلك تطبيق طريقة تحليل المويجات لإستخراج السمات من بيانات حركة الارسال لمواقع الانترنت التي تمت زيارتها. التجارب التحليلية لهذه الدراسة أظهرت نتائج واعدة يمكن مقارنتها بنتائج الدراسات السابقة , وهذا يؤكد حدسنا الاول بأن طريقة تحليل المويجات يمكن إستخدامها في التعرف على هوية المواقع الالكترونية بالاعتماد على إستخراج السمات من حجم وترتيب حزمة بيانات الارسال للمواقع التي تم زيارتها. كما أن هذه الدراسة أظهرت إختلاف نتائج التعرف على هوية المواقع الالكترونية عند إستخدام متصفحات مختلفة للمواقع.

English Abstract

THESIS ABSTRACT NAME: Majdi Saeed Mohammed Bin Salman TITLE OF STUDY: Fingerprinting Tor Protocol Network Traffic MAJOR FIELD: INFORMATION AND COMPUTER SCIENCE DATE OF DEGREE: November 2014 Website fingerprinting (WF) is an attack on anonymity systems that affects browsing privacy. Many research works in the literature have used website fin- gerprinting to attack internet users with anonymity systems, in particular, Tor protocol. However, most of the fingerprinting attacks on Tor protocol have been studied based on dataset generated by a single web browser namely Firefox (Tor Browser version). In This thesis, a dataset of Tor protocol traffic was collected using the six popular web browsers, namely Firefox, Chrome, Internet Explorer, Opera, Safari and Tor Browser. Two feature extraction methods based on edit distance (ED) and wavelet packet decomposition (WPD) for WF on Tor protocol were investigated. ED algorithm was used to compute the similarity between the Tor traffic instances which is then used to train the classifiers. Different classifiers are applied for our extracted features and the accuracy computed by each classi- xvii fier was compared. A new approach based on WPD was applied to our generated dataset for feature extraction. The WPD was used to extract the approximation and detail coefficients for Tor packet sizes sequence for each website. An empir- ical analysis of applying these features for website fingerprinting using a freely available datasets (Cai dataset) and our datasets has been carried out. To the best of our knowledge, this is the first work in the literature that uses all popu- lar web browsers to collect the datasets and uses wavelet packet decomposition method for extracting the features of Tor traffic packet sequences for the website. The empirical analysis showed promising results which are comparable to similar work in the literature. This confirms our initial intuitions that WPD method is suitable for use with website fingerprinting focusing on packet size, packet order and sequence. Our work also shows the different results of website fingerprinting with respect to the major web browsers.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Zhioua, Sami
Committee Members: Hassan, Md. Rafiul and Azzedin, Farag Ahmed Mohammad
Depositing User: BIN SALMAN MAJDI SAEED MOHAMMED (g201001320)
Date Deposited: 27 Jan 2015 08:15
Last Modified: 01 Nov 2019 15:44
URI: http://eprints.kfupm.edu.sa/id/eprint/139446