IMMUNE-INSPIRED PREDICTIVE MODELS FOR EMAIL CLASSIFICATION AND SPAM FILTERING

IMMUNE-INSPIRED PREDICTIVE MODELS FOR EMAIL CLASSIFICATION AND SPAM FILTERING. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
Ali_AlHasan_MS_Thesis_214761.pdf

Download (3MB) | Preview

Arabic Abstract

تعد الرسائل ا إ لالكترونية من الوسائل المنتشرة والفعالة للت واصل في وقتنا الحالي على المس توى الشخصي والرسمي. و يتلقى المس تخدمون كثيراً من الرسائل التي تتطلب فرز اً يدوياً لمجلدات مختلفة، كما يتلقون ك م ا هائلًً من الرسائل التي لا طائل منها أ و غير المرغوب فيها والتي تعرف بالبريد المزعج (SPAM) . وتعد هذه القضية من القضايا ا أمنية المهمة التي تتطلب عناية خاصة من المس تخدمين ومديري الش بكات. ولذا تحتوي معظم أ نظمة الرسائل ا إ لالكترونية على أ ليات للحد من هذه المشكلة. إ الا أ نه يلزم اس تحداث طرق لتوائم التطور في ا أنظمة الحديثة. تقوم هذه الدراسة بتحليل فعالية الحلول المتاحة لتصنيف الرسائل ا إ لالكترونية النصية وترش يح غير المرغوب منها. كما تقترح طرقًا لاس تخلًص سمات أ كثر فعالية للتمييز بين الرسائل المختلفة. وعلًوة على ذلك، تقوم ببناء نماذج تصنيف مبنية على خوارزمية مس توحاة من نظم المناعة الطبيعية. كما تقوم بتحليل أ داء النماذج المقترحة ومقارنتها بطرق أ خرى باس تخدام قواعد بيانات ذات خصائص مختلفة. وقد أ ظهرت النتائج فعالية الحل المقترح في تصنيف وترش يح الرسائل ا إ لالكترونية النصية

English Abstract

Electronic messages have become the most popular, frequently-used and powerful medium for communications. However, everyone receives thousands of messages that require manual sorting into different folders. Moreover, one of the major issues and annoying problems in information security domain faced by end-users is receiving a large volume of unwanted messages, also known as spam. Nowadays, most messaging systems have built-in filtering mechanisms that can block or quarantine unwanted messages based on predefined keywords. Over the years, some extensions for these filters have been proposed for improving their performance. However, spamming techniques have also continued to evolve and bypass existing countermeasures. Hence, new solutions and ideas must be explored. This thesis discusses the electronic mail classification and spam filtering problems. It reviews related issues and their impact. It also analyzes techniques used by spammers, and evaluates and compares the most common machine learning paradigms to classify emails and distinguish spam messages. Moreover, in this thesis, we explore a novel and promising methodology inspired by the danger theory of the human immune system to design hybrid approaches for constructing email classifiers and spam filters. Additionally, we study a number of ways to extract and select more relevant features to reduce the complexity and improve the performance. The proposed method is evaluated on a number of benchmark datasets. The results demonstrate that the proposed method is a promising solution for textual email classification and spam filtering.

Item Type: Thesis (Masters)
Subjects: Computer
Systems
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: El-Alfy, El-Sayed
Committee Members: Al-Muhtaseb, Husni and Al-Khatib, Wasfi
Depositing User: ALI AL-HASAN (g200147610)
Date Deposited: 04 Jan 2016 06:38
Last Modified: 01 Nov 2019 16:31
URI: http://eprints.kfupm.edu.sa/id/eprint/139825