KFUPM ePrints

IMMUNE-INSPIRED PREDICTIVE MODELS FOR EMAIL CLASSIFICATION AND SPAM FILTERING

l IMMUNE-INSPIRED PREDICTIVE MODELS FOR EMAIL CLASSIFICATION AND SPAM FILTERING. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]PDF
Restricted to Abstract Only until 03 January 2017.

3552Kb

Arabic Abstract

تعد الرسائل ا إ لالكترونية من الوسائل المنتشرة والفعالة للت واصل في وقتنا الحالي على المس توى الشخصي والرسمي. و يتلقى المس تخدمون كثيراً من الرسائل التي تتطلب فرز اً يدوياً لمجلدات مختلفة، كما يتلقون ك م ا هائلًً من الرسائل التي لا طائل منها أ و غير المرغوب فيها والتي تعرف بالبريد المزعج (SPAM) . وتعد هذه القضية من القضايا ا أمنية المهمة التي تتطلب عناية خاصة من المس تخدمين ومديري الش بكات. ولذا تحتوي معظم أ نظمة الرسائل ا إ لالكترونية على أ ليات للحد من هذه المشكلة. إ الا أ نه يلزم اس تحداث طرق لتوائم التطور في ا أنظمة الحديثة. تقوم هذه الدراسة بتحليل فعالية الحلول المتاحة لتصنيف الرسائل ا إ لالكترونية النصية وترش يح غير المرغوب منها. كما تقترح طرقًا لاس تخلًص سمات أ كثر فعالية للتمييز بين الرسائل المختلفة. وعلًوة على ذلك، تقوم ببناء نماذج تصنيف مبنية على خوارزمية مس توحاة من نظم المناعة الطبيعية. كما تقوم بتحليل أ داء النماذج المقترحة ومقارنتها بطرق أ خرى باس تخدام قواعد بيانات ذات خصائص مختلفة. وقد أ ظهرت النتائج فعالية الحل المقترح في تصنيف وترش يح الرسائل ا إ لالكترونية النصية

English Abstract

Electronic messages have become the most popular, frequently-used and powerful medium for communications. However, everyone receives thousands of messages that require manual sorting into different folders. Moreover, one of the major issues and annoying problems in information security domain faced by end-users is receiving a large volume of unwanted messages, also known as spam. Nowadays, most messaging systems have built-in filtering mechanisms that can block or quarantine unwanted messages based on predefined keywords. Over the years, some extensions for these filters have been proposed for improving their performance. However, spamming techniques have also continued to evolve and bypass existing countermeasures. Hence, new solutions and ideas must be explored. This thesis discusses the electronic mail classification and spam filtering problems. It reviews related issues and their impact. It also analyzes techniques used by spammers, and evaluates and compares the most common machine learning paradigms to classify emails and distinguish spam messages. Moreover, in this thesis, we explore a novel and promising methodology inspired by the danger theory of the human immune system to design hybrid approaches for constructing email classifiers and spam filters. Additionally, we study a number of ways to extract and select more relevant features to reduce the complexity and improve the performance. The proposed method is evaluated on a number of benchmark datasets. The results demonstrate that the proposed method is a promising solution for textual email classification and spam filtering.



Item Type:Thesis (Masters)
Subjects:Computer
Systems
Divisions:College Of Computer Sciences and Engineering > Information and Computer Science Dept
Committee Advisor:El-Alfy, El-Sayed
Committee Members:Al-Muhtaseb, Husni and Al-Khatib, Wasfi
ID Code:139825
Deposited By:ALI AL-HASAN (g200147610)
Deposited On:04 Jan 2016 09:38
Last Modified:04 Jan 2016 09:38

Repository Staff Only: item control page