REAL-TIME ANGER DETECTION IN ARABIC SPEECH DIALOGS

REAL-TIME ANGER DETECTION IN ARABIC SPEECH DIALOGS. Masters thesis, King Fahd University of Petroleum and Minerals.

[img]
Preview
PDF
Thesis.pdf

Download (2MB) | Preview

Arabic Abstract

تعد مشاعر الغضب من المشاعر المهمة والتي يجب الكشف عنها في المحادثات بين الناس في العديد من المجالات؛ على سبيل المثال في شركات الاتصالات والقطاعات المماثلة لقياس مدى رضا العميل عن الخدمات المقدمة من خلال نبرة الصوت. وفي الآونة الأخيرة ظهرت عدة تطبيقات للحاسب الآلي استنادا على نتائج بحثية في مجال كشف الغضب. في هذه الرسالة، قمنا بتصميم إطار آني لاكتشاف مشاعر الغضب في المحادثات العفوية باللغة العربية. كما بنينا مكنز بتصنيف جيد للمشاعر المختلفة في محادثات عربية حقيقية لاستخدامها في تجاربنا العملية. واستخدمنا عملية تقطيع تعتمد على خليط من تقنيتين مختلفتين وهما حساب نهايات الجمل والحساب المحدد بزمن ثابت. ويعتمد التصنيف على استخدام سمات سمعية ملائمة للكشف عن مشاعر الغضب. درسنا عدة سمات سمعية مثل التردد الأساسي ومدّة المحادثة ومعاملات MFCC. وقد أظهرت نتائج التجارب التي أجريناها قدرة "آلة متجه القرار" مقارنة بطرق أخرى على تمييز مشاعر الغضب بنسبة تعرف تصل إلى 82.4%، كما أن عملية التصنيف لا تأخذ وقتاً طويلاً مما يلائم التطبيق الآني لها. وبالإضافة إلى ما سبق، فقد طورنا نظام برمجي آني بالاعتماد على تلك المنظومة المقترحة.

English Abstract

Anger is potentially the most important human emotion to be detected in human-human dialogs, such as those found in call-centers and other similar fields. It measures the satisfaction, or lack of it, of a speaker directly from his or her voice. Recently, many software applications were built as a result of anger detection research work. In this thesis, we design a real-time framework to detect anger from spontaneous Arabic conversations. We construct a well-annotated corpus for anger and neutral emotion states from real-world Arabic speech dialogs for our experiments. We use a hybrid segmentation method of sentence length and fixed-length splitting techniques. The classification is based on acoustic sound features that are more appropriate for anger detection. Many acoustic features will be studied such as the fundamental frequency (f0), formants, energy and mel-frequency cepstral coefficients (MFCCs). Several classifiers are evaluated, and the experimental results show that support vector machine classifiers can yield 82.4% detection rate which is the best accuracy result as compared to other classifiers; in addition to being fast for online recognition. Moreover, a real-time software application is developed based on our proposed framework.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Information and Computer Science
Committee Advisor: Al-Khatib, Wasfi
Committee Members: Cheded, Lahouari and El-Alfy, El-Sayed
Depositing User: ASHRAF ALSHEIKH KHALIL (g200601480)
Date Deposited: 01 Jul 2012 10:22
Last Modified: 01 Nov 2019 15:35
URI: http://eprints.kfupm.edu.sa/id/eprint/138649