ADVANCES IN GLMS: FLEXIBLE APPROACHES FOR DATA CHARACTERIZATION WITH EMPHASIS ON HURDLE AND MULTINOMIAL MODELS

ADVANCES IN GLMS: FLEXIBLE APPROACHES FOR DATA CHARACTERIZATION WITH EMPHASIS ON HURDLE AND MULTINOMIAL MODELS. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF
FINAL THESIS 1.pdf
Restricted to Repository staff only until 15 May 2026.

Download (1MB)

Arabic Abstract

النماذج الخطية المعممة (GLMs) توفر إطارًا مرنًا لنمذجة مجموعة متنوعة من المتغيرات التابعة، من خلال ربطها بالمتغيرات المستقلة باستخدام دوال ربط مناسبة وتوزيعات احتمالية ملائمة. ومع ذلك، فإن فعالية هذه النماذج تعتمد بشكل كبير على التحديد الصحيح للتوزيع الأساسي، خاصة عند التعامل مع بيانات مقيدة أو ذات بنى غير تقليدية. على وجه التحديد، فإن مجموعات البيانات المحصورة ضمن الفاصل (0، 1) غالبًا ما تتطلب استخدام توزيعات وحدوية لتمثيل التباين المعنوي داخل هذا النطاق المحدود بصورة فعالة. وتبرز مشكلة شائعة عند احتواء هذه البيانات على عدد مفرط من القيم الحدية، خصوصًا الأصفار والآحاد، وهي حالات يصعب على النماذج التقليدية التعامل معها بدقة. يتمثل الهدف الرئيسي من هذه الدراسة في تطوير وتطبيق تقنيات نمذجة إحصائية متقدمة ضمن إطار النماذج الخطية المعممة (GLMs)، بهدف تحسين تحليل مجموعات البيانات المعقدة التي تتسم بوجود عدد مفرط من القيم الحدية (صفر وآحاد) أو بعلاقات تصنيفية معتمدة. ولتحقيق هذا الهدف، تقترح الدراسة نموذج هيردل موسع قائم على التوزيعات الوحدوية، بحيث يعالج في الوقت ذاته القيم الحدية الزائدة، مما يُسهم في تحسين ملاءمة النموذج ودقته التنبؤية. بالإضافة إلى ذلك، تم بناء نموذج لوغ-خطي متعدد الحدود لدراسة التعرض للتدخين السلبي بين الأفراد الذين تبلغ أعمارهم 10 سنوات فأكثر في المملكة العربية السعودية. ويقوم هذا النموذج بتحليل العلاقات بين التعرض للتدخين السلبي وعدد من العوامل الاجتماعية والديموغرافية، بما في ذلك مكان التعرض، الفئة العمرية، الجنس، والمنطقة الإدارية. ومن خلال تفسير نسب الأرجحية المستخلصة من النموذج، تقدم الدراسة معلومات حيوية حول أنماط التدخين السلبي، وتدعم تصميم تدخلات وسياسات صحية عامة موجهة. وتؤكد النتائج على ضرورة اعتماد تدخلات مستهدفة في البيئات والفئات السكانية عالية الخطورة، بما يتماشى مع أهداف رؤية المملكة 2030 الرامية إلى تحسين الصحة العامة

English Abstract

Generalized Linear Models (GLMs) offer a flexible framework for modeling a diverse range of response variables by linking them to covariates through suitable link functions and probability distributions. However, their performance is contingent upon correctly specifying the underlying distribution, especially when dealing with bounded or non-standard data structures. In particular, data sets restricted to the unit interval (0, 1) often necessitate the use of unit distributions to effectively capture and model meaningful variability within this bounded range. A common challenge arises when such datasets exhibit an overabundance of boundary values, specifically zeros and ones that conventional models are poorly equipped to handle. This research fundamentally seeks to develop and advance statistical modeling techniques within the framework of Generalized Linear Models (GLMs) to enhance the analysis of complex datasets that exhibit an abundance of boundary values (zeros and ones) or categorical interdependencies. To achieve this, the study proposes an extended hurdle model based on unit distributions that simultaneously accommodates excessive boundary values, thereby improving model fit and predictive accuracy. In addition, a multinomial log-linear model is constructed to examine passive smoking exposure among people aged 10 and older in Saudi Arabia. This model investigates the associations between exposure and various sociodemographic factors, including place of exposure, age group, sex, and administrative region. By interpreting the resulting odds ratios, the study provides critical information on passive smoking patterns and supports the design of targeted public health interventions and policies. The results underscore the need for targeted interventions in high-risk settings and demographics, aligning with Vision 2030's goals for improving health.

Item Type: Thesis (Masters)
Subjects: Math
Department: College of Computing and Mathematics > Mathematics
Committee Advisor: Afuecheta, Emmanuel Osita
Committee Co-Advisor: Barahona Torres, Jesus Igor Heberto
Committee Members: Abbas, Nasir
Depositing User: NAFISA NASIR (g202214640)
Date Deposited: 20 May 2025 05:59
Last Modified: 20 May 2025 05:59
URI: http://eprints.kfupm.edu.sa/id/eprint/143375