COMPARISON OF STOCHASTIC MORTALITY MODELS ENHANCED BY MACHINE LEARNING

COMPARISON OF STOCHASTIC MORTALITY MODELS ENHANCED BY MACHINE LEARNING. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF (g202115230)
MS_THESIS_SI_updated.pdf
Restricted to Repository staff only until 2 June 2025.

Download (3MB)

Arabic Abstract

تُستخدم نماذج الوفيات العشوائية على نطاق واسع في الأدبيات لفحص معدلات الوفيات. باتباع نموذج Lee-Carter (LC)، تم تطوير العديد من الامتدادات، والتي تتضمن ميزات متنوعة لملاءمة دقيقة. تقوم هذه النماذج بتحليل مجموعات البيانات التاريخية لتمييز الاتجاهات والتنبؤ بمعدلات الوفيات المستقبلية. ومع ذلك، فإنها غالبًا ما تناسب مجموعات بيانات الوفيات التاريخية بشكل مستقل لكل جنس. في الآونة الأخيرة، تم تطبيق تقنيات التعلم الآلي لتحسين دقة النماذج من خلال تحديد اتجاهات مجموعة البيانات المخفية التي فشلت نماذج الوفيات في التقاطها. تجري هذه الدراسة تحليلاً مقارنًا لعشرة نماذج شائعة للوفيات العشوائية باستخدام مجموعات البيانات التاريخية من أربعة بلدان متقدمة. تم تحديد ثلاثة نماذج متميزة ودمجها مع تقنيات التعلم الآلي مثل شجرة القرار والغابة العشوائية وتعزيز التدرج. علاوة على ذلك، هناك نهج فريد يناسب نماذج الوفيات لمجموعة بيانات مشتركة لكلا الجنسين، ويدرس تأثير الجنس على معدلات الوفيات باستخدام إطار النموذج غير الخطي المعمم (gnm) لنموذج لي كارتر الذي يتضمن تأثيرات العمر والجنس. تقوم الدراسة بتقييم دقة النموذج باستخدام سبعة مقاييس جودة الملاءمة: دالة الاحتمال، وانحراف بواسون، ومعيار المعلومات المعروف (AIC)، وأخطاء مربع متوسط الجذر (RMSE)، ومعامل التحديد (R2)، ومتوسط الخطأ المطلق (MAE)، و يعني خطأ النسبة المطلقة (MAPE). يؤدي تطبيق التعلم الآلي على نماذج الوفيات العشوائية إلى تحسين الملاءمة وتحديد نقاط الضعف والقوة في النموذج، ويساعد في اختيار النماذج العشوائية المناسبة. وتظهر نتائج مطابقة بيانات الوفيات لكلا الجنسين مجتمعة زيادة في الكفاءة والبخل.

English Abstract

Stochastic mortality models are widely used in literature to examine death rates. Following the Lee-Carter (LC) model, several extensions have been developed, incorporating diverse features for accurate fits. These models analyze historical datasets to discern trends and predict future death rates. However, they often fit historical mortality datasets independently for each gender. Recently, Machine Learning techniques have been applied to improve model accuracy by identifying hidden dataset trends that mortality models have failed to capture. This study conducts a comparative analysis of ten common stochastic mortality models using historical datasets from four developed countries. Three outstanding models are identified and bolstered by Machine Learning techniques such as Decision Tree, Random Forest, and Gradient Boosting. Furthermore, a unique approach fits mortality models to a combined dataset of both genders, examining the influence of gender on death rates using generalized nonlinear model (gnm) framework of the Lee-Carter model that incorporates age-gender effects. The study evaluates model accuracy using seven goodness-of-fit metrics: Likelihood Function, Poisson Deviance, Akaike Information Criterion (AIC), Root Mean Square Errors (RMSE), Coefficient of Determination (R2), Mean Absolute Error (MAE), and Mean Absolute Percentage Error (MAPE). Applying Machine Learning to stochastic mortality models enhances fits, identifies model weaknesses and strengths, and aids in selecting appropriate stochastic models. The results of fitting mortality data for both genders combined demonstrate increased efficiency and parsimony.

Item Type: Thesis (Masters)
Subjects: Computer
Math
Department: College of Computing and Mathematics > Mathematics
Committee Advisor: Mohammad, Hafidz Omar
Committee Members: Jimoh, Olawale Ajadi and Emmanuel, Osita Afuecheta
Depositing User: SULYMAN IYANDA (g202115230)
Date Deposited: 02 Jun 2024 11:04
Last Modified: 02 Jun 2024 11:04
URI: http://eprints.kfupm.edu.sa/id/eprint/142918