REALTIME DISTRIBUTED TIME SERIES ANALYSIS ACROSS MULTIPLE DATA STREAMS

REALTIME DISTRIBUTED TIME SERIES ANALYSIS ACROSS MULTIPLE DATA STREAMS. Masters thesis, King Fahd University of Petroleum and Minerals.

[img] PDF (Masters' Thesis)
final-thesis.pdf - Updated Version
Restricted to Repository staff only until 24 November 2026.

Download (19MB)

Arabic Abstract

ت تةجلاعمىلعةرداققاطنلاةعساووةيروفتاليلحتةيلاملاقاوسأ غتلاةعيرسوةعونتمتانايبتاقفد نممغرلاىلعو.ريّ لاجذامنلانأ ٕ فوريسفتللةلباقةيديلقتلاةيئاصحا ّ ف،ةتباثلاةينمزلالسالسلاعمةلاع ٕ بلاغاهنا لاوةيطخلاريغتايدامتعالاطاقتلايفلشفتاماً ةينمزلاطامنأ لاتانايبيفىدملاةليوط رفوت.تاريغتملاةددعتممهسأ موBiLSTMهاجتالاةيئانثةيبصعلاتاكبشلالثمقيمعلاملعتلابيلاسأ جامدنالالوح لئادبTFTينمزلا فلالغتسانودنمةعفترمبيردتفيلاكتضرفتاهنكل،ىوقأ ّ مغرو.GPUةيموسرلاةجلاعملاتادحوللاع لانأ ـلاةددعتمةمظنأ َ GPUت ِع ُ لاعيرستبد ف،ءادأ ٕ بلاغاهدئاوفنا اماً اعت.دراوملللماكلالالغتسالافعضولاصتالافيلاكتببسبديقتُ لاهذهجل تايدحتلاهذهةحورطأ لابؤبنتللGPUـلاةددعتمةعزومةينبمييقتوميمصتلالخنم اديفتسي.ةقدلاوعسوتلاةيلباقوةعرسلانيبنزاوتلاققحتمهسأ لاصتاتاراسمنمماظنل حم ّ لمععيرستلةتبثملاةركاذلانمو،NVLinkةينقتوNCCLةبتكممادختسابةنس قيقحتلCUDAتاقفدتو،نمازتملاريغذيفنتلاو،لقنلاتاي .يزاوتلا قوفتPyTorchتاقيبطتترهظأ حضاواً طوطخعضومتو،بيردتلاةعرسثيحنمTensorFlowىلعاً عمةنراقملاربعةمراصساسأ لاجذامنلاىوقأ ٕ لاميعنتلاو،Auto-ARIMAو،GARCHو،ARIMAتاريغتمو،SARIMAكلذيفامب،ةيئاصحا و.يسأ جئاتنلاترهظأ نم45يفBiLSTMىلعقوفتTFTجذومننأ زمر50لصأ للاً ققحم،مهسأ ةقداً ةردقوىلعأ لاىلعفرعتلاىلعىوقأ .ةينمزلاطامنأ تدكأ دثيح،ريبكعيرستقيقحتةيلمعلاتامييقتلا ّ ةعرسبةيدرفلاGPUتادحوتبر فعض32وحنبىلعأ 32دنعCPUةيزكرملاةجلاعملاتادحونماً زمر لاتلصونيحيف،اً GPUـلاةددعتمةمظنأ فعض36براقيعيرستىلإ لادنعبساكملاتلءاضت،كلذعمو.اً فيلاكتببسبةريغصلالامحأ لاهذهمدقت،دويقلاهذهىلعبلغتللو.لاصتالاوةنمازملا ةحورطأ ةيلا تاقفدتلليكيمانيدلاقيسنتلا ،)(Dynamic Stream Orchestration ددعيفيكتلكشبئشنتةلودجةيجيتارتسايهو دتلالوحتياذهبو.لمعلاءبعمجحعمبسانتيامبGPUلكلCUDAتاقفدتنماً نمبير ةيلسلستةيلمع اوتمةجلاعمطخىلإ ٍز ُ دقو.GPUـلابعبشم نسحتبراجتلاترهظأ ريبكاً زمر16بيردتققحثيح،اً عيرستاً امم،×6.24غلباً لسسؤي ٕ لايلاعوعسوتلللباقلمعراطا قئافلاةقدلانيبعمجي،ةيلاملاةينمزلالسالسلابؤبنتللءادأ تارارقمعدلةيلمعلاعسوتلاةيلباقوة ةرانتسارثكأ لايفةعرسو .ةثيدحلاةيلامل

English Abstract

The growing complexity of financial markets demands real-time, large-scale analytics capable of processing diverse and rapidly changing data streams. Traditional statistical models, though interpretable and effective for stationary series, often fail to capture non-linear dependencies and long-term temporal patterns in multivariate stock data. Deep learning approaches such as BiLSTM and the Temporal Fusion Transformer TFT provide stronger alternatives but incur high training costs without efficient GPU utilization. Although multi-GPU systems offer acceleration, their benefits are often limited by communication overhead and underutilization. This thesis addresses these challenges by designing and evaluating a distributed multi-GPU architecture for stock prediction that balances speed, scalability, and accuracy. The system leverages optimized communication pathways with NCCL and nvLink, pinned memory for faster transfers, asynchronous execution, and CUDA streams for concurrency. PyTorch implementations consistently outperformed TensorFlow, and rigorous baselines were established against the strongest statistical models, including SARIMA, ARIMA variants, GARCH, Auto-ARIMA, and exponential smoothing. The results demonstrated that TFT outperformed BiLSTM in 45 of 50 stock symbols, achieving higher accuracy and stronger temporal pattern recognition. Performance evaluations confirmed significant acceleration, with single GPUs training 32× faster than CPUs at 32 symbols and multi-GPU configurations reaching 36×. However, gains diminished for smaller workloads due to synchronization and communication overheads. To overcome these limits, this work introduces Dynamic Stream Orchestration, a scheduling strategy that adaptively creates multiple CUDA streams per GPU in proportion to workload size. This transforms training from a sequential process into a parallel, GPU-saturated pipeline. Experiments achieved up to a 2.96× speedup, establishing a scalable and high-performance framework for financial time series prediction that delivers both superior accuracy and practical scalability for modern financial markets.

Item Type: Thesis (Masters)
Subjects: Computer
Department: College of Computing and Mathematics > Computer Engineering
Committee Advisor: Khan, Ayaz H
Committee Members: El-Maleh, Aiman H. and Chaudhry, Muhammad Imran
Depositing User: ABDUSSAMAD ALI (g202215160)
Date Deposited: 24 Nov 2025 07:04
Last Modified: 24 Nov 2025 07:04
URI: http://eprints.kfupm.edu.sa/id/eprint/143754