DCCP: Dynamic Core and Contention Partitioning for Optimizing Graph Workload Performance in Multi-Core Systems. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
thesis_201614800.pdf Restricted to Repository staff only until 11 May 2027. Download (3MB) |
Arabic Abstract
في أنظمة المعالجات المتعددة، كفاءة إدارة الذاكرة المؤقتة )كاش( أمر حاسم في تحسن أداء تطبيقات ذات الإعتماد العالة على الذاكرة مثل تطبيقات البيانات والرسوم. هذه التطبيقات تختص بأن لديها طريقة طلب معلومات من الذاكرة غير إعتيادية وتعتمد على المعلومات المطلوبة سابقا، وهذا يستحدث تحديا جليا في إدارة الذاكرة المؤقتة التقليدية. هذه الرسالة تطرح على الساحة طريقة جديدة لإدارة الذاكرة المؤقتة تسمى التقسيم الديناميكي بالأصل والنزاع. هذه الطريقة صممت لإعطاء الموارد بناء على طريقة وصول تطبيقيات البيانات والرسوم حتى تساعدها في تقديم أداء أفضل وتقليل النزاع على الذاكرة المؤقتة. هذه الرسالة تقدم دراسة كاملة عن التقسيم الديناميكي بالأصل والنزاع في بيئة المعالجات المتعددة، ومقارنة أدائها بأداء التقسيم العصري المسمى انتخاب الذاكرة المؤقتة ]1[ وبالأداء الطبيعي وهو المشاركة، ومقارنتها أيضا بالإمكانية القصوى اللتي يمكن لهذه التطبيقيات الوصول إليه. التجارب أقيمت باستخدام المحاكاة المعتمدة على الأ ثر مع استخدام الآ ثار المعيارية للتطبيقات البيانات والرسوم والآ ثار المعيارية للتطبيقات العامة ]2[. تم تقييم أداء كل من طرق الإدارة على مقاييس مفتاحية متضمنة عدد الأوامر المنفذة في الحلقة الواحدة، )السرعة(، نسبة الإصابة في الذاكرة المؤقتة اللتي يتم إدارتها )الدقة(، تأثر مددة انتهاء التطبيقات )العدل(. النتائج بينت أن التقسيم الديناميكي بالإصل والنزاع يحسن الأداء بشكل ملحوظ لتطبيقات البيانات والرسوم، تصل هذه التحسينات في السرعة إلى متوسط بياني بمقدار 1. 349 في سرعة تطبيقات البيانات والرسوم، وهذا تحسين مؤثر جدا )انتخاب الذاكرة لا تحسن أداء هذه التطبيقات(. باللإضاف ةإلى أنها تصل أيضا في التطبيقات الأخرى إلى 1. 039 وهو قريب من تحسينات انتخاب الذاكرة في هذه التطبيقات )هذا في حال كون المعالجات ثمانية(. أيضا الدقة تحسنت بمقدار %28 من التحسن الممكن لهذه التطبيقات وهو تقريبا ضعف تحسين طريقة انتخاب الذاكرة. نعم مع أن تحسينات التقسيم الديناميكي بالأصل والنزاع ليست جذابة في التطبيقات الأخري إلا أنها حافظت على العدل وزادت سرعة التطبيقات الأخى بموتسط بياني مقدار %10 من التحسين الممكن )هذا في حال كون المعالجات أربعة(. وتم اختبار هذه الطريقة لمعرفة قابليتها للتوسع على إعدادات متعددة )معالجين وأربعة وثمانية(، وتبين فيها أنها ما زالت فعالة بزيادة عدد المعالجات. بشكل عام التقسيم الديناميكي بالأصل والنزاع يقدم حلا كفوء وقابل للتوسع في إدارة الذاكرة المؤقتة في أنظمة المعالجات المتعددة وبالأخص للتطبيقات اللتي تستعمل الذاكرة المؤقتة بالطريقة الغير الإعتيادية. طريقة الإدارة المطروحة في هذه الرسالة تمثل اتجاها واعدا لتحسين أداء تطبيقات الرسوم والبيانات بدون التضحية بأداء التطبيقات الأخرى في بيئة المعالجات المتعددة.
English Abstract
In multi-core systems, efficient cache management is crucial for optimizing the per formance of memory-intensive applications, such as graph-based workloads. These applications are characterized by irregular and data-dependent memory access pat terns, which pose significant challenges on traditional cache management techniques. This thesis proposes a new cache partitioning technique, called Dynamic Core and Contention Partitioning (DCCP), which dynamically allocates cache resources based on the memory access patterns of graph workloads, aiming to improve perfor mance while minimizing cache contention. The thesis presents a comprehensive evaluation of DCCP in multi-core environments, comparing its performance with a state-of-the-art cache partitioning technique Cache-Poll [1], the default technique Basic Share, and the maximum potential Max Par titioning. Using a trace-driven simulation framework, experiments were conducted with a combination of GAP benchmark workloads (graph-based applications) and general SPEC CPU 2006 benchmarks (non-graph applications) [2]. The perfor mance of each partitioning technique was evaluated based on key metrics, including performance (IPC), Last-level cache (LLC) hit rate, and fairness (execution time vari ation). The results demonstrate that DCCP significantly improves the performance of graph workloads, achieving a 1.349 geometric mean speedup for graph applications, which is a significant improvement (cachepoll has no improvement). while also achieving 1.039 geometric mean speedup for non-graph applications which is more than cachep oll (in 8-core setup). LLC hit rates with DCCP were 28% of the maximum potential and nearly double that of Cache-Poll. While the performance gains for non-graph workloads were modest, DCCP maintained fairness and made a speedup of 10% of the maximum potential (in 4-core setup). The scalability of DCCP was also tested in larger configurations (2-core, 4-core and 8-core setups), showing that it remains effective as the number of cores and co-running applications increases. Overall, DCCP provides an effective and scalable solution for cache management in multi-core systems, particularly for workloads with irregular memory access patterns. The proposed technique represents a promising direction for improving graph work load performance without sacrificing the speed of non-graph applications in multi-core environments.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: | Computer |
| Department: | College of Computing and Mathematics > Computer Engineering |
| Thesis Advisor: |
Abdulaziz Tabbakh,
|
| Thesis Committee Members: |
Aiman El-maleh,
Mohammad Shinwari,
|
| Depositing User: | ALI ALSHAKHS (g201614800) |
| Date Deposited: | 12 May 2026 11:19 |
| Last Modified: | 12 May 2026 11:19 |
| URI: | https://eprints.kfupm.edu.sa/id/eprint/144215 |