ENHANCED CAMOUFLAGED OBJECT DETECTION USING TRANSFORMER MULTI-SCALE NETWORK. Masters thesis, King Fahd University of Petroleum and Minerals.
|
PDF
Masters_Thesis_Leena_Alghamdi.pdf Restricted to Repository staff only until 28 July 2026. Download (34MB) |
Arabic Abstract
اكتشاف وتحديد الأجسام المموّهة (Camouflaged Object Detection) هي مهمة من مهام رؤية الحاسب (Computer Vision) المعقدة التي تتضن اكتشاف و تحديد الاجسام التي تمتزج بسلاسة مع محيطها بسبب تشابههما العالي في اللون والملمس والحجم. تزداد هذه المهمة تعقيدا عند وجود عوامل مثل الإضاءة المنخفضة والحجب الجزئي للجسم والحجم الصغير للأجسام وأنماط الخلفية المعقدة. تلعب مهمة تحديد الأجسام المموّهة دورا مهما في العديد من التطبيقات عبر مختلف المجالات. وتشمل هذه المجالات المجال العسكري (على سبيل المثال، تحديد موقع الجنود الذين يرتدون زي التمويه العسكري)، والصور الطبية (على سبيل المثال، الكشف عن الأورام)، وإدارة العمليات الزراعية، وعمليات البحث والإنقاذ. بالإضافة إلى ذلك، تساهم هذه المهمة في تطوير العديد من مهام الرؤية الحاسوبية الاخرى، مثل الكشف عن الاجسام الشفافة واكتشاف العيوب الصناعية. على الرغم من وجود العديد من النماذج المقترحة لتطبيق هذه المهمة، إلا أن هذه النماذج لا تزال تفتقر الى الدقة في الكشف عن الأجسام المموّهة في سيناريوهات العالم الحقيقي المعقدة، خصوصا عندما تكون هذه الأجسام صغيرة او متعددة، مما يسلط الضوء على الحاجة إلى مزيد من التحسين لهذه المهمة. في هذه الرسالة، تم اقتراح نموذج متقدم لتعزيز دقة اكتشاف الأجسام المموّهة في مثل هذه المشاهد المعقدة. النموذج المقترح هو عبارة عن شبكة متكررة متعددة الاحجام باسم (MSRNet). يبدأ هذا النموذج باستخراج سمات متعددة الاحجام من الصور المدخلة باستخدام محول الرؤية الهرمي (Pyramid Vision Transformer). بعد ذلك، يقوم النموذج بدمج هذه السمات متعددة الاحجام باستخدام وحدات دمج الاحجام القائمة على الانتباه (Attention-Based Scale Integration Units). ولزيادة الدقة في الكشف عن الاجسام المموّهة، يقوم النموذج بتحسين السمات بشكل متكرر باستخدام وحدات دمج الدقة المتعددة (Multi-Granularity Fusion Units)، والتي تجمع بين تعلم التفاصيل الدقيقة والسياق العام. يتم تقييم النموذج المقترح على أربع مجموعات بيانات مرجعية. كما يتم إجراء تجارب مكثفة لمقارنة النموذج المقترح مع النماذج الحالية المتقدمة.
English Abstract
Camouflaged object detection (COD) is an emerging and challenging computer vision task that involves identifying and segmenting objects that blend seamlessly into their surroundings due to the high similarity in color, texture, and size between the object and its background. This task is further complicated by factors such as low-light conditions, partial occlusion, small object size, and intricate background patterns. COD plays a significant role in applications across diverse domains, including military and defense (e.g., locating soldiers with camouflage uniforms), medical imaging (e.g., tumor detection and lung infection detection), agricultural operations management, and search-and-rescue operations. Additionally, COD contributes to the development of related vision tasks, including transparent object detection and industrial defect detection. Although numerous sophisticated methods have been proposed to address this task, current approaches still struggle to detect camouflaged objects in complex real-world scenarios, particularly when dealing with small and multiple camouflaged objects, highlighting the need for further improvement. In this thesis, an advanced COD model is proposed to enhance the precision of detecting camouflaged objects in such complex scenes. The proposed COD model is a Multi-Scale Recursive Network (MSRNet). MSRNet is a transformer-based network that extracts multi-scale features using a Pyramid Vision Transformer (PVT) backbone and combines these features through specialized Attention-Based Scale Integration Units (ABSIUs). For enhanced object detection, MSRNet utilizes a hierarchical decoder that recursively refines features using Multi-Granularity Fusion Units (MGFUs), which combine local details and global context. The proposed model is evaluated on four benchmark COD datasets. Extensive experiments are conducted to compare the proposed model with the state-of-the-art models.
| Item Type: | Thesis (Masters) |
|---|---|
| Subjects: | Computer |
| Department: | College of Computing and Mathematics > Information and Computer Science |
| Committee Advisor: | Usman, Muhammad |
| Committee Members: | Anwar, Saeed and Alshayeb, Mohammad |
| Depositing User: | LEENA ALGHAMDI (g202213120) |
| Date Deposited: | 28 Jul 2025 10:33 |
| Last Modified: | 28 Jul 2025 10:33 |
| URI: | http://eprints.kfupm.edu.sa/id/eprint/143627 |