Abstract
<jats:p>В последние годы технологии глубокого обучения получили широкое применение в области анализа медицинских изображений, демонстрируя выдающиеся результаты, особенно в задачах сегментации.</jats:p> <jats:p>В связи с проблемой потери семантической информации на этапе извлечения признаков в U‑образных сетях, что ограничивает точность сегментации опухолей прямой кишки, в данной работе на основе архитектуры U‑Net предложена новая модель сегментации, получившая название MGA‑UNet (Multi‑scale Ghost Attention U‑Net). Модель объединяет многомасштабное извлечение признаков, механизмы двойного (канального и пространственного) внимания и блоки управления вниманием (Attention Gate) в пропускных соединениях. Основные улучшения заключаются в следующем:</jats:p> <jats:p>Во‑первых, на этапе кодирования используется усовершенствованный модуль Ghost (интегрированный с RFB) для извлечения и слияния признаков на различных масштабах.</jats:p> <jats:p>Во‑вторых, в путь кодирования внедрён модуль внимания CBAM для усиления отклика сети на малоразмерные целевые объекты.</jats:p> <jats:p>В‑третьих, в пропускные соединения встроены блоки управления вниманием для подавления нерелевантных фоновых областей и выделения характеристик опухоли.</jats:p> <jats:p>Результаты тестирования на наборе КТ‑данных колоректального рака показали высокую эффективность предложенной модели. По сравнению с классическими моделями U‑Net, GhostNet, а также современными архитектурами Mamba‑UNet и U‑SAM, предложенная модель обеспечивает более точную локализацию границ опухоли прямой кишки и демонстрирует превосходное качество сегментации. Эффективность и стабильность каждого модуля подтверждены в ходе абляционных исследований и анализа чувствительности гиперпараметров.</jats:p>