Свежая выжимка ml и AI статей - каждый день
Автоматическая генерация радиологических отчетов (RRG) представляет собой важную задачу в области медицинской информатики, направленную на облегчение работы радиологов через создание точных и информативных текстовых описаний на основе радиологических изображений. В последние годы, благодаря развитию технологий искусственного интеллекта (AI) и, в частности, методам глубокого обучения, были достигнуты значительные успехи в этой области. Однако, существующие методы, которые в основном фокусируются на модификациях архитектуры моделей кодировщика-декодера, сталкиваются с рядом проблем, таких как интеграция мультимодальной информации и снижение влияния шума от несущественных органов.
В данной статье мы представляем фреймворк, названный ORID (Organ-Regional Information Driven), который предлагает новый подход к генерации радиологических отчетов, эффективно интегрируя мультимодальную информацию и минимизируя шум от несущественных органов. ORID основан на модели LLaVA-Med, которая была адаптирована для улучшения способности описания диагнозов на уровне органов, что привело к созданию LLaVA-Med-RRG.
LLaVA-Med-RRG: Это модель, которая была обучена на специально созданном наборе данных инструкций, связанных с RRG, для улучшения описания диагнозов на уровне органов. Этот набор данных включает в себя 10,000 пар вопросов и ответов, связанных с 4,000 радиологических изображений.
Модуль Кросс-Модальной Фьюжн на Основе Органов (OCF): Этот модуль предназначен для эффективного объединения информации из диагностических описаний органов и радиологических изображений. Он использует маски органов для выделения релевантных областей на изображениях и применяет механизмы внимания для объединения текстовой и визуальной информации.
Модуль Анализа Коэффициента Важности Органов (OICA): Чтобы уменьшить влияние шума от несущественных органов, этот модуль использует графовые нейронные сети (GNN) для анализа взаимосвязей между информацией различных органов. Он вычисляет коэффициент важности для каждого органа, что позволяет модели фокусироваться на наиболее значимых областях для генерации отчета.
ORID представляет собой значительный шаг вперед в области генерации радиологических отчетов, предлагая инновационный подход к интеграции и анализу мультимодальной информации. Используя LLaVA-Med-RRG, OCF и OICA, ORID не только улучшает точность и релевантность генерируемых отчетов, но и минимизирует влияние шума от несущественных органов, что делает его потенциально полезным инструментом для радиологов и медицинских учреждений. Эксперименты показали, что ORID достигает новых стандартов производительности на двух общественных бенчмарках, подтверждая его эффективность и потенциал для дальнейшего развития в области медицинской визуализации и диагностики.