Обнаружение и смягчение ложных корреляций в моделях обработки изображений и языка

В мире машинного обучения, особенно в контексте моделей обработки изображений и языка (VLMs), часто возникает проблема ложных корреляций. Эти корреляции могут привести к снижению производительности моделей в реальных условиях, когда они сталкиваются с данными, отличающимися от обучающего набора. В этом обзоре мы рассмотрим методологию RAVL (Region-aware Vision-Language learning), предложенную в статье "Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models" от исследователей Стэнфордского университета.

Введение в RAVL

RAVL представляет собой инновационный подход к улучшению устойчивости VLMs к ложным корреляциям путем их обнаружения и смягчения на уровне локальных характеристик изображения, а не на глобальном уровне. Основные этапы работы RAVL включают:

Обнаружение ложных корреляций: Использование кластеризации на уровне регионов для идентификации точных характеристик изображений, которые способствуют ошибкам классификации.
Смягчение ложных корреляций: Применение новой функции потерь, которая учитывает региональные характеристики, чтобы модель фокусировалась на релевантных областях изображения и игнорировала ложные взаимосвязи.

Этап 1: Обнаружение

Цель: Идентифицировать ложные корреляции между характеристиками изображения и текстовыми атрибутами, которые модель научилась неверно ассоциировать.

Процесс:
- Изображения разбиваются на кандидатные регионы.
- Используя пространство вложений VLM, визуально похожие регионы группируются в кластеры.
- Оценивается влияние каждого кластера на ошибки классификации, чтобы выявить ложные корреляции.

Этап 2: Смягчение

Цель: Уменьшить влияние обнаруженных ложных корреляций на модель.

Процесс:
- Вводится регионально-осведомленная функция потерь, которая поощряет модель к фокусированию на релевантных регионах и игнорированию ложных взаимосвязей.
- Модель дообучается с использованием этой функции потерь, чтобы улучшить её способность к нулевому обучению (zero-shot learning).

Результаты и Эксперименты

Исследование показало, что RAVL значительно улучшает обнаружение и смягчение ложных корреляций:

Улучшение обнаружения: RAVL демонстрирует улучшение на 191% по сравнению с ближайшими аналогами.
Смягчение: Модели, обученные с использованием RAVL, показывают улучшение на 8.2% в точности классификации для наихудших групп изображений.

Качественные Оценки

Общие домены: RAVL успешно идентифицирует ложные корреляции, такие как ассоциация цветов с определенными классами животных.
Медицинские домены: В медицинских изображениях, RAVL обнаруживает ложные корреляции, например, между наличием металлических клипс (которые могут быть на одежде пациента) и диагнозом кардиомегалии.

Заключение

RAVL предлагает новый подход к решению проблемы ложных корреляций в VLMs, который может быть полезен как в общих, так и в специализированных областях, таких как медицинская диагностика. Этот метод не только улучшает производительность моделей, но и делает их более интерпретируемыми и надежными для использования в реальных приложениях.

Таким образом, RAVL является важным шагом вперед в направлении создания более устойчивых и надежных моделей обработки изображений и языка, способных эффективно работать в различных условиях, минимизируя ошибки, вызванные ложными корреляциями.

Статья на arxiv Оригинал pdf features correlation fine-tuning