Исследование возможностей LLM: Тест на невозможное

В последние годы наблюдается стремительный рост в области разработки искусственного интеллекта (AI), особенно в направлении создания моделей большого языка (LLM), способных обрабатывать и генерировать текст на уровне, близком к человеческому. Однако, несмотря на эти достижения, остается важный вопрос: могут ли эти модели распознавать пределы собственных знаний и признавать, когда ответ на вопрос неизвестен или невозможен? Именно эту проблему решает исследование, проведенное Дэвидом А. Невером и Форрестом Г. МакКи из компании PeopleTec, Inc.

Концепция теста на невозможное

Исследование представляет собой новаторскую оценочную платформу, призванную оценить способность LLM признавать неопределенность и невозможность решения определенных задач. Для этого был создан уникальный набор данных, состоящий из 675 задач, которые на данный момент считаются неразрешимыми или не имеющими известного решения. Эти задачи охватывают широкий спектр дисциплин, от биологии до философии и математики.

Методология исследования

Исследование включало в себя:

Создание набора данных: Были собраны и классифицированы задачи, которые либо не имеют решения в настоящее время, либо по своей природе неразрешимы. Эти задачи были структурированы в виде вопросов, на которые единственным правильным ответом является признание невозможности решения.
Оценка моделей: Было оценено двенадцать современных LLM, включая как открытые, так и закрытые модели. Модели тестировались на их склонность признавать собственную неопределенность, а не генерировать правдоподобные, но неверные ответы.
Анализ результатов: Исследование выявило, что лучшие модели демонстрируют точность признания неизвестности в диапазоне от 62% до 68%. Была отмечена обратная зависимость между сложностью задачи и точностью модели: чем сложнее задача, тем выше вероятность, что модель признает свою неспособность ответить.

Ключевые выводы

Обратная зависимость сложности и точности: Модели чаще признают свою неопределенность на более сложных задачах. Например, GPT-4 показал более высокий процент признания неизвестности на сложных задачах (35.8%) по сравнению с более простыми (20.0%).
Вариативность по категориям: Модели испытывали трудности с признанием неопределенности в задачах, связанных с изобретениями и NP-сложными проблемами, но показали себя лучше в философских и психологических задачах.
Значение признания неопределенности: Исследование подчеркивает важность способности моделей признавать границы своих знаний как ключевой компонент оценки искусственного общего интеллекта (AGI).

Важность исследования для будущего AI

Это исследование вносит значительный вклад в понимание ограничений текущих LLM и предлагает новые направления для улучшения их обучения и архитектуры. Оно расширяет предыдущие теоретические рамки для тестирования универсального интеллекта, предоставляя эмпирические доказательства текущих ограничений в способности моделей распознавать свои собственные границы знаний.

Практические применения

Обучение моделей: Результаты могут быть использованы для разработки методов обучения, которые поощряют модели к более точному признанию собственных ограничений.
Архитектурные улучшения: Исследование может вдохновить на создание новых архитектур моделей, которые лучше справляются с неопределенностью и неразрешимыми проблемами.
Оценка и тестирование: Платформа тестирования может быть использована для оценки будущих моделей AI, особенно в контексте AGI, где способность признавать неизвестное является критическим аспектом.

Заключение

Исследование "Тест на невозможное" подчеркивает, что, несмотря на значительные достижения в области LLM, эти модели все еще сталкиваются с трудностями в признании своих ограничений. Это открытие не только подчеркивает необходимость дальнейших исследований в области AI, но и предоставляет конкретные направления для улучшения моделей, чтобы они могли более точно и честно взаимодействовать с пользователями, признавая, когда информация выходит за пределы их текущих знаний.

Статья на arxiv Оригинал pdf training intelligence dataset