Свежая выжимка ml и AI статей - каждый день
В повседневных разговорах люди естественным образом приобретают способность отвечать уместно в данной ситуации, учитывая, какой конверсационный навык наиболее подходит для ответа — процесс, который мы называем "навык разума". Для конверсационных агентов, основанных на LLM (Large Language Models), планирование соответствующих конверсационных навыков, как это делают люди, является сложной задачей из-за сложности социального диалога, особенно в интерактивных сценариях. В этой статье мы рассмотрим, как новый подход, основанный на концепции "навыка разума", может улучшить качество ответов, генерируемых LLM-агентами, и способствовать их социальному поведению.
Навык разума — это способность интерпретировать текущий контекст разговора, основываясь на социальной динамике (например, демография, личность) и оптимизировать социальное взаимодействие через конверсационные навыки. Это включает в себя:
Для реализации этого подхода был создан датасет MULTIFACETED SKILL-OF-MIND, содержащий около 100 тысяч диалогов, аннотированных навыками разума. Этот датасет охватывает множество интерактивных сценариев (например, долгосрочные разговоры, консультации, ориентированные на задачу диалоги) и включает в себя:
Используя этот датасет, была разработана новая семья LLM, называемая THANOS, с размерами моделей 1B, 3B и 8B параметров. Эти модели:
Эксперименты показали, что:
Введение концепции навыка разума и создание датасета MULTIFACETED SKILL-OF-MIND, а также разработка моделей THANOS, открывают новые возможности для улучшения социально осведомленных разговоров в LLM-агентах. Это не только улучшает качество взаимодействия с пользователями, но и способствует более глубокому пониманию и реализации социальных навыков в AI.
Для дальнейшего развития этой области необходимо проводить дополнительные исследования и эксперименты в различных диалоговых сценариях, а также работать над созданием агентов, полностью встроенных с навыком разума, что позволит им более естественно и эффективно взаимодействовать в социальных контекстах.