Свежая выжимка ml и AI статей - каждый день
С появлением крупных языковых моделей (LLM) в последние годы, такие как ChatGPT, Microsoft Copilot и Google Gemini, взаимодействие пользователей с системами, основанными на знаниях, претерпело значительные изменения. Эти модели могут не только обрабатывать и анализировать большие объемы информации, но и ассистировать пользователям в выполнении сложных исследовательских задач, предоставляя ответы и рекомендации, которые ранее были за пределами возможностей традиционных поисковых систем. Однако, несмотря на их мощность, LLM-чатботы часто сталкиваются с проблемами при попытке обеспечить персонализированную поддержку, особенно когда пользователи начинают с нечетких запросов или не предоставляют достаточного контекста. В статье "Navigating the Unknown: A Chat-Based Collaborative Interface for Personalized Exploratory Tasks" исследуется система под названием CARE (Collaborative Assistant for Personalized Exploration), которая стремится преодолеть эти ограничения, предлагая новый подход к персонализации и улучшению взаимодействия пользователя с системой.
CARE представляет собой систему с интерфейсом, состоящим из трех основных панелей:
Панель чата (Chat Panel) - здесь происходит основное взаимодействие между пользователем и системой. Пользователи могут вводить свои запросы, а система отвечает, задает уточняющие вопросы или предлагает решения.
Панель решений (Solution Panel) - в этой панели отображаются предложенные решения в формате Markdown, который поддерживает богатый текст, таблицы и эмоджи, что делает информацию более читаемой и понятной.
Панель потребностей (Needs Panel) - она позволяет пользователям видеть, какие их потребности были идентифицированы системой, а также предоставляет возможность добавлять, изменять или удалять свои потребности в реальном времени.
Задний план CARE состоит из нескольких LLM-агентов, каждый из которых выполняет специфическую роль:
Агент запросов (Inquiry Agent) - управляет диалогом с пользователем, упрощая вопросы и предоставляя варианты ответов для уменьшения когнитивной нагрузки.
Агент вех (Milestone Agent) - определяет следующие шаги или вехи в процессе решения задачи на основе текущих потребностей пользователя.
Агент открытия потребностей (Needs Discovery Agent) - идентифицирует явные и неявные потребности пользователя, предлагая вопросы для уточнения.
Агент ранжирования (Ranking Agent) - организует и приоритизирует вопросы для упрощения взаимодействия.
Агент создания решений (Solution Craft Agent) - разрабатывает персонализированные решения на основе собранных потребностей.
Процесс взаимодействия в CARE начинается с запроса пользователя, который передается Агенту запросов. Этот агент затем обсуждает с пользователем его потребности, передавая информацию Агенту вех для установления следующих шагов. Агент открытия потребностей извлекает и документирует потребности, в то время как Агент ранжирования организует вопросы по темам и приоритетам. Наконец, Агент создания решений генерирует конкретные решения, которые отображаются в Панели решений. Пользователь может в любой момент уточнить или изменить свои потребности через Панель потребностей, что позволяет системе динамически адаптироваться.
Для оценки эффективности CARE был проведен пользовательский эксперимент с участием 22 человек. Участники выполняли две исследовательские задачи (планирование путешествия и обучение навыкам) с использованием как CARE, так и базового LLM-чатбота. Результаты показали, что:
CARE представляет собой новаторский подход к взаимодействию с LLM-чатботами, предлагая структурированный и персонализированный интерфейс для исследовательских задач. Его многоагентная система обеспечивает более глубокое понимание потребностей пользователя, уменьшает когнитивную нагрузку и стимулирует творческий подход к решению задач. Хотя CARE и имеет некоторые ограничения, такие как время отклика, его потенциал для улучшения пользовательского опыта и эффективности в исследовательских задачах очевиден. Дальнейшие исследования могут сосредоточиться на улучшении производительности, расширении поддерживаемых языков и интеграции с другими системами для еще более персонализированного и эффективного взаимодействия.