Ай Дайджест

Свежая выжимка ml и AI статей - каждый день

Подборка статей по тегу "strategy"

Контекстуализированная контрречь: стратегии адаптации, персонализации и оценки

Сгенерированная ИИ контрречь предлагает многообещающую и масштабируемую стратегию для сокращения онлайн-токсичности через прямые ответы, которые способствуют гражданскому дискурсу. Однако текущая контрречь является универсальной, не адаптированной к контексту модерации и вовлеченным пользователям. Мы предлагаем и оцениваем несколько стратегий генерации адаптированной контрречи, которая подстраивается под контекст модерации и персонализируется для пользователя, подвергающегося модерации. Мы обучаем модель LLaMA2-13B генерировать контрречь, экспериментируя с различными конфигурациями на основе различной контекстуальной информации и стратегий дообучения. Мы определяем конфигурации, которые генерируют убедительную контрречь с помощью комбинации количественных показателей и человеческих оценок, собранных в ходе заранее зарегистрированного эксперимента по краудсорсингу смешанного дизайна. Результаты показывают, что контекстуализированная контрречь может значительно превосходить самые современные универсальные контрречи по адекватности и убеждающей силе, не ухудшая другие характеристики. Наши результаты также показывают слабую корреляцию между количественными показателями и человеческими оценками, что предлагает, что эти методы оценивают разные аспекты и подчеркивает необходимость более тонких методологий оценки. Эффективность контекстуализированной сгенерированной ИИ контрречи и расхождение между человеческими и алгоритмическими оценками подчеркивают важность увеличенного сотрудничества человека и ИИ в модерации контента.

Исследование рациональности LLM в контексте теории игр

Данная статья исследует рациональность крупных языковых моделей (LLMs) в контекстах стратегического принятия решений, в частности в рамках теории игр. Мы оцениваем несколько передовых LLM на спектре игр с полной и неполной информацией. Наши результаты показывают, что LLM часто отклоняются от рациональных стратегий, особенно по мере увеличения сложности игры с большими матрицами выигрышей или более глубокими последовательными деревьями. Чтобы устранить эти ограничения, мы разработали несколько игротеоретических рабочих процессов, которые направляют процессы рассуждений и принятия решений у LLM. Эти рабочие процессы направлены на улучшение способности моделей вычислять равновесие Нэша и принимать рациональные решения даже в условиях неопределенности и неполной информации. Экспериментальные результаты демонстрируют, что внедрение этих рабочих процессов значительно улучшает рациональность и устойчивость LLM в игротеоретических задачах. В частности, с помощью этих рабочих процессов LLM показывают заметные улучшения в идентификации оптимальных стратегий, достижении почти оптимальных распределений в переговорных сценариях и снижении уязвимости к эксплуатации во время переговоров. Кроме того, мы рассматриваем мета-стратегические аспекты того, является ли рациональным для агентов принятие таких рабочих процессов, признавая, что решение использовать или отказаться от рабочего процесса само по себе является игротеоретической проблемой. Наш исследовательский вклад способствует глубокому пониманию возможностей LLM в принятии решений в стратегических контекстах и предоставляет идеи для повышения их рациональности через структурированные рабочие процессы. Результаты имеют значение для разработки более устойчивых и стратегически обоснованных ИИ-агентов, способных ориентироваться в сложных интерактивных средах. Код и данные, поддерживающие это исследование, доступны по адресу https://github.com/Wenyueh/game_theory.