Свежая выжимка ml и AI статей - каждый день
В последние годы наблюдается рост интереса к большим языковым моделям (LLM) как инструментам для решения сложных математических задач. Эти модели демонстрируют выдающиеся способности в области математического рассуждения, однако существующие методы часто полагаются на закрытые источники или большие модели, что может вызывать проблемы с конфиденциальностью данных и затратами на вычисления. В данной статье мы представим MATATA (MAthematical Tool-Assisted reasoning for Tabular Applications) — новый подход, который использует слабое обучение для улучшения производительности LLM в табличных задачах.
Слабое обучение — это метод, который использует ограниченные или неполные метки для обучения модели. В контексте MATATA это означает, что модель может обучаться на данных, которые не были полностью аннотированы, что позволяет значительно снизить затраты на разметку данных. Этот подход позволяет эффективно использовать существующие данные, минимизируя при этом необходимость в ручной разметке.
MATATA использует концепцию инструментального обоснования, которая предполагает, что модели могут использовать специализированные инструменты для решения задач. В данном случае это означает использование небольших языковых моделей (SLMs), которые могут эффективно обрабатывать табличные данные и выполнять математические операции. Эти SLMs могут быть адаптированы для работы с конкретными задачами и обеспечивают более высокую точность по сравнению с общими LLM.
MATATA состоит из нескольких ключевых компонентов:
MATATA предназначена для решения задач, связанных с табличными данными, такими как финансовая отчетность или анализ данных. Она может эффективно обрабатывать как текстовые, так и табличные данные, что делает ее универсальным инструментом для различных приложений.
Архитектура MATATA включает в себя несколько уровней, которые взаимодействуют друг с другом для достижения общей цели.
На этом уровне происходит разбиение задачи на подзадачи. Планировщик использует информацию о задаче и доступные инструменты для создания последовательности действий, необходимых для решения проблемы.
На этом уровне происходит взаимодействие с различными инструментами. Каждый инструмент выполняет свою функцию, будь то извлечение данных из таблицы или выполнение математических операций. Эти инструменты могут быть адаптированы для конкретных задач, что повышает их эффективность.
Этот уровень отвечает за обучение модели на основе слабых сигналов. Модель использует свои собственные выводы для улучшения производительности, что позволяет ей адаптироваться к новым задачам и данным.
Проведенные эксперименты показали, что MATATA достигает высоких результатов на различных наборах данных, включая FinQA, TAT-QA и TabMWP. Модель демонстрирует эффективность в решении задач, требующих математического рассуждения, и превосходит существующие методы.
MATATA была протестирована на нескольких стандартных наборах данных и продемонстрировала лучшие результаты по сравнению с другими подходами, такими как GPT-4 и специализированные SLMs. Например, в задаче FinQA MATATA показала точность 98.12%, что значительно выше, чем у предыдущих моделей.
MATATA представляет собой значительный шаг вперед в области математического рассуждения с использованием языковых моделей. С помощью слабого обучения и инструментального обоснования, MATATA позволяет эффективно решать задачи, связанные с табличными данными, минимизируя затраты на разметку и вычисления. Этот подход открывает новые возможности для применения LLM в чувствительных областях, таких как финансовая аналитика и обработка данных.
MATATA демонстрирует, что даже с ограниченными ресурсами и данными можно достигать высоких результатов, что делает ее ценным инструментом для исследователей и практиков в области машинного обучения и анализа данных.