Свежая выжимка ml и AI статей - каждый день
С развитием сотовых сетей и их возрастающей сложностью, автоматизация операций сетей становится всё более актуальной задачей. Несмотря на значительные достижения, полная автономия сетей остаётся недостижимой из-за необходимости человеческого вмешательства в моделирование поведения сетей и определение политик для достижения целевых требований. В этом контексте, сетевые цифровые двойники (Network Digital Twins, NDTs) представляют собой многообещающее направление для повышения интеллекта сетей, однако их реализация ограничена специфическими архитектурами для каждого случая использования, что сдерживает развитие полной автономии сетей.
Для достижения полной автономии сетей требуется более продвинутый уровень сетевого интеллекта, который можно назвать "мозгом телекоммуникаций". В этом стремлении к автономии, крупные языковые модели (LLM) рассматриваются как потенциальные инструменты для реализации этой концепции. Однако, LLM сталкиваются с вызовами при моделировании сетевых поведений, особенно в области рассуждений и обработки разнообразных типов данных.
В данной статье мы представим Hermes — инновационную систему, состоящую из цепочки LLM агентов, использующих "схемы" для создания инстанций NDT через структурированные и объяснимые логические шаги. Hermes позволяет автоматическое, надёжное и точное моделирование сетей для различных сценариев и конфигураций, что является важным шагом на пути к полной автономии сетевых операций.
Автономные сети представляют собой сети, способные самостоятельно управлять своими ресурсами и адаптироваться к изменяющимся условиям без вмешательства человека. По шкале автономии сетей, где уровень 0 означает полностью ручное управление, а уровень 5 — полную автоматизацию, современные сети находятся на среднем уровне, стремясь достичь уровня 3 до 2026 года.
Сетевые цифровые двойники (NDTs) являются одним из перспективных подходов к повышению интеллекта сетей. Они позволяют моделировать, анализировать и автоматизировать операции сетей, но их применение ограничено из-за необходимости создания уникальных архитектур для каждого конкретного случая использования.
Концепция "мозга телекоммуникаций" предполагает наличие крупномасштабной интеллектуальной сущности, способной понимать сложные взаимосвязи в сети, прогнозировать её поведение и адаптироваться к новым сценариям. Это существо должно обладать обширными знаниями о сетевых операциях и функционалах, а также уметь планировать и оптимизировать работу сети в реальном времени.
LLM, такие как GPT-4o, представляют собой инструменты, которые могут помочь в создании такого "мозга". Однако, их применение в телекоммуникациях до сих пор ограничивалось вспомогательными функциями, такими как:
Hermes представляет собой систему, состоящую из цепочки LLM агентов, каждый из которых выполняет специфические задачи:
Фаза дизайна:
Фаза кодирования:
Фаза обратной связи:
Для оценки эффективности Hermes были проведены эксперименты по решению различных задач моделирования сетей:
Результаты показали, что Hermes значительно превосходит традиционные методы, такие как Chain-of-Thought (CoT) и Hermes-coder, особенно при увеличении сложности задач.
Были также проведены сравнения с использованием различных LLM, таких как Llama-3.1 и GPT-4o. Hermes, использующий GPT-4o, показал наилучшие результаты, подтверждая важность выбора правильной модели для задач моделирования сетей.
Для улучшения производительности Hermes с использованием открытых LLM, была добавлена возможность интеграции экспертно разработанных моделей. Это позволило значительно повысить точность и надёжность моделирования даже при использовании менее мощных моделей.
Основные направления дальнейших исследований включают:
Hermes представляет собой значительный шаг вперёд в направлении полной автономии сетей, предлагая инновационный подход к моделированию сетей с использованием LLM. Использование структурированных схем и цепочки агентов позволяет достигать высокой точности и надёжности в решении различных задач моделирования сетей, что делает Hermes важным инструментом для операторов сетей и исследователей, стремящихся к автономным сетевым операциям.