SearchSwarm: обучаемое делегирование для LLM-агентов в долгосрочных исследовательских задачах

исследования официальный 1 ист. ~1 мин

SearchSwarm (arXiv:2606.09730) представляет мультиагентный фреймворк, в котором основная LLM декомпозирует длинные исследовательские задачи и передаёт подзадачи специализированным субагентам, которые возвращают только обобщённые результаты для соответствия контекстному окну основной модели. Обучающие данные синтезируются через систему, направляющую высококачественную декомпозицию. SearchSwarm-30B-A3B достигает 68,1 на BrowseComp и 73,3 на BrowseComp-ZH — лучшие результаты среди открытых моделей сопоставимого масштаба. Веса, обучающие данные и система выпускаются в открытый доступ.

Почему это важно

Переполнение контекстного окна — практический потолок для исследовательских агентов на базе LLM. SearchSwarm решает эту проблему с помощью обучаемой стратегии делегирования, а не эвристической, а выпуск в открытый доступ обеспечивает воспроизводимость последующих исследований.

Важность: 2/5

Серьёзная статья по мультиагентным системам с открытым исходным кодом; SOTA на BrowseComp для открытых моделей; делегирование как обучаемый навык — полезная концептуализация.

Источники