Sakana AI выпускает Fugu: мульти-LLM-оркестратор, достигающий SoTA на SWE-Bench Pro

Sakana AI

исследования офиц. + СМИ 2 ист. ~1 мин

Sakana AI опубликовала технический отчёт Fugu (arXiv 2606.21228, обновлён 23 июня 2026 года). Fugu — семейство моделей-оркестраторов, обученных координировать адаптивную команду специализированных LLM, динамически выстраивая агентные скаффолды под каждый запрос с помощью файн-тюнинга, эволюционных алгоритмов и RL. Два варианта: Fugu (баланс производительности и латентности) и Fugu-Ultra (максимальное качество). Достигает state-of-the-art результатов на SWE-Bench Pro, Terminal Bench, LiveCodeBench и GPQA-Diamond среди публично доступных моделей.

Почему это важно

Fugu напрямую решает проблему привязки к одному вендору и фрагментации frontier-LLM, обучаясь компоновать специализированные модели вместо опоры на единственного провайдера. Достижение SoTA на сложных бенчмарках GPQA-Diamond и SWE-Bench Pro без монолитной модели — значимый архитектурный результат.

Важность: 3/5

SoTA-результаты на SWE-Bench Pro и GPQA-Diamond от мульти-LLM-оркестратора — ставит под сомнение тезис о том, что производительность уровня frontier требует монолитных моделей

multi-agent coding-agent reinforcement-learning software-engineering

Источники

официальный Sakana Fugu Technical Report — arXiv

СМИ Sakana AI blog: Fugu release