Sakana AI выпускает Fugu: мульти-LLM-оркестратор, достигающий SoTA на SWE-Bench Pro
Sakana AI
Sakana AI опубликовала технический отчёт Fugu (arXiv 2606.21228, обновлён 23 июня 2026 года). Fugu — семейство моделей-оркестраторов, обученных координировать адаптивную команду специализированных LLM, динамически выстраивая агентные скаффолды под каждый запрос с помощью файн-тюнинга, эволюционных алгоритмов и RL. Два варианта: Fugu (баланс производительности и латентности) и Fugu-Ultra (максимальное качество). Достигает state-of-the-art результатов на SWE-Bench Pro, Terminal Bench, LiveCodeBench и GPQA-Diamond среди публично доступных моделей.
Почему это важно
Fugu напрямую решает проблему привязки к одному вендору и фрагментации frontier-LLM, обучаясь компоновать специализированные модели вместо опоры на единственного провайдера. Достижение SoTA на сложных бенчмарках GPQA-Diamond и SWE-Bench Pro без монолитной модели — значимый архитектурный результат.
Важность: 3/5
SoTA-результаты на SWE-Bench Pro и GPQA-Diamond от мульти-LLM-оркестратора — ставит под сомнение тезис о том, что производительность уровня frontier требует монолитных моделей