FAPO: полностью автономная оптимизация промптов в многошаговых LLM-пайплайнах

Cisco Foundation AI

исследования офиц. + СМИ 2 ист. ~1 мин

FAPO оценивает выходные данные многошагового LLM-пайплайна, атрибутирует сбои конкретному шагу, предлагает точечные варианты промптов, проверяет их независимым агентом и итерирует до улучшения точности или исчерпания бюджета. Система превзошла GEPA (актуальный state-of-the-art оптимизатор) в 15 из 18 пар модель–бенчмарк, со средним приростом +14,1 процентного пункта и +33,8 на задачах, требующих структурных изменений промптов. Открытый исходный код под лицензией Apache 2.0.

Почему это важно

Атрибуция сбоев на уровне шагов качественно отличается от рассмотрения пайплайна как чёрного ящика — это позволяет проводить точечную оптимизацию, недоступную методам без учёта структуры пайплайна.

Важность: 2/5

Новый метод атрибуции сбоев на уровне шагов для многошаговых LLM-пайплайнов; 30 апвоутов на HF Daily; открытый исходный код под Apache 2.0.

Источники