FAPO: полностью автономная оптимизация промптов в многошаговых LLM-пайплайнах
Cisco Foundation AI
FAPO оценивает выходные данные многошагового LLM-пайплайна, атрибутирует сбои конкретному шагу, предлагает точечные варианты промптов, проверяет их независимым агентом и итерирует до улучшения точности или исчерпания бюджета. Система превзошла GEPA (актуальный state-of-the-art оптимизатор) в 15 из 18 пар модель–бенчмарк, со средним приростом +14,1 процентного пункта и +33,8 на задачах, требующих структурных изменений промптов. Открытый исходный код под лицензией Apache 2.0.
Почему это важно
Атрибуция сбоев на уровне шагов качественно отличается от рассмотрения пайплайна как чёрного ящика — это позволяет проводить точечную оптимизацию, недоступную методам без учёта структуры пайплайна.
Важность: 2/5
Новый метод атрибуции сбоев на уровне шагов для многошаговых LLM-пайплайнов; 30 апвоутов на HF Daily; открытый исходный код под Apache 2.0.