FastContext: специализированный субагент-исследователь сокращает использование токенов агентами по коду на 60%

Microsoft / Shanghai Jiao Tong University

исследования официальный 3 ист. ~1 мин

FastContext отделяет исследование репозитория от решения задач в LLM-агентах для работы с кодом, вводя специализированный субагент-исследователь (4B–30B параметров), который выполняет параллельные вызовы инструментов read/glob/grep и возвращает компактные ссылки на пути к файлам и диапазоны строк основному решателю. Обучение включает supervised fine-tuning с последующим обучением с подкреплением на задачах. Интегрированный в Mini-SWE-Agent, FastContext улучшает показатели решения задач до 5,5 процентных пунктов на SWE-bench Multilingual, SWE-bench Pro и SWE-QA, сокращая при этом использование токенов основным агентом до 60%.

Почему это важно

Навигация по репозиторию — крупная скрытая статья затрат в современных агентах для работы с кодом: модели тратят значительную часть контекстного окна только на поиск нужных файлов. Подход FastContext с разделением ответственности показывает, что специализированная малая модель справляется с исследованием значительно эффективнее монолитного решателя. 152 голоса на HuggingFace Daily Papers.

Важность: 3/5

Практическое сокращение токенов на 60% для агентов по коду с улучшенными результатами на SWE-bench; 152 голоса на HF Daily (+1 бамп); от Microsoft Research с непосредственной применимостью для разработчиков агентных пайплайнов.

Источники

официальный microsoft/fastcontext — GitHub