Детерминированный горизонт: когда расширенное рассуждение даёт сбой и необходима делегация инструментам

исследования официальный 1 ист. ~1 мин

Принятая на ICML 2026 статья формулирует теорему об узком месте внимания, ограничивающую мощность отслеживания состояний у decoder-only трансформеров, и выявляет «детерминированный горизонт» примерно в 19–31 шаг, за которым рассуждение в цепочке мысли деградирует сверхэкспоненциально. Эмпирическая проверка на 12 моделях и 8 предметных областях — включая SWE-Bench и WebArena — показывает, что гибридные нейросетево-инструментальные системы достигают 86–94% точности против 24–42% у чистой цепочки мысли.

Почему это важно

Статья переносит нарратив о сбоях рассуждения с проблемы обучающих данных на архитектурное ограничение мощности, задавая обоснованные пороги, при достижении которых агентным системам следует делегировать задачи внешним инструментам, а не продолжать рассуждать.

Важность: 3/5

Принятие на ICML 2026 + широкая эмпирическая проверка; устанавливает обоснованные архитектурные ограничения рассуждения в цепочке мысли с прямыми последствиями для проектирования агентов

reasoning agents theory benchmark paper formal-reasoning

Источники

официальный The Deterministic Horizon: When Extended Reasoning Fails and Tool Delegation Becomes Necessary — arXiv