TMAS: масштабирование тестового вычисления через синергию мультиагентов с иерархической памятью

исследования официальный 2 ист. ~1 мин

TMAS масштабирует тестовое вычисление посредством структурированной мультиагентной координации, используя две иерархические системы памяти — банк опыта для надёжных промежуточных результатов и банк рекомендаций для исследованных стратегий — наряду с гибридной схемой обучения с подкреплением на основе вознаграждений. Подход предотвращает избыточные вычисления в параллельных траекториях рассуждений и обеспечивает превосходное масштабирование на сложных бенчмарках по рассуждению.

Почему это важно

Решает малоисследованную проблему координационных накладных расходов при масштабировании мультиагентного инференса, предлагая применимый путь к улучшению рассуждений без наивного дублирования усилий

Важность: 2/5

Иерархическая память + гибридный RL для мультиагентного тестового вычисления; решает координационные накладные расходы, ограничивающие наивное параллельное масштабирование агентов на задачах рассуждения.

reasoning multi-agent rl inference

Источники

официальный TMAS: Scaling Test-Time Compute via Multi-Agent Synergy — arXiv:2605.10344

СМИ TMAS — Hugging Face Daily Papers