Ctx2Skill: фреймворк самосовершенствования для автономного обнаружения навыков из контекста в LLM
В статье представлен Ctx2Skill — фреймворк самосовершенствования для автономного обнаружения навыков из контекста в языковых моделях. Цикл мультиагентной самоигры сталкивает Challenger (генерирующий зондирующие задачи) с Reasoner (решающим их с помощью эволюционирующих навыков); Judge обеспечивает обратную связь, а механизм Cross-time Replay предотвращает деградацию навыков. Тестирование на четырёх бенчмарках контекстного обучения показало, что Ctx2Skill стабильно улучшает результаты на разных базовых LLM без каких-либо навыков, написанных людьми.
Почему это важно
128 голосов на HuggingFace Daily Papers (5 мая). Решает ключевое узкое место агентных LLM-систем: автоматическое извлечение и повторное использование процедурных знаний из контекста без опоры на захардкоженные или кюрированные людьми библиотеки навыков.
Важность: 3/5
128 голосов на HF Daily Papers; решает ключевое узкое место агентного самосовершенствования без кюрированных людьми навыков.