Qwen-AgentWorld: языковые world-модели для универсальных агентов в семи средах

Alibaba/Qwen

исследования офиц. + СМИ 2 ист. ~1 мин

Команда Qwen от Alibaba опубликовала Qwen-AgentWorld (arXiv 2606.24597, 23 июня) — языковые world-модели в вариантах 35B-A3B и 397B-A17B MoE, симулирующие семь агентных сред: MCP, Search, Terminal, Software Engineering, Android, Web и OS. Обучены на более чем 10 миллионах траекторий реальных взаимодействий со средой. Также представлен AgentWorldBench, охватывающий все семь доменов. Модели могут служить масштабируемыми симуляторами для RL-обучения или в качестве разогрева для дальнейших агентных задач.

Почему это важно

Первая языковая world-модель, охватывающая такой широкий спектр агентных сред, — единый симулятор для RL-обучения в семи доменах без необходимости поддерживать семь отдельных реальных сред — способна существенно снизить стоимость и сложность обучения дееспособных агентов. Самая голосованная статья на HF Daily Papers за 24 июня (36 голосов).

Важность: 3/5

Первая языковая world-модель, охватывающая семь агентных сред; лидер HF Daily Papers за 24 июня (36 голосов); обеспечивает масштабируемую синтетическую симуляцию RL-среды

Источники

официальный Qwen-AgentWorld — arXiv