Игровое агентное обучение роботов: самостоятельная игра формирует переносимые навыки
UC Berkeley
Robotics Agent Teams (RATs) приобретают навыки через самостоятельную игру до задания каких-либо целевых задач. В ходе игры агент генерирует новые исследовательские задачи, пишет и исполняет код политик для робота, диагностирует сбои, повторяет попытки с обратной связью на уровне шагов и дистиллирует успехи в многоразовую библиотеку кода. Навыки, приобретённые в ходе игры, улучшили производительность на отложенных задачах на 20,6 и 17,0 процентного пункта по сравнению с базовыми линиями на LIBERO-PRO и MolmoSpaces и перенеслись на другие агенты Code-as-Policy без дообучения.
Почему это важно
Демонстрирует, что неструктурированная предзадачная игра с политиками на основе кода формирует навыки, обобщающиеся на незнакомые задачи и сторонних агентов, — шаг к роботам, самосовершенствующимся до развёртывания. Работа получила 42 апвоута на HuggingFace Daily Papers.
Важность: 2/5
42 апвоута на HF Daily; навыки, приобретённые в ходе игры, переносятся на сторонних агентов без дообучения — обобщаемый результат для предразвёртывочного улучшения воплощённого ИИ.