NVIDIA выпускает Cosmos 3: открытая омнимодальная фундаментальная модель для физического AI

NVIDIA

исследования офиц. + СМИ 4 ист. ~1 мин

NVIDIA выпустила Cosmos 3 — первую полностью открытую омнимодальную фундаментальную модель для физического AI-рассуждения, обученную на 20T токенов мультимодальных данных, включая ~1B изображений, 400M видео, фоновый звук и последовательности действий. Построена на архитектуре mixture-of-transformers, объединяющей визуальное рассуждение, генерацию мира и предсказание действий; занимает первое место на восьми и более таблицах лидеров по vision-reasoning и world generation. Cosmos 3 Super и Nano сразу доступны на build.nvidia.com, Hugging Face и GitHub под лицензией OpenMDW-1.1.

Почему это важно

Первая открытая фундаментальная модель, объединяющая восприятие, симуляцию мира и предсказание действий для обучения роботов и автономных транспортных средств; 8 680 голосов на HF Daily Papers.

Важность: 5/5

Омнимодальная мировая модель парадигмального уровня от NVIDIA; первое место на 8+ таблицах лидеров; 8 680 голосов HF Daily Paper (лучшая статья дня); официальные блоги NVIDIA и HF, подтверждение Axios.

Источники