LongLive-2.0: параллельная инфраструктура NVFP4 для генерации длинных видео (NVIDIA, 1220 апвоутов на HF)
NVIDIA
NVIDIA представляет LongLive-2.0 — параллельную инфраструктуру на базе NVFP4 (4-битная плавающая точка) для генерации длинных видео. Ключевые новшества: Balanced Sequence Parallelism для авторегрессионного обучения, устранение зависимостей от инициализации ODE, а также W4A4 NVFP4-инференс с квантованным KV-кешем и асинхронным потоковым декодированием VAE. Достигнуто ускорение обучения в 2,15× и инференса в 1,84×, модель 5B выдаёт 45,7 FPS. Код и модели опубликованы в открытом доступе.
Почему это важно
Получила 1220 апвоутов на HuggingFace — лидер дня среди статей. Производственная инфраструктура NVIDIA для генерации длинных видео напрямую решает проблему памяти и вычислительного потолка, сдерживающего масштабирование авторегрессионных видеомоделей. Путь через точность NVFP4 показывает, как будет выглядеть генерация видео эпохи Blackwell на больших масштабах.
Важность: 4/5
1220 апвоутов на HF (лидер дня); производственная NVFP4-инфраструктура NVIDIA с ускорением обучения 2,15× и инференса 1,84× для генерации длинных видео — эталонная инфраструктура эпохи Blackwell