Causal Forcing++: 2-шаговая дистилляция для генерации интерактивного видео в реальном времени

Tsinghua University

исследования официальный 1 ист. ~1 мин

Causal Forcing++ (arXiv 2605.15141, 80 голосов HF Daily) предлагает дистилляцию причинной согласованности для обучения 2-шаговых пофреймовых авторегрессионных моделей генерации видео, превосходящих 4-шаговый базовый SOTA Causal Forcing как по качеству, так и по задержке. Применённый к генерации мировых моделей с управлением действиями, метод существенно снижает стоимость обучения при сохранении точности. Обеспечивает синтез интерактивного видео в реальном времени.

Почему это важно

Генерация видео 720p в реальном времени конкурентного качества всего за 2 шага инференса напрямую применима к игровым движкам, средам симуляции и обучению воплощённого ИИ. Сокращение числа шагов вдвое по сравнению с предыдущим SOTA при снижении стоимости обучения намечает масштабируемый путь развёртывания мировых моделей.

Важность: 3/5

80 голосов HF Daily; интерактивное видео в реальном времени за 2 шага, превосходит 4-шаговый SOTA; применимо к мировым моделям для RL

video-generation diffusion distillation real-time world-models

Источники

официальный Causal Forcing++ — arXiv