Causal Forcing++: 2-шаговая дистилляция для генерации интерактивного видео в реальном времени
Tsinghua University
Causal Forcing++ (arXiv 2605.15141, 80 голосов HF Daily) предлагает дистилляцию причинной согласованности для обучения 2-шаговых пофреймовых авторегрессионных моделей генерации видео, превосходящих 4-шаговый базовый SOTA Causal Forcing как по качеству, так и по задержке. Применённый к генерации мировых моделей с управлением действиями, метод существенно снижает стоимость обучения при сохранении точности. Обеспечивает синтез интерактивного видео в реальном времени.
Почему это важно
Генерация видео 720p в реальном времени конкурентного качества всего за 2 шага инференса напрямую применима к игровым движкам, средам симуляции и обучению воплощённого ИИ. Сокращение числа шагов вдвое по сравнению с предыдущим SOTA при снижении стоимости обучения намечает масштабируемый путь развёртывания мировых моделей.
Важность: 3/5
80 голосов HF Daily; интерактивное видео в реальном времени за 2 шага, превосходит 4-шаговый SOTA; применимо к мировым моделям для RL