AnyFlow: видеодиффузия с произвольным числом шагов через on-policy дистилляцию flow map

MIT / NVIDIA

исследования офиц. + СМИ 2 ист. ~1 мин

AnyFlow решает проблему компромисса между качеством и скоростью в видеодиффузии, нацеливаясь на полную ODE-траекторию с использованием переходов flow map через произвольные временны́е интервалы, а не фиксированное consistency-отображение по шагам. «Flow Map Backward Simulation» разбивает Euler-развёртки на shortcut-переходы для эффективного обучения. Метод масштабируется от 1,3B до 14B параметров и достигает результатов на уровне или выше consistency-подходов при поддержке гибкого бюджета шагов.

Почему это важно

78 upvote на HuggingFace Daily Papers за 14 мая. Решает ключевую задачу эффективности видеодиффузии с первых принципов; результаты на широком диапазоне масштабов моделей демонстрируют практическую применимость для production-пайплайнов генерации видео.

Важность: 2/5

HF Daily Papers 14 мая (78 upvote); принципиальная дистилляция видеодиффузии с гибким бюджетом шагов

Источники