#diffusion
- Pixal3D: попиксельная генерация 3D из изображений принята на SIGGRAPH 2026 Tencent ARC Lab research
- UniVidX: единый диффузионный бэкбон для генерации RGB, карт внутренних признаков и RGBA-видео research
- Mean Mode Screaming: исправление патологии обучения открывает путь к 1000-слойным Diffusion Transformer research
- Flow-OPD: on-policy дистилляция даёт +29 пунктов по GenEval на Stable Diffusion 3.5 research
- Qwen-Image-2.0: унифицированная генерация и редактирование изображений в разрешении 2K, первое место на AI Arena Alibaba research
- Asymmetric Flow Models: SOTA FID 1,57 на ImageNet через ранг-асимметричную параметризацию скоростей Stanford University research
- Krea публикует открытые веса Krea 2 Raw и Turbo: 12B DiT-модель генерации изображений за 2 секунды Krea image
- Moebius: лёгкая модель инпейнтинга на 0,2 млрд параметров сравнялась с FLUX на 11,9 млрд Huazhong University of Science and Technology research
- Orthrus: 7,8-кратное ускорение инференса для Qwen3 за счёт совместного использования KV-кеша AR и диффузии research
- Causal Forcing++: 2-шаговая дистилляция для генерации интерактивного видео в реальном времени Tsinghua University research
- SANA-WM: мировое моделирование 720p длительностью в минуту на одном GPU NVIDIA research
- Flow-DPPO: принципиальное RL-выравнивание для моделей генерации изображений и видео на основе flow matching Tencent Hunyuan research
- AnyFlow: видеодиффузия с произвольным числом шагов через on-policy дистилляцию flow map MIT / NVIDIA research
- Cola DLM: непрерывная латентная диффузионная языковая модель с конкурентным масштабированием research
- SCAIL-2: сквозная анимация персонажей через инконтекстное кондиционирование Tsinghua University research
- Diffusion-Proof: формальное доказательство теорем с помощью диффузионных языковых моделей research
- DreamReasoner-8B: блоковый размерный curriculum для диффузионных reasoning-моделей research