diffusion — AI Digest

11 мая Pixal3D: попиксельная генерация 3D из изображений принята на SIGGRAPH 2026 Tencent ARC Lab research
5 мая UniVidX: единый диффузионный бэкбон для генерации RGB, карт внутренних признаков и RGBA-видео research
11 мая Mean Mode Screaming: исправление патологии обучения открывает путь к 1000-слойным Diffusion Transformer research
11 мая Flow-OPD: on-policy дистилляция даёт +29 пунктов по GenEval на Stable Diffusion 3.5 research
12 мая Qwen-Image-2.0: унифицированная генерация и редактирование изображений в разрешении 2K, первое место на AI Arena Alibaba research
14 мая Asymmetric Flow Models: SOTA FID 1,57 на ImageNet через ранг-асимметричную параметризацию скоростей Stanford University research
24 июн Krea публикует открытые веса Krea 2 Raw и Turbo: 12B DiT-модель генерации изображений за 2 секунды Krea image
21 июн Moebius: лёгкая модель инпейнтинга на 0,2 млрд параметров сравнялась с FLUX на 11,9 млрд Huazhong University of Science and Technology research
16 мая Orthrus: 7,8-кратное ускорение инференса для Qwen3 за счёт совместного использования KV-кеша AR и диффузии research
16 мая Causal Forcing++: 2-шаговая дистилляция для генерации интерактивного видео в реальном времени Tsinghua University research
16 мая SANA-WM: мировое моделирование 720p длительностью в минуту на одном GPU NVIDIA research
10 июн Flow-DPPO: принципиальное RL-выравнивание для моделей генерации изображений и видео на основе flow matching Tencent Hunyuan research
14 мая AnyFlow: видеодиффузия с произвольным числом шагов через on-policy дистилляцию flow map MIT / NVIDIA research
9 мая Cola DLM: непрерывная латентная диффузионная языковая модель с конкурентным масштабированием research
10 июн SCAIL-2: сквозная анимация персонажей через инконтекстное кондиционирование Tsinghua University research
18 июн Diffusion-Proof: формальное доказательство теорем с помощью диффузионных языковых моделей research
18 июн DreamReasoner-8B: блоковый размерный curriculum для диффузионных reasoning-моделей research
28 июн Tencent Hunyuan публикует в открытый доступ UniRL: унифицированное RL-дообучение для LLM и диффузионных моделей Tencent / Hunyuan research