#video-generation
- UniVidX: единый диффузионный бэкбон для генерации RGB, карт внутренних признаков и RGBA-видео research
- MiniMax Hailuo 2.3 запущена с Media Agent и генерацией видео в пакетном режиме на 50% дешевле MiniMax video
- Lance: 3B Unified Multimodal Model for Understanding, Generation, and Editing (314 HF upvotes) ByteDance Research research
- xAI Grok Imagine Video 1.5: image-to-video с нативным звуком возглавляет Arena Leaderboard, API уже доступен xAI video
- Google Veo 3.1 добавляет звук во все режимы редактирования Flow и новые инструменты Insert/Remove Google DeepMind video
- Lionsgate берёт долю в Runway и планирует AI-сериалы короткого формата Runway industry
- xAI выпускает Grok Imagine Video 1.5: первое место в Video Arena Leaderboard по цене $4.20/мин xAI video
- Kling AI выпускает 3.0 Turbo и 3.0 Omni: быстрые превью и 4K-редактирование с консистентностью персонажей Kuaishou video
- LongLive-2.0: параллельная инфраструктура NVFP4 для генерации длинных видео (NVIDIA, 1220 апвоутов на HF) NVIDIA research
- Causal Forcing++: 2-шаговая дистилляция для генерации интерактивного видео в реальном времени Tsinghua University research
- SANA-WM: мировое моделирование 720p длительностью в минуту на одном GPU NVIDIA research
- Echo-Infinity: генерация бесконечного видео в реальном времени через обучаемый Memory Query research
- Flow-DPPO: принципиальное RL-выравнивание для моделей генерации изображений и видео на основе flow matching Tencent Hunyuan research
- ElevenLabs запускает Avatars в ElevenCreative: AI-видео с говорящей головой на базе TTS ElevenLabs video
- DreamX-World 1.0: интерактивная модель мира общего назначения с управлением камерой 6DoF AMAP-ML (Alibaba Maps AI Lab) research
- AnyFlow: видеодиффузия с произвольным числом шагов через on-policy дистилляцию flow map MIT / NVIDIA research
- Видеомодель Google Gemini «Omni» появляется в ранних демо накануне I/O 2026 Google DeepMind video
- Видеомодель Gemini Omni появляется накануне Google I/O 2026 Google DeepMind video
- ShengShu Technology запускает Vidu Claw: AI-платформу для сквозного производства рекламы ShengShu Technology video
- VideoKR: обучающий корпус из 315K примеров для знание- и рассуждение-интенсивного понимания видео Yale University research
- Echo-Memory: контролируемое исследование механизмов памяти в видеомоделях мира с условием на действие Microsoft Research research
- SCAIL-2: сквозная анимация персонажей через инконтекстное кондиционирование Tsinghua University research