#open-weights
- DeepSeek V4: официальный open-source релиз с Day-0 адаптацией под Huawei Ascend DeepSeek models-llm
- NVIDIA выпускает Cosmos 3: открытая омнимодальная фундаментальная модель для физического AI NVIDIA research
- Mistral выпустила Medium 3.5 — 128B dense, 256k контекста, открытые веса Mistral models-llm
- Mistral выпускает Medium 3.5 — открытый флагман и удалённые агенты для программирования в Vibe Mistral AI models-llm
- MiniMax выпускает M3: открытая фронтирная модель с контекстом 1M токенов и архитектурой MSA MiniMax models-llm
- Ideogram 4.0 выходит как открытая модель text-to-image с 9,3B параметров и нативным разрешением 2K Ideogram image
- Google DeepMind выпускает Gemma 4 12B: мультимодальная модель без энкодера, работающая на ноутбуке с 16 ГБ VRAM Google DeepMind models-llm
- NVIDIA Nemotron 3 Ultra: открытая модель 550B MoE теперь доступна для агентных задач NVIDIA models-llm
- MiniMax M3 с открытыми весами: контекст 1M, MoE и кодирование на уровне лучших моделей MiniMax models-llm
- Google выпускает DiffusionGemma: открытая модель на 26B с генерацией текста в 4× быстрее Google DeepMind models-llm
- Zhipu AI открывает GLM-5.2 под лицензией MIT с контекстом 1M токенов Zhipu AI models-llm
- Zhipu AI выпускает открытые веса GLM-5.2: 753B MoE с контекстом 1M токенов под лицензией MIT Zhipu AI / Z.ai models-llm
- MiniCPM-o 4.5: полнодуплексное омнимодальное AI в реальном времени на граничных устройствах OpenBMB / Tsinghua University research
- Poolside открывает исходники Laguna XS.2 и M.1: первые open-weight агентские модели для кодинга от американского стартапа Poolside models-llm
- Zyphra выпускает ZAYA1-8B: открытая рассуждающая MoE-модель, обученная на оборудовании AMD Zyphra models-llm
- Google DeepMind публикует QAT-чекпоинты Gemma 4: модель E2B занимает менее 1 ГБ на устройстве Google DeepMind models-llm
- Kimi K2.7-Code HighSpeed: рост производительности в 6× для продакшн-пайплайнов агентов по коду Moonshot AI models-llm
- Alibaba выпускает Qwen-RobotSuite: три базовых модели для воплощённого ИИ Alibaba / Qwen models-llm
- Black Forest Labs выпускает FLUX.2 с мультиреференсным кондиционированием и выходом 4 МП Black Forest Labs image
- Kwai Keye-VL-2.0: открытая мультимодальная MoE-модель 30B с контекстом 256K для длинного видео Kwai research
- Moonshot AI выпускает Kimi K2.7-Code: открытая модель с 1T параметрами для программирования и поддержкой зрения Moonshot AI models-llm
- MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества MiniMax research
- vLLM добавляет поддержку MiniMax M3 с открытыми весами в день выхода: разреженное внимание с контекстом 1M токенов MiniMax tools
- DeepSeek V4 — снижение цен в API DeepSeek models-llm
- Meta публикует отчёт о готовности Code World Model перед выпуском в открытый доступ Meta research
- Zhipu AI выпускает GLM-5.2: MoE с 744B параметрами, контекстом 1M токенов и фокусом на программирование Zhipu AI models-llm
- Tencent выпустил обновление HY-Embodied-0.5-X для воплощённых агентов Tencent models-llm
- OpenCode v1.14.30: Mistral Medium 3.5 с reasoning и фиксы Desktop-сессий SST tools