open-weights — AI Digest

30 апр DeepSeek V4: официальный open-source релиз с Day-0 адаптацией под Huawei Ascend DeepSeek models-llm
4 июн NVIDIA выпускает Cosmos 3: открытая омнимодальная фундаментальная модель для физического AI NVIDIA research
29 апр Mistral выпустила Medium 3.5 — 128B dense, 256k контекста, открытые веса Mistral models-llm
3 мая Mistral выпускает Medium 3.5 — открытый флагман и удалённые агенты для программирования в Vibe Mistral AI models-llm
2 июн MiniMax выпускает M3: открытая фронтирная модель с контекстом 1M токенов и архитектурой MSA MiniMax models-llm
4 июн Ideogram 4.0 выходит как открытая модель text-to-image с 9,3B параметров и нативным разрешением 2K Ideogram image
4 июн Google DeepMind выпускает Gemma 4 12B: мультимодальная модель без энкодера, работающая на ноутбуке с 16 ГБ VRAM Google DeepMind models-llm
8 июн NVIDIA Nemotron 3 Ultra: открытая модель 550B MoE теперь доступна для агентных задач NVIDIA models-llm
10 июн MiniMax M3 с открытыми весами: контекст 1M, MoE и кодирование на уровне лучших моделей MiniMax models-llm
11 июн Google выпускает DiffusionGemma: открытая модель на 26B с генерацией текста в 4× быстрее Google DeepMind models-llm
17 июн Zhipu AI открывает GLM-5.2 под лицензией MIT с контекстом 1M токенов Zhipu AI models-llm
19 июн Zhipu AI выпускает открытые веса GLM-5.2: 753B MoE с контекстом 1M токенов под лицензией MIT Zhipu AI / Z.ai models-llm
3 мая MiniCPM-o 4.5: полнодуплексное омнимодальное AI в реальном времени на граничных устройствах OpenBMB / Tsinghua University research
4 мая Poolside открывает исходники Laguna XS.2 и M.1: первые open-weight агентские модели для кодинга от американского стартапа Poolside models-llm
9 мая Zyphra выпускает ZAYA1-8B: открытая рассуждающая MoE-модель, обученная на оборудовании AMD Zyphra models-llm
8 июн Google DeepMind публикует QAT-чекпоинты Gemma 4: модель E2B занимает менее 1 ГБ на устройстве Google DeepMind models-llm
16 июн Kimi K2.7-Code HighSpeed: рост производительности в 6× для продакшн-пайплайнов агентов по коду Moonshot AI models-llm
17 июн Alibaba выпускает Qwen-RobotSuite: три базовых модели для воплощённого ИИ Alibaba / Qwen models-llm
18 июн Black Forest Labs выпускает FLUX.2 с мультиреференсным кондиционированием и выходом 4 МП Black Forest Labs image
11 июн Kwai Keye-VL-2.0: открытая мультимодальная MoE-модель 30B с контекстом 256K для длинного видео Kwai research
14 июн Moonshot AI выпускает Kimi K2.7-Code: открытая модель с 1T параметрами для программирования и поддержкой зрения Moonshot AI models-llm
14 июн MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества MiniMax research
14 июн vLLM добавляет поддержку MiniMax M3 с открытыми весами в день выхода: разреженное внимание с контекстом 1M токенов MiniMax tools
28 апр DeepSeek V4 — снижение цен в API DeepSeek models-llm
5 мая Meta публикует отчёт о готовности Code World Model перед выпуском в открытый доступ Meta research
14 июн Zhipu AI выпускает GLM-5.2: MoE с 744B параметрами, контекстом 1M токенов и фокусом на программирование Zhipu AI models-llm
29 апр Tencent выпустил обновление HY-Embodied-0.5-X для воплощённых агентов Tencent models-llm
30 апр OpenCode v1.14.30: Mistral Medium 3.5 с reasoning и фиксы Desktop-сессий SST tools