Ежедневный дайджест

12 пунктов · ~12 мин · Неделя 2026-W25

Обязательно к прочтению (3)

Zhipu AI открывает GLM-5.2 под лицензией MIT с контекстом 1M токенов

Zhipu AI
модели/LLM офиц. + СМИ 3 ист. ~1 мин

Zhipu AI опубликовала открытые веса GLM-5.2 на HuggingFace под лицензией MIT около 16 июня 2026 года. Модель построена на архитектуре MoE с 753B параметрами, поддерживает контекстное окно в 1 миллион токенов, ориентирована прежде всего на написание кода и оснащена двойной системой управления усилием мышления — без региональных ограничений. Репозиторий: zai-org/GLM-5.2.

Почему это важно
Открытый релиз под MIT без каких-либо ограничений флагманской MoE-модели уровня frontier с 753B параметрами и контекстом 1M токенов — прямой конкурент ведущих закрытых моделей для корпоративных задач длительного агентного программирования в глобальном масштабе.

VibeThinker-3B достигает показателей frontier-уровня на бенчмарках рассуждений через curriculum RL

WeiboAI
исследования офиц. + СМИ 3 ист. ~1 мин

VibeThinker-3B (arXiv 2606.16140, 15 июня) достигает 94,3 на AIME26 (97,1 при масштабировании тестового времени), 80,2 Pass@1 на LiveCodeBench v6 и 96,1% принятых решений на незнакомых контестах LeetCode — с применением curriculum SFT, многодоменного RL и офлайн-самодистилляции на плотной модели с 3B параметрами. Авторы предлагают Гипотезу параметрического сжатия и покрытия: рассуждения компрессируются в компактные модели, тогда как широкие фактические знания требуют большего числа параметров.

Почему это важно
713 голосов на HuggingFace Daily Papers. Модель с 3B параметрами, сопоставимая или превосходящая значительно более крупные системы на бенчмарках по математике и коду, ставит под сомнение базовые предположения о требованиях к масштабу для frontier-рассуждений — значительные последствия для стоимости инференса и развёртывания на граничных устройствах.

JoyAI-VL-Interaction: открытая VLM на 8B для взаимодействия в реальном времени с автономным управлением очередью речи

JD.com
исследования официальный 3 ист. ~1 мин

JoyAI-VL-Interaction (arXiv 2606.14777) — VLM на 8B для непрерывного взаимодействия с видеопотоком в реальном времени: модель наблюдает за живым видеопотоком и автономно решает, когда говорить, а когда молчать. Выпущена вместе с рецептом обучения, временно-выровненными данными взаимодействия и полностью развёртываемой открытой системой (подключаемые ASR/TTS, память, API фонового агента). Люди-оценщики предпочли её ассистентам Doubao и Gemini в шести реальных сценариях.

Почему это важно
223 голоса на HuggingFace Daily Papers. Одна из первых 8B-моделей для всегда-включённого видеопотока с автономным управлением очередью речи — ближе к ассистенту реального времени, чем к чат-боту, с полным открытым релизом (модель + данные + система).

Стоит знать (5)

Alibaba выпускает Qwen-RobotSuite: три базовых модели для воплощённого ИИ

Alibaba / Qwen
модели/LLM офиц. + СМИ 4 ист. ~1 мин

Команда Qwen компании Alibaba выпустила Qwen-RobotSuite 16–17 июня 2026 года: Qwen-RobotManip (VLA для управления манипуляторами, обученная на 38 100+ часах данных), Qwen-RobotNav (навигация и следование инструкциям) и Qwen-RobotWorld (мировая модель для физически согласованных будущих состояний). RobotManip и RobotNav поставляются с открытыми репозиториями на GitHub.

Почему это важно
Первый открытый набор базовых моделей воплощённого ИИ от Alibaba, охватывающий манипуляцию, навигацию и моделирование мира — с открытыми GitHub-репозиториями для немедленного дообучения под различные робототехнические платформы.

Исследование Anthropic: успех в агентном программировании определяется экспертизой в предметной области, а не навыками программирования

Anthropic
исследования официальный 1 ист. ~1 мин

Anthropic опубликовала анализ ~400 000 сессий Claude Code от ~235 000 пользователей (октябрь 2025 — апрель 2026). Главный предиктор успеха — доменная экспертиза, а не опыт программирования: сессии экспертов завершаются успехом в 30%+ случаев против 15% у новичков; специалисты вне сферы IT (юристы, финансисты, управленцы) достигают почти тех же показателей, что и инженеры. Средняя ценность задачи выросла примерно на 27% за 7 месяцев по мере смещения акцентов с отладки к развёртыванию, анализу данных и написанию документов.

Почему это важно
Крупномасштабные эмпирические данные о том, что инструменты агентного программирования снижают барьеры входа за пределы круга программистов — доменные знания важнее навыков кодирования. Выводы имеют прямое отношение к трансформации рынка труда и корпоративному внедрению ИИ.

xAI запускает Grok для PowerPoint как бесплатный плагин Microsoft 365

xAI
инструменты офиц. + СМИ 3 ист. ~1 мин

xAI выпустила бесплатный плагин Microsoft 365, интегрирующий Grok в PowerPoint, 16 июня. Пользователи могут генерировать полные слайд-деки из текстовых запросов, реструктурировать слайды и применять оформление на естественном языке. Плагин подключается к актуальным данным X и веб-поиску, а также может обращаться к SharePoint, электронной почте и Google Drive через коннекторы Grok. PowerPoint — первое приложение Office; интеграции с Word и Excel запланированы.

Почему это важно
Первый плацдарм xAI внутри корпоративной экосистемы Microsoft Office: Grok вступает в прямую конкуренцию со встроенными функциями Microsoft Copilot для сотрудников, работающих с документами.

vLLM v0.23.0: Model Runner V2 по умолчанию для Llama и Mistral, Transformers v5, многоуровневый KV-кэш

инструменты официальный 1 ист. ~1 мин

vLLM v0.23.0 (15 июня, 408 коммитов, 200 контрибьюторов) устанавливает Model Runner V2 в качестве режима по умолчанию для плотных моделей Llama и Mistral, добавляет совместимость с Transformers v5, многоуровневое вытеснение KV-кэша со вторичным хранилищем на основе объектного хранилища, унифицированный парсер для рассуждений и вызовов инструментов, поддержку Gemma 4 без энкодера, а также улучшения Rust-фронтенда — потоковую генерацию и динамическую LoRA. Включает также усиление стабильности DeepSeek-V4 в продакшне и обновления ROCm 7.2.3 / FlashInfer v0.6.12.

Почему это важно
Расширение MRv2 на Llama и Mistral охватывает два наиболее широко развёртываемых семейства открытых моделей и устраняет пузыри при параллелизме по конвейеру. Унифицированный парсер упрощает интеграцию для рабочих процессов с вызовами инструментов и рассуждениями.

xAI переводит Grok Imagine Video 1.5 в общий доступ

xAI
видео офиц. + СМИ 2 ист. ~1 мин

xAI перевела Grok Imagine Video 1.5 из режима предварительного просмотра в общий доступ 16 июня, развернув модель через Imagine API, а также на grok.com и в мобильных приложениях. Модель анимирует статические изображения в видео с разрешением 720p/24fps с нативным аудио. Video 1.5 Fast генерирует 6-секундные клипы примерно за 25 секунд (против 40+ секунд в v1.0), ранее возглавив лидерборд Image-to-Video Arena с отрывом в 52 балла Elo.

Почему это важно
Модель xAI с лучшим рейтингом в категории image-to-video становится широко доступной для потребителей и через API, напрямую конкурируя с Veo и Runway при заметно более высокой скорости генерации.
Справочно (4)

ZPPO: дистилляция знаний через учителя-в-промптах превосходит градиентные методы для малых моделей рассуждений

NVIDIA
исследования официальный 2 ист. ~1 мин

Zone of Proximal Policy Optimization (ZPPO, arXiv 2606.18216) встраивает руководство учителя в промпты, а не в градиенты: формируются промпты, попарно сопоставляющие правильные ответы учителя с неверными ответами студента для контрастивного обучения, и промпты, агрегирующие ошибки студента для выявления паттернов неудач. Тестирование на моделях-студентах 0,8B–9B с учителем на 27B показало, что ZPPO превосходит бейзлайны дистилляции и RL — с наибольшим выигрышем для меньших моделей.

Почему это важно
Лидер HuggingFace Daily Papers за 17 июня (27 голосов). Подход «промпт как учитель» предлагает лёгкую альтернативу градиентной дистилляции для пост-тренировки малых моделей рассуждений.

Google DeepMind и правительство Великобритании объединяются для ускорения жилищного планирования с помощью Gemini

Google DeepMind
инструменты официальный 1 ист. ~1 мин

Google DeepMind объявила о партнёрстве с правительством Великобритании 16 июня для создания прототипа ИИ-системы для офицеров по планированию — с целью сократить время обработки заявок на жильё на 50%. Инструмент на базе Gemini автоматизирует консолидацию данных, идентификацию политик, обобщение отзывов и генерацию черновиков отчётов. Испытания пройдут в советах Barnet, Camden и Dorset, после чего запланировано общенациональное развёртывание в 2027 году.

Почему это важно
Развёртывание Gemini в масштабах государственного сектора для публичных услуг, связанное с целью Великобритании построить 1,5 млн жилых единиц, — демонстрация применения ИИ к резонансному политическому узкому месту с явными механизмами подотчётности.

Ollama v0.30.9: поддержка Cohere2Moe, исправлен баг с одиночным токеном в coding-агентах

инструменты официальный 1 ист. ~1 мин

Ollama v0.30.9 (15 июня) добавляет поддержку архитектуры Cohere2Moe, исправляет парсер LFM2 для случаев, когда мышление не было эмитировано, и устраняет баг, при котором coding-агенты, вызываемые через Ollama, выдавали только один токен. Добавлена явная ошибка при превышении контекстного окна одним сообщением.

Почему это важно
Баг с одиночным токеном напрямую блокировал работу Claude Code и аналогичных coding-агентов локально через Ollama — исправление разблокирует сетапы разработчиков с приоритетом локального запуска.

llama.cpp, сборки от 16 июня: спекулятивное декодирование Eagle3, память Vulkan UMA, исправления NVFP4

инструменты официальный 3 ист. ~1 мин

llama.cpp выпустила инкрементальные сборки b9660–b9672 16 июня. Ключевые изменения: поддержка спекулятивного декодирования Eagle3 в бэкенд-сэмплере (b9669), предпочтение Vulkan к host-visible памяти на UMA-устройствах (b9668), исправления граничных случаев NVFP4 в llama-graph (b9670), поддержка SYCL для Q4_K/Q5_K/Q6_K MoE MUL_MAT_ID (b9664), обновление вендорской копии BoringSSL до 0.20260616.0 (b9672).

Почему это важно
Спекулятивное декодирование Eagle3 в бэкенд-сэмплере распространяет самую быструю технику локального инференса на большее число аппаратных конфигураций. Оптимизация Vulkan UMA выгодна для встроенных GPU и устройств с унифицированной памятью Apple.