Ежедневный дайджест
12 пунктов · ~12 мин · Неделя 2026-W25
Обязательно к прочтению (3)
Zhipu AI открывает GLM-5.2 под лицензией MIT с контекстом 1M токенов
Zhipu AIZhipu AI опубликовала открытые веса GLM-5.2 на HuggingFace под лицензией MIT около 16 июня 2026 года. Модель построена на архитектуре MoE с 753B параметрами, поддерживает контекстное окно в 1 миллион токенов, ориентирована прежде всего на написание кода и оснащена двойной системой управления усилием мышления — без региональных ограничений. Репозиторий: zai-org/GLM-5.2.
VibeThinker-3B достигает показателей frontier-уровня на бенчмарках рассуждений через curriculum RL
WeiboAIVibeThinker-3B (arXiv 2606.16140, 15 июня) достигает 94,3 на AIME26 (97,1 при масштабировании тестового времени), 80,2 Pass@1 на LiveCodeBench v6 и 96,1% принятых решений на незнакомых контестах LeetCode — с применением curriculum SFT, многодоменного RL и офлайн-самодистилляции на плотной модели с 3B параметрами. Авторы предлагают Гипотезу параметрического сжатия и покрытия: рассуждения компрессируются в компактные модели, тогда как широкие фактические знания требуют большего числа параметров.
JoyAI-VL-Interaction: открытая VLM на 8B для взаимодействия в реальном времени с автономным управлением очередью речи
JD.comJoyAI-VL-Interaction (arXiv 2606.14777) — VLM на 8B для непрерывного взаимодействия с видеопотоком в реальном времени: модель наблюдает за живым видеопотоком и автономно решает, когда говорить, а когда молчать. Выпущена вместе с рецептом обучения, временно-выровненными данными взаимодействия и полностью развёртываемой открытой системой (подключаемые ASR/TTS, память, API фонового агента). Люди-оценщики предпочли её ассистентам Doubao и Gemini в шести реальных сценариях.
Стоит знать (5)
Alibaba выпускает Qwen-RobotSuite: три базовых модели для воплощённого ИИ
Alibaba / QwenКоманда Qwen компании Alibaba выпустила Qwen-RobotSuite 16–17 июня 2026 года: Qwen-RobotManip (VLA для управления манипуляторами, обученная на 38 100+ часах данных), Qwen-RobotNav (навигация и следование инструкциям) и Qwen-RobotWorld (мировая модель для физически согласованных будущих состояний). RobotManip и RobotNav поставляются с открытыми репозиториями на GitHub.
Исследование Anthropic: успех в агентном программировании определяется экспертизой в предметной области, а не навыками программирования
AnthropicAnthropic опубликовала анализ ~400 000 сессий Claude Code от ~235 000 пользователей (октябрь 2025 — апрель 2026). Главный предиктор успеха — доменная экспертиза, а не опыт программирования: сессии экспертов завершаются успехом в 30%+ случаев против 15% у новичков; специалисты вне сферы IT (юристы, финансисты, управленцы) достигают почти тех же показателей, что и инженеры. Средняя ценность задачи выросла примерно на 27% за 7 месяцев по мере смещения акцентов с отладки к развёртыванию, анализу данных и написанию документов.
xAI запускает Grok для PowerPoint как бесплатный плагин Microsoft 365
xAIxAI выпустила бесплатный плагин Microsoft 365, интегрирующий Grok в PowerPoint, 16 июня. Пользователи могут генерировать полные слайд-деки из текстовых запросов, реструктурировать слайды и применять оформление на естественном языке. Плагин подключается к актуальным данным X и веб-поиску, а также может обращаться к SharePoint, электронной почте и Google Drive через коннекторы Grok. PowerPoint — первое приложение Office; интеграции с Word и Excel запланированы.
vLLM v0.23.0: Model Runner V2 по умолчанию для Llama и Mistral, Transformers v5, многоуровневый KV-кэш
vLLM v0.23.0 (15 июня, 408 коммитов, 200 контрибьюторов) устанавливает Model Runner V2 в качестве режима по умолчанию для плотных моделей Llama и Mistral, добавляет совместимость с Transformers v5, многоуровневое вытеснение KV-кэша со вторичным хранилищем на основе объектного хранилища, унифицированный парсер для рассуждений и вызовов инструментов, поддержку Gemma 4 без энкодера, а также улучшения Rust-фронтенда — потоковую генерацию и динамическую LoRA. Включает также усиление стабильности DeepSeek-V4 в продакшне и обновления ROCm 7.2.3 / FlashInfer v0.6.12.
xAI переводит Grok Imagine Video 1.5 в общий доступ
xAIxAI перевела Grok Imagine Video 1.5 из режима предварительного просмотра в общий доступ 16 июня, развернув модель через Imagine API, а также на grok.com и в мобильных приложениях. Модель анимирует статические изображения в видео с разрешением 720p/24fps с нативным аудио. Video 1.5 Fast генерирует 6-секундные клипы примерно за 25 секунд (против 40+ секунд в v1.0), ранее возглавив лидерборд Image-to-Video Arena с отрывом в 52 балла Elo.
Справочно (4)
ZPPO: дистилляция знаний через учителя-в-промптах превосходит градиентные методы для малых моделей рассуждений
NVIDIAZone of Proximal Policy Optimization (ZPPO, arXiv 2606.18216) встраивает руководство учителя в промпты, а не в градиенты: формируются промпты, попарно сопоставляющие правильные ответы учителя с неверными ответами студента для контрастивного обучения, и промпты, агрегирующие ошибки студента для выявления паттернов неудач. Тестирование на моделях-студентах 0,8B–9B с учителем на 27B показало, что ZPPO превосходит бейзлайны дистилляции и RL — с наибольшим выигрышем для меньших моделей.
Google DeepMind и правительство Великобритании объединяются для ускорения жилищного планирования с помощью Gemini
Google DeepMindGoogle DeepMind объявила о партнёрстве с правительством Великобритании 16 июня для создания прототипа ИИ-системы для офицеров по планированию — с целью сократить время обработки заявок на жильё на 50%. Инструмент на базе Gemini автоматизирует консолидацию данных, идентификацию политик, обобщение отзывов и генерацию черновиков отчётов. Испытания пройдут в советах Barnet, Camden и Dorset, после чего запланировано общенациональное развёртывание в 2027 году.
Ollama v0.30.9: поддержка Cohere2Moe, исправлен баг с одиночным токеном в coding-агентах
Ollama v0.30.9 (15 июня) добавляет поддержку архитектуры Cohere2Moe, исправляет парсер LFM2 для случаев, когда мышление не было эмитировано, и устраняет баг, при котором coding-агенты, вызываемые через Ollama, выдавали только один токен. Добавлена явная ошибка при превышении контекстного окна одним сообщением.
llama.cpp, сборки от 16 июня: спекулятивное декодирование Eagle3, память Vulkan UMA, исправления NVFP4
llama.cpp выпустила инкрементальные сборки b9660–b9672 16 июня. Ключевые изменения: поддержка спекулятивного декодирования Eagle3 в бэкенд-сэмплере (b9669), предпочтение Vulkan к host-visible памяти на UMA-устройствах (b9668), исправления граничных случаев NVFP4 в llama-graph (b9670), поддержка SYCL для Q4_K/Q5_K/Q6_K MoE MUL_MAT_ID (b9664), обновление вендорской копии BoringSSL до 0.20260616.0 (b9672).