Ежедневный дайджест

14 июня 2026

14 пунктов · ~14 мин · Неделя 2026-W24

Обязательно к прочтению (4)

индустрия офиц. + СМИ 4 ист. ~1 мин

12 июня 2026 года Министерство торговли США выпустило директиву об экспортном контроле, предписывающую Anthropic заблокировать доступ к Claude Fable 5 и Mythos 5 для иностранных граждан — включая собственных сотрудников компании с иностранным гражданством. Поскольку избирательное правоприменение в реальном времени оказалось невозможным, Anthropic отключила обе модели глобально в течение нескольких часов после получения предписания. Компания выполнила требование, публично оспорив его необходимость: по мнению Anthropic, упомянутый в директиве джейлбрейк носил узкий, неуниверсальный характер и сопоставим со слабыми местами других коммерчески доступных моделей; компания предупредила, что применение этого стандарта в масштабах всей индустрии «фактически остановит все новые развёртывания моделей». Остальные модели Anthropic продолжали работу в штатном режиме. Claude Code v2.1.177 (13 июня) молча перенаправляет любой выбор модели Fable 5 на Claude Opus 4.8.

Почему это важно

Это первый случай, когда правительство США применило экспортный контроль, чтобы вынудить ведущую AI-компанию отозвать публично развёрнутые модели — затронув всех пользователей глобально, а не только иностранных граждан. Прецедент закладывает регуляторную основу для применения экспортного контроля к AI-моделям и сигнализирует об усилении государственного вмешательства в их развёртывание. Разработчики и предприятия, использующие Fable 5 в продакшне, оказались немедленно затронуты без какого-либо пути миграции.

#anthropic #claude-fable-5 #claude-mythos #regulation #policy #export-controls #safety #frontier-model

модели/LLM официальный 4 ист. ~1 мин

Moonshot AI выпустила Kimi K2.7-Code 12 июня 2026 года — веса опубликованы на HuggingFace (moonshotai/Kimi-K2.7-Code) под лицензией Modified MIT. Модель представляет собой MoE с 1 триллионом параметров и 32B активными параметрами на токен (384 эксперта, 8 активных), контекстным окном 256K токенов и визуальным энкодером MoonViT с 400M параметрами для обработки изображений и видео. Бенчмарки производителя: +21,8% на Kimi Code Bench v2, +11,0% на Program Bench и +31,5% на MLS Bench Lite по сравнению с K2.6 при примерно на 30% меньшем числе токенов рассуждения. Цены API: $0,95/$4,00 за миллион входных/выходных токенов. Cloudflare Workers AI добавила модель в день релиза.

Почему это важно

Kimi K2.7-Code — пятая крупная открытая модель для программирования, выпущенная Moonshot менее чем за год. При цене входных токенов ниже доллара, масштабе 1T параметров, контексте 256K и нативной поддержке зрения она напрямую конкурирует с DeepSeek V4-Flash и GLM-5.x в агентных задачах разработки ПО.

#kimi #moonshot-ai #open-weights #coding #agentic #moe #multimodal #long-context #china #release

исследования официальный 3 ист. ~1 мин

MiniMax опубликовала статью, представляющую блочный механизм разреженного внимания на основе Grouped Query Attention, который достигает сокращения вычислений внимания на токен в 28,4 раза при контексте 1M токенов, сохраняя качество полного внимания. Техника использует Index Branch для оценки и выбора релевантных блоков KV, при этом Main Branch выполняет точное внимание над выбранными блоками. Она лежит в основе MiniMax M3 — первой открытой модели, сочетающей frontier-возможности в программировании, контекст 1M токенов и нативную мультимодальность в единой архитектуре. Статья получила 251 апвоут на HuggingFace Daily Papers.

Почему это важно

Квадратичная стоимость внимания была главным барьером для практических контекстных окон в 1M токенов. Эта работа демонстрирует сокращение вычислений в 28 раз с пренебрежимо малой потерей качества и подкреплена производственной моделью — а не просто результатами статьи. 251 апвоут на HF Daily Papers отражает высокий интерес сообщества.

#minimax #long-context #attention #efficiency #inference #open-weights #paper #research

исследования официальный 2 ист. ~1 мин

MiniMax опубликовала MaxProof — фреймворк для обучения и масштабирования при инференсе математических доказательств с использованием серии моделей MiniMax M3. Обучаются три возможности: генерация доказательств, верификация и исправление с учётом критики, — с использованием генеративного верификатора, оптимизированного на низкую долю ложноположительных результатов. При инференсе модель одновременно выступает генератором, верификатором, улучшателем и ранжировщиком, выбирая итоговое доказательство посредством турнирного ранжирования. MaxProof достигает 35/42 на IMO 2025 и 36/42 на USAMO 2026, превышая порог золотой медали на обоих соревнованиях. Опубликована на arXiv (2606.13473) с 75 апвоутами на HuggingFace Daily Papers.

Почему это важно

Результат уровня золотой медали на IMO и USAMO одновременно от единой унифицированной открытой модели — а не ансамбля специализированных систем — означает значимый прогресс в формальных математических рассуждениях. 75 апвоутов на HF Daily Papers.

#minimax #mathematics #reasoning #reinforcement-learning #benchmark #paper #research #formal-reasoning

Стоит знать (8)

модели/LLM только СМИ 3 ист. ~1 мин

Zhipu AI (Z.ai) выпустила GLM-5.2 13 июня 2026 года, развернув модель на всех уровнях тарифного плана GLM Coding Plan (Lite, Pro, Max). Построенная на архитектуре MoE с 744B параметрами и 40B активными параметрами, модель предлагает контекстное окно в 1 миллион токенов (идентификатор модели: glm-5.2[1m]) и максимальный вывод 131K токенов. Введена двухрежимная система глубины размышления (режимы High и Max), разработанная для долгосрочных агентных задач разработки ПО. Общий доступ по API, интеграция в чат-бот Z.ai и открытые веса под лицензией MIT запланированы на следующую неделю. Сторонних бенчмарков на момент запуска опубликовано не было.

Почему это важно

GLM-5.2 усиливает вызов, который китайские open-source лаборатории бросают закрытым frontier-моделям: MIT-лицензированная модель для программирования с контекстом 1M токенов вышла в ту же неделю, когда две топовые модели Anthropic были отключены. 40B активных параметров MoE делают её развёртываемой на высокопроизводительных кластерах, а явный агентный фокус напрямую конкурирует с рабочими процессами Codex и Claude Code.

#glm #zai-org #open-weights #moe #long-context #coding #agentic #china #release #mit

исследования официальный 2 ист. ~1 мин

EvoArena — бенчмарк, моделирующий среды как последовательности прогрессивных обновлений в терминальной, программной и социальной областях, — выявляет пробел в текущей оценке агентов, предполагающей статичность среды. Лучшие агенты в настоящее время достигают лишь ~40% точности. В статье также предлагается EvoMem — парадигма памяти на основе патчей, фиксирующая изменения среды в виде структурированных историй обновлений; EvoMem улучшает точность на уровне цепочки на 3,7% на EvoArena и на 4–6% на бенчмарках GAIA и LoCoMo. Опубликована на arXiv (2606.13681) и получила 121 апвоут на HuggingFace Daily Papers.

Почему это важно

Практически все существующие бенчмарки агентов используют статичные среды. EvoArena принуждает к оценке в условиях непрерывных изменений, а порог в 40% показывает, насколько далеки текущие агенты от готовности к реальному применению. 121 апвоут на HF Daily Papers.

#agents #benchmark #memory #evaluation #agentic-ai #paper #research

исследования официальный 2 ист. ~1 мин

WeaveBench включает 114 реальных задач, требующих от AI-агентов сочетания наблюдений/действий в GUI с операциями CLI и кода в единой траектории — первый бенчмарк, явно нацеленный на этот гибридный интерфейсный сценарий. Лучшая из существующих frontier-моделей достигает лишь 41,2% успешных выполнений на этих долгосрочных задачах. Опубликован на arXiv (2606.09426) с 95 апвоутами на HuggingFace Daily Papers.

Почему это важно

Реальные компьютерные рабочие процессы постоянно переключаются между графическими интерфейсами и терминалом. WeaveBench — первый бенчмарк, требующий свободной гибридной работы в одной траектории, и он показывает, что даже frontier-агенты не справляются с более чем половиной реалистичных задач компьютерного использования. 95 апвоутов на HF Daily Papers.

#agents #benchmark #evaluation #agentic-ai #gui-agent #paper #research #computer-use

исследования официальный 3 ист. ~1 мин

InterleaveThinker — многоагентный пайплайн из планировщика и агента-критика, наделяющий любой генератор изображений способностью создавать перемежающиеся текстово-графические последовательности. Планировщик организует входные последовательности; критик оценивает результаты и уточняет инструкции для повторной генерации. Обучение использует SFT-датасеты (80K примеров для планировщика, 112K для критика) и обучение с подкреплением GRPO с пошаговыми наградами. Система достигает производительности, сопоставимой с моделями уровня GPT-5, на бенчмарках перемежающейся генерации (WISE, RISE). Опубликована на arXiv (2606.13679) с 124 апвоутами на HuggingFace Daily Papers.

Почему это важно

Перемежающаяся текстово-графическая генерация (иллюстрированные истории, воплощённые инструкции) — ключевая отсутствующая возможность в открытых мультимодальных системах. Это первая работа, применяющая RL к пайплайну «планировщик+критик» для данной задачи, достигающая уровня проприетарных frontier-моделей на релевантных бенчмарках. 124 апвоута на HF Daily Papers.

#multimodal #agents #rl #image-generation #paper #research #generation

инструменты офиц. + СМИ 2 ист. ~1 мин

Claude Code v2.1.177 вышел 13 июня 2026 года. В связи с директивой правительства США все выборы модели Fable 5 автоматически перенаправляются на Claude Opus 4.8 без каких-либо действий со стороны пользователя. Прочие изменения: заголовки сессий теперь генерируются на языке беседы (настраивается через параметр 'language'); новая настройка 'footerLinksRegexes' позволяет добавлять значки-ссылки в футер по регулярным выражениям; кеширование учётных данных Bedrock теперь учитывает фактическое время истечения токена вместо фиксированного 1-часового окна; патч безопасности закрывает лазейку, позволявшую обходить заблокированные модели через список разрешений 'availableModels'. Дополнительные исправления охватывают копирование/вставку через tmux SSH, переключение моделей в Remote Control и Linux sandbox со символическими ссылками на файлы настроек.

Почему это важно

Принудительное перенаправление Fable 5 → Opus 4.8 означает, что любой рабочий процесс Claude Code, настроенный под возможности Fable 5, молча понижается в качестве. Исправление учётных данных Bedrock важно для команд, выполняющих длительные CI/CD-задачи на AWS. Патч безопасности для обхода списка разрешений актуален для операторов, использующих 'availableModels' для ограничения доступа к моделям.

#claude-code #coding-agent #release #anthropic #amazon-bedrock #security #bug-fix #update

инструменты официальный 2 ист. ~1 мин

Moonshot AI открыла внутреннее тестирование Kimi Work 12 июня 2026 года — это загружаемое десктопное приложение для macOS/Windows, предназначенное для локального выполнения AI-агентов. Оно масштабируется до 300 параллельных субагентов, включает расширение браузера WebBridge, которое повторно использует существующие залогиненные браузерные сессии для автоматизации, поддерживает cron-расписание, доступ к локальным файлам, выполнение Python-скриптов и интеграцию с финансовыми данными рынков акций Китая (A-share), Гонконга и США. По имеющимся сведениям, работает на Kimi K2.6. Поддерживает вывод в форматах PowerPoint и Excel. Страница продукта доступна по адресу kimi.com/products/kimi-work.

Почему это важно

Kimi Work выходит на рынок локальных AI-агентов, конкурируя с такими инструментами, как Claude Code, благодаря рою из 300 субагентов и подходу WebBridge к повторному использованию учётных данных — снижая трудоёмкость автоматизации для работников умственного труда. Интеграция с китайскими финансовыми данными намекает на целевой корпоративный рынок в качестве дифференцирующего фактора.

#kimi #moonshot-ai #agents #agentic #multi-agent #desktop-agent #china #release #preview

инструменты официальный 3 ист. ~1 мин

12 июня 2026 года команда vLLM опубликовала запись в блоге, анонсировав поддержку инференса MiniMax M3 в день выхода — открытой модели с 456B параметрами, контекстным окном 1M токенов, нативным мультимодальным вводом и архитектурой MiniMax Sparse Attention (MSA) (открытые веса опубликованы приблизительно 10–11 июня). Для развёртывания требуется флаг '--block-size 128' из-за особенностей разреженного/индексного кеша MSA. AMD анонсировала одновременную поддержку в день выхода на GPU Instinct. На Fireworks AI модель M3 доступна по ценам, которые описываются как примерно в 20 раз ниже сопоставимых закрытых моделей.

Почему это важно

Поддержка движком инференса в день выхода означает, что практики могут немедленно запускать M3 локально или on-prem, не дожидаясь обновления фреймворков. На фоне отключения топовых моделей Anthropic, контекст 1M токенов M3 при эффективности MoE становится практичной альтернативой для пайплайнов обработки длинных документов и программирования.

#vllm #minimax #inference #open-weights #long-context #multimodal #moe #serving #open-source #release

видео официальный 2 ист. ~1 мин

ElevenLabs запустила Avatars в ElevenCreative — рабочий процесс, объединяющий AI-синтез речи компании с генерацией видео с синхронизацией губ. Пользователи загружают фотографию или пишут промпт для создания постоянной идентичности аватара, затем генерируют видео с различными ракурсами, нарядами и фонами, сохраняя консистентность образа. Голос и синхронизированное с губами видео создаются за один шаг. Новый узел Avatar в Flows обеспечивает пакетную генерацию по скриптам, языкам и голосам. Доступно на всех платных тарифах.

Почему это важно

ElevenLabs — преимущественно компания в области голосового AI — выходит непосредственно в создание видео, конкурируя с HeyGen и Synthesia и устраняя трение от использования множества инструментов, с которым сталкиваются предприятия. Интеграция пакетного пайплайна в Flows ориентирована на высокообъёмное многоязычное производство видео.

#elevenlabs #video-generation #tts #voice-ai #release #enterprise

Справочно (2)

исследования официальный 1 ист. ~1 мин

Anthropic опубликовала результаты своего первого Anthropic Public Record 12 июня 2026 года — опроса почти 52 000 американцев, измеряющего надежды, опасения и предпочтения в области управления AI, собранного в ноябре–декабре 2025 года. Данные выявили широкий двухпартийный консенсус по основным проблемам AI. Anthropic намерена регулярно повторять опрос и расширять его на международную аудиторию, позиционируя его как механизм обеспечения того, чтобы развитие AI отражало общественное мнение, выходящее за рамки существующей пользовательской базы Claude.

Почему это важно

Лаборатории редко публикуют систематические крупномасштабные исследования общественного мнения об AI. Публикация этих данных в открытом доступе — необычный шаг в плане прозрачности, а её тайминг — в тот же день, что и приостановка Fable 5, — добавляет контекст к более широким усилиям Anthropic по поддержанию доверия со стороны регуляторов и общества.

#anthropic #policy #safety #regulation #research

инструменты официальный 2 ист. ~1 мин

SST выпустила два релиза OpenCode 13 июня 2026 года. В v1.17.6 формально объявляются поддерживаемые возможности MCP-клиента OpenCode — устанавливается стабильный ориентир совместимости для авторов MCP-серверов. В v1.17.5 добавлена внешняя OAuth-аутентификация в браузере для Snowflake Cortex (позволяет проходить аутентификацию без встраивания учётных данных), улучшено управление копиями проектов и потоки перемещения сессий в v2 API, реализовано восстановление просроченных MCP-сессий вместо отключения инструментов, структурированный вывод MCP-инструментов возвращается в читаемом виде, исправлены дублирующиеся renderable ID, способные нарушить отрисовку TUI. На уровне десктопного слоя обновлены цветовые темы oc-2 и улучшена обработка изменения размера терминала.

Почему это важно

Объявление возможностей MCP-клиента в v1.17.6 даёт разработчикам MCP-серверов стабильный ориентир, снижая риск поломок из-за несовместимости протокола. OAuth для Snowflake Cortex делает OpenCode пригодным для корпоративных аналитических рабочих процессов без встраивания учётных данных.

#opencode #mcp #coding-agent #open-source #release #update

14 июня 2026

Обязательно к прочтению (4)

Правительство США обязало Anthropic отключить Claude Fable 5 и Mythos 5 по всему миру

Moonshot AI выпускает Kimi K2.7-Code: открытая модель с 1T параметрами для программирования и поддержкой зрения

MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества

MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике

Стоит знать (8)

Zhipu AI выпускает GLM-5.2: MoE с 744B параметрами, контекстом 1M токенов и фокусом на программирование

EvoArena: LLM-агенты набирают лишь 40% в динамически изменяющихся средах

WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений

InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений

Claude Code v2.1.177: принудительный откат Fable 5 на Opus 4.8, исправление кеширования Bedrock, патч безопасности

Moonshot AI открывает тестирование Kimi Work: десктопный агент с роем из 300 субагентов и WebBridge

vLLM добавляет поддержку MiniMax M3 с открытыми весами в день выхода: разреженное внимание с контекстом 1M токенов

ElevenLabs запускает Avatars в ElevenCreative: AI-видео с говорящей головой на базе TTS

Anthropic публикует первый Public Record: опрос 52 000 американцев об отношении к AI

OpenCode v1.17.5–v1.17.6: объявление возможностей MCP-клиента и OAuth для Snowflake