Ежедневный дайджест
14 пунктов · ~14 мин · Неделя 2026-W24
Обязательно к прочтению (4)
Правительство США обязало Anthropic отключить Claude Fable 5 и Mythos 5 по всему миру
Anthropic12 июня 2026 года Министерство торговли США выпустило директиву об экспортном контроле, предписывающую Anthropic заблокировать доступ к Claude Fable 5 и Mythos 5 для иностранных граждан — включая собственных сотрудников компании с иностранным гражданством. Поскольку избирательное правоприменение в реальном времени оказалось невозможным, Anthropic отключила обе модели глобально в течение нескольких часов после получения предписания. Компания выполнила требование, публично оспорив его необходимость: по мнению Anthropic, упомянутый в директиве джейлбрейк носил узкий, неуниверсальный характер и сопоставим со слабыми местами других коммерчески доступных моделей; компания предупредила, что применение этого стандарта в масштабах всей индустрии «фактически остановит все новые развёртывания моделей». Остальные модели Anthropic продолжали работу в штатном режиме. Claude Code v2.1.177 (13 июня) молча перенаправляет любой выбор модели Fable 5 на Claude Opus 4.8.
Moonshot AI выпускает Kimi K2.7-Code: открытая модель с 1T параметрами для программирования и поддержкой зрения
Moonshot AIMoonshot AI выпустила Kimi K2.7-Code 12 июня 2026 года — веса опубликованы на HuggingFace (moonshotai/Kimi-K2.7-Code) под лицензией Modified MIT. Модель представляет собой MoE с 1 триллионом параметров и 32B активными параметрами на токен (384 эксперта, 8 активных), контекстным окном 256K токенов и визуальным энкодером MoonViT с 400M параметрами для обработки изображений и видео. Бенчмарки производителя: +21,8% на Kimi Code Bench v2, +11,0% на Program Bench и +31,5% на MLS Bench Lite по сравнению с K2.6 при примерно на 30% меньшем числе токенов рассуждения. Цены API: $0,95/$4,00 за миллион входных/выходных токенов. Cloudflare Workers AI добавила модель в день релиза.
MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества
MiniMaxMiniMax опубликовала статью, представляющую блочный механизм разреженного внимания на основе Grouped Query Attention, который достигает сокращения вычислений внимания на токен в 28,4 раза при контексте 1M токенов, сохраняя качество полного внимания. Техника использует Index Branch для оценки и выбора релевантных блоков KV, при этом Main Branch выполняет точное внимание над выбранными блоками. Она лежит в основе MiniMax M3 — первой открытой модели, сочетающей frontier-возможности в программировании, контекст 1M токенов и нативную мультимодальность в единой архитектуре. Статья получила 251 апвоут на HuggingFace Daily Papers.
MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике
MiniMaxMiniMax опубликовала MaxProof — фреймворк для обучения и масштабирования при инференсе математических доказательств с использованием серии моделей MiniMax M3. Обучаются три возможности: генерация доказательств, верификация и исправление с учётом критики, — с использованием генеративного верификатора, оптимизированного на низкую долю ложноположительных результатов. При инференсе модель одновременно выступает генератором, верификатором, улучшателем и ранжировщиком, выбирая итоговое доказательство посредством турнирного ранжирования. MaxProof достигает 35/42 на IMO 2025 и 36/42 на USAMO 2026, превышая порог золотой медали на обоих соревнованиях. Опубликована на arXiv (2606.13473) с 75 апвоутами на HuggingFace Daily Papers.
Стоит знать (8)
Zhipu AI выпускает GLM-5.2: MoE с 744B параметрами, контекстом 1M токенов и фокусом на программирование
Zhipu AIZhipu AI (Z.ai) выпустила GLM-5.2 13 июня 2026 года, развернув модель на всех уровнях тарифного плана GLM Coding Plan (Lite, Pro, Max). Построенная на архитектуре MoE с 744B параметрами и 40B активными параметрами, модель предлагает контекстное окно в 1 миллион токенов (идентификатор модели: glm-5.2[1m]) и максимальный вывод 131K токенов. Введена двухрежимная система глубины размышления (режимы High и Max), разработанная для долгосрочных агентных задач разработки ПО. Общий доступ по API, интеграция в чат-бот Z.ai и открытые веса под лицензией MIT запланированы на следующую неделю. Сторонних бенчмарков на момент запуска опубликовано не было.
EvoArena: LLM-агенты набирают лишь 40% в динамически изменяющихся средах
MIT / NUS / SalesforceEvoArena — бенчмарк, моделирующий среды как последовательности прогрессивных обновлений в терминальной, программной и социальной областях, — выявляет пробел в текущей оценке агентов, предполагающей статичность среды. Лучшие агенты в настоящее время достигают лишь ~40% точности. В статье также предлагается EvoMem — парадигма памяти на основе патчей, фиксирующая изменения среды в виде структурированных историй обновлений; EvoMem улучшает точность на уровне цепочки на 3,7% на EvoArena и на 4–6% на бенчмарках GAIA и LoCoMo. Опубликована на arXiv (2606.13681) и получила 121 апвоут на HuggingFace Daily Papers.
WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений
Microsoft ResearchWeaveBench включает 114 реальных задач, требующих от AI-агентов сочетания наблюдений/действий в GUI с операциями CLI и кода в единой траектории — первый бенчмарк, явно нацеленный на этот гибридный интерфейсный сценарий. Лучшая из существующих frontier-моделей достигает лишь 41,2% успешных выполнений на этих долгосрочных задачах. Опубликован на arXiv (2606.09426) с 95 апвоутами на HuggingFace Daily Papers.
InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений
CUHK Multimedia LabInterleaveThinker — многоагентный пайплайн из планировщика и агента-критика, наделяющий любой генератор изображений способностью создавать перемежающиеся текстово-графические последовательности. Планировщик организует входные последовательности; критик оценивает результаты и уточняет инструкции для повторной генерации. Обучение использует SFT-датасеты (80K примеров для планировщика, 112K для критика) и обучение с подкреплением GRPO с пошаговыми наградами. Система достигает производительности, сопоставимой с моделями уровня GPT-5, на бенчмарках перемежающейся генерации (WISE, RISE). Опубликована на arXiv (2606.13679) с 124 апвоутами на HuggingFace Daily Papers.
Claude Code v2.1.177: принудительный откат Fable 5 на Opus 4.8, исправление кеширования Bedrock, патч безопасности
AnthropicClaude Code v2.1.177 вышел 13 июня 2026 года. В связи с директивой правительства США все выборы модели Fable 5 автоматически перенаправляются на Claude Opus 4.8 без каких-либо действий со стороны пользователя. Прочие изменения: заголовки сессий теперь генерируются на языке беседы (настраивается через параметр 'language'); новая настройка 'footerLinksRegexes' позволяет добавлять значки-ссылки в футер по регулярным выражениям; кеширование учётных данных Bedrock теперь учитывает фактическое время истечения токена вместо фиксированного 1-часового окна; патч безопасности закрывает лазейку, позволявшую обходить заблокированные модели через список разрешений 'availableModels'. Дополнительные исправления охватывают копирование/вставку через tmux SSH, переключение моделей в Remote Control и Linux sandbox со символическими ссылками на файлы настроек.
Moonshot AI открывает тестирование Kimi Work: десктопный агент с роем из 300 субагентов и WebBridge
Moonshot AIMoonshot AI открыла внутреннее тестирование Kimi Work 12 июня 2026 года — это загружаемое десктопное приложение для macOS/Windows, предназначенное для локального выполнения AI-агентов. Оно масштабируется до 300 параллельных субагентов, включает расширение браузера WebBridge, которое повторно использует существующие залогиненные браузерные сессии для автоматизации, поддерживает cron-расписание, доступ к локальным файлам, выполнение Python-скриптов и интеграцию с финансовыми данными рынков акций Китая (A-share), Гонконга и США. По имеющимся сведениям, работает на Kimi K2.6. Поддерживает вывод в форматах PowerPoint и Excel. Страница продукта доступна по адресу kimi.com/products/kimi-work.
vLLM добавляет поддержку MiniMax M3 с открытыми весами в день выхода: разреженное внимание с контекстом 1M токенов
MiniMax12 июня 2026 года команда vLLM опубликовала запись в блоге, анонсировав поддержку инференса MiniMax M3 в день выхода — открытой модели с 456B параметрами, контекстным окном 1M токенов, нативным мультимодальным вводом и архитектурой MiniMax Sparse Attention (MSA) (открытые веса опубликованы приблизительно 10–11 июня). Для развёртывания требуется флаг '--block-size 128' из-за особенностей разреженного/индексного кеша MSA. AMD анонсировала одновременную поддержку в день выхода на GPU Instinct. На Fireworks AI модель M3 доступна по ценам, которые описываются как примерно в 20 раз ниже сопоставимых закрытых моделей.
ElevenLabs запускает Avatars в ElevenCreative: AI-видео с говорящей головой на базе TTS
ElevenLabsElevenLabs запустила Avatars в ElevenCreative — рабочий процесс, объединяющий AI-синтез речи компании с генерацией видео с синхронизацией губ. Пользователи загружают фотографию или пишут промпт для создания постоянной идентичности аватара, затем генерируют видео с различными ракурсами, нарядами и фонами, сохраняя консистентность образа. Голос и синхронизированное с губами видео создаются за один шаг. Новый узел Avatar в Flows обеспечивает пакетную генерацию по скриптам, языкам и голосам. Доступно на всех платных тарифах.
Справочно (2)
Anthropic публикует первый Public Record: опрос 52 000 американцев об отношении к AI
AnthropicAnthropic опубликовала результаты своего первого Anthropic Public Record 12 июня 2026 года — опроса почти 52 000 американцев, измеряющего надежды, опасения и предпочтения в области управления AI, собранного в ноябре–декабре 2025 года. Данные выявили широкий двухпартийный консенсус по основным проблемам AI. Anthropic намерена регулярно повторять опрос и расширять его на международную аудиторию, позиционируя его как механизм обеспечения того, чтобы развитие AI отражало общественное мнение, выходящее за рамки существующей пользовательской базы Claude.
OpenCode v1.17.5–v1.17.6: объявление возможностей MCP-клиента и OAuth для Snowflake
SSTSST выпустила два релиза OpenCode 13 июня 2026 года. В v1.17.6 формально объявляются поддерживаемые возможности MCP-клиента OpenCode — устанавливается стабильный ориентир совместимости для авторов MCP-серверов. В v1.17.5 добавлена внешняя OAuth-аутентификация в браузере для Snowflake Cortex (позволяет проходить аутентификацию без встраивания учётных данных), улучшено управление копиями проектов и потоки перемещения сессий в v2 API, реализовано восстановление просроченных MCP-сессий вместо отключения инструментов, структурированный вывод MCP-инструментов возвращается в читаемом виде, исправлены дублирующиеся renderable ID, способные нарушить отрисовку TUI. На уровне десктопного слоя обновлены цветовые темы oc-2 и улучшена обработка изменения размера терминала.