Ежедневный дайджест
22 пункта · ~22 мин · Неделя 2026-W27
Обязательно к прочтению (4)
США снимают экспортные ограничения с Claude Fable 5 и Mythos 5 от Anthropic
AnthropicМинистерство торговли США отменило требование экспортного лицензирования для Claude Fable 5 и Mythos 5, действовавшее с 12 июня под предлогом угроз национальной безопасности. Anthropic объявила об этом решении 30 июня; Fable 5 вернулась к глобальным пользователям 1 июля, Mythos 5 восстановлена для ограниченного круга организаций в США. Anthropic обязалась проактивно выявлять риски безопасности и совместно с Amazon, Microsoft и Google разработать систему оценки серьёзности джейлбрейков.
Anthropic выпускает Claude Sonnet 5 в качестве новой модели по умолчанию
AnthropicAnthropic выпустила Claude Sonnet 5 30 июня, сделав её моделью по умолчанию для пользователей Free и Pro. По производительности модель вплотную приближается к Opus 4.8 в задачах кодирования, агентной работы и профессионального использования, с вводным API-ценообразованием $2/$10 за миллион токенов (ввод/вывод) до 31 августа 2026 года.
Orca: общая фундаментальная модель мира от BAAI, обученная на 125K часов видео
BAAIOrca — общая фундаментальная модель мира от BAAI, обученная на 125K часов видео и 160M аннотациях событий. Вводит Next-State-Prediction как унифицированную цель обучения, сочетающую бессознательное обучение на плотных видеопереходах и сознательное обучение на событиях, описанных на естественном языке. По оценкам в задачах генерации текста, предсказания изображений и воплощённых действий превосходит специализированные базовые модели сравнимого масштаба по всем трём модальностям.
Публичный запуск ByteDance Seedance 2.5: нативное 4K-видео длительностью 30 секунд
ByteDanceByteDance открыла публичный доступ к Seedance 2.5 в начале июля через Dreamina и API Volcano Engine. Модель генерирует единый непрерывный клип длительностью 30 секунд в нативном 4K (10-битный цвет) за один инференс-вызов — против 10-секундного предела Seedance 2.0. Принимает до 50 мультимодальных референсных материалов одновременно (изображения, видеоклипы, аудио), обеспечивая высокую согласованность персонажей и стиля, а также локальное редактирование для перерисовки отдельных регионов без регенерации всего клипа.
Стоит знать (11)
Dockerless: верификатор программ без окружения для агентов кодирования
ByteDanceDockerless — верификатор патчей кода, оценивающий корректность через агентное исследование репозитория вместо выполнения тестов в Docker-контейнерах. Превосходит наиболее сильный открытый верификатор на основе исполнения на 14,3 пункта AUC и достигает 62,0% успешного решения на SWE-bench Verified при использовании как для фильтрации траекторий, так и для генерации RL-наград, обеспечивая полностью бессредовый пайплайн дообучения агентов кодирования.
ByteDance публикует карточку модели Seed2.0
ByteDanceКоманда Seed компании ByteDance опубликовала карточку модели Seed2.0 — фронтирной модели, ориентированной на редкие знания и выполнение сложных инструкций. Модель демонстрирует высокую производительность в задачах рассуждения, визуального понимания и поиска, а методология оценки строится на реалистичных сложных сценариях, а не на синтетических бенчмарках.
DOPD: двойная on-policy дистилляция с advantage-aware маршрутизацией токенов
DOPD решает проблему «иллюзии привилегии» в on-policy дистилляции знаний, вводя advantage-aware парадигму двойной дистилляции, которая маршрутизирует обучающий сигнал токен за токеном между учителем и учеником на основе их разрыва в advantage. Метод стабильно улучшает стандартную on-policy дистилляцию как для LLM, так и для VLM, с подтверждёнными улучшениями в непрерывном обучении и устойчивости к out-of-distribution данным.
Anthropic запускает Claude Science — AI-воркбенч для исследователей
AnthropicAnthropic запустила Claude Science в бета-версии 30 июня — десктопный AI-воркбенч, интегрирующий Claude с локальным выполнением кода, 60+ научными базами данных (геномика, протеомика, структурная биология, хемоинформатика), специализированными субагентами и агентом-рецензентом, автоматически проверяющим цитаты и вычисления. Доступно на macOS и Linux для пользователей тарифов Pro, Max, Team и Enterprise.
Яндекс запускает платформу AI-агентов для Alice AI
YandexЯндекс представил платформу для создания и интеграции AI-агентов в Alice AI, анонсированную 29 июня. Первые агенты — Яндекс Такси (голосовые запросы на поездки) и Яндекс Лавка (заказ продуктов). Платформа позволяет агентам понимать естественный язык, планировать многошаговые последовательности действий и учитывать контекст, например время и погоду. Открытие для сторонних компаний запланировано на конец 2026 года.
Claude Code v2.1.198: Claude in Chrome в GA и автоматические PR от фоновых агентов
AnthropicClaude Code v2.1.198 (1 июля) выпускает Claude in Chrome в общую доступность, позволяя агентам управлять браузером в рамках рабочих процессов кодирования. Фоновые агенты, запущенные из `claude agents`, теперь автоматически коммитят результаты работы, пушат ветку и открывают черновик PR по завершении. Также добавлены: уведомления от фоновых агентов, наследование моделью Explore-агента основной сессии и распространение конфигурации расширенного мышления на субагентов.
Browser Tools для GitHub Copilot стали общедоступны в VS Code
GitHubИнструменты для работы с браузером в GitHub Copilot для VS Code стали общедоступны с 1 июля. Агенты Copilot теперь могут открывать страницы и навигировать, кликать, вводить текст, наводить курсор, перетаскивать элементы и делать скриншоты живых веб-приложений, передавая результаты обратно в контекст чата. Меры защиты конфиденциальности сохраняют приватность вкладок браузера до явного согласия пользователя, страницы, открытые агентом, работают в изолированных сессиях, а операции с высоким риском требуют явного подтверждения.
GitHub Copilot Vision стал общедоступен для всех тарифных планов
GitHubCopilot vision теперь общедоступен для всех уровней подписки — Free, Pro, Pro+, Business и Enterprise — с 1 июля. Разработчики могут прикреплять изображения (JPEG, PNG, GIF, WebP) и PDF-документы непосредственно к запросам Copilot Chat через вставку, перетаскивание или контекстное меню в VS Code, github.com и Copilot CLI.
vLLM v0.24.0: Model Runner V2 по умолчанию, Rust-фронтенд, ускорение SM90 FP8
vLLMvLLM v0.24.0 (выпущен около 30 июня) включает 571 коммит от 256 контрибьюторов. Model Runner V2 теперь является движком по умолчанию для квантизированных моделей, а также для плотных моделей Llama и Mistral. Rust-фронтенд готов к продакшену с аутентификацией по API-ключу, CORS и новыми эндпоинтами токенизации. Ядра SM90 CUTLASS FP8 обеспечивают ускорение 180–290% на оборудовании класса H100. DeepSeek-V4 получает кэширование sparse-индекса через FlashInfer, а в числе новых поддерживаемых моделей — MiniMax-M3 и DiffusionGemma.
Cursor 3.9: публичная iOS-бета и расширение Team MCP Marketplace
CursorCursor выпустил два обновления в рамках отчётного периода: версия 3.9 (29 июня) запустила публичную iOS-бету для всех платных планов, позволяя разработчикам запускать и управлять облачными агентами кодирования с мобильного устройства через голосовой ввод и отслеживать активность в реальном времени на экране блокировки. 30 июня поддержка Team Marketplace была расширена на Team MCP серверы — администраторы настраивают MCP-серверы один раз, и они автоматически распределяются на облачные агенты, окно Agents, IDE и CLI.
Google выпускает Gemini Omni Flash для генерации видео через API
Google DeepMindGoogle выпустила Gemini Omni Flash 30 июня — мультимодальную модель для генерации видео и разговорного редактирования видео, доступную через Google AI Studio и Gemini API по цене $0,10 за секунду видеовывода. В GA также вышла Gemini 3.1 Flash-Lite Image. Обе доступны на Gemini Enterprise Agent Platform и одновременно интегрированы в YouTube Shorts Remix и YouTube Create.
Справочно (7)
BlockPilot: адаптивный размер блока для диффузионного спекулятивного декодирования
BlockPilot показывает, что оптимальный размер блока в диффузионном спекулятивном декодировании варьируется в зависимости от входных данных, и формулирует выбор размера блока как лёгкую политику, обучаемую на представлении префиллинга. Применительно к Qwen3-4B достигает длины принятия 5,92 токена и ускорения инференса в 4,20× при температуре T=1 с пренебрежимо малыми накладными расходами и работает как plug-and-play поверх существующих систем спекулятивного декодирования.
VK запускает Discovery AI с нейросетевым поиском в VK Видео, Mail Media и Дзен
VK AIVK начал внедрять Discovery AI — генеративный AI-поиск на базе собственного LLM — в VK Видео, медиапроекты Mail.ru и Дзен. Система формирует персонализированные ответы на поисковые запросы менее чем за 0,5 секунды, поддерживает режим Deep Research для детального изучения тем и адаптируется под задачи каждого продукта. Discovery AI объединяет инфраструктуру поиска, рекомендаций и персонализации VK.
xAI запускает Grok Voice Agent Builder для развёртывания голосовых AI-агентов без кода
xAIxAI запустила Voice Agent Builder 1 июля — no-code платформу, объединяющую распознавание речи, инференс языковой модели и синтез речи в едином интерфейсе для создания продакшн-голосовых агентов на базе Grok Voice. Платформа включает встроенную телефонию, поиск по базе знаний, поддержку инструментов/MCP, защитные ограждения и наблюдаемость по цене $0,05 за минуту с поддержкой 25+ языков.
Ollama v0.31.1: Gemma 4 почти на 90% быстрее на Apple Silicon через MTP
OllamaOllama v0.31.1 (30 июня) обеспечивает примерно на 90% более быструю генерацию токенов Gemma 4 на Apple Silicon посредством multi-token prediction (MTP) с автоматической настройкой, включённой по умолчанию — конфигурация не требуется. Релиз также обновляет движок MLX с новым ядром матричного умножения для малых батчей и обновляет бэкенд llama.cpp до сборки 9840.
OpenCode v1.17.13: исправления режима рассуждений и поиск в выборе модели
SSTOpenCode v1.17.13 (1 июля) улучшает основной режим рассуждений для OpenAI-совместимых моделей и исправляет обработку устаревших ответов в провайдере GitHub Copilot. Десктопный клиент получает поиск в списке моделей, превью вкладок сессий при наведении и упрощённый процесс настройки WSL-сервера. Улучшена изоляция сессий — сбой на одной странице сессии больше не затрагивает другие.
OpenAI Codex v0.142.5: патч безопасности для утечки данных через лог трассировки WebSocket
OpenAICodex v0.142.5 (1 июля) устраняет уязвимость, при которой полные payload-ы WebSocket-запросов Responses могли записываться в логи трассировки, потенциально раскрывая конфиденциальные данные запросов — включая код, пути к файлам и учётные данные — в локально хранящихся файлах трассировки. Пользовательских изменений функциональности в этом релизе нет.
ВКонтакте внедряет LLM и VLM для товарных рекомендаций в ленте
VK AIAI-инженеры VK развернули модели на базе LLM и VLM в основной ленте ВКонтакте и VK Клипах для улучшения рекомендаций контента из магазинов авторов. Модели анализируют все взаимодействия пользователей вместе с более широкими сигналами интересов. Результаты после запуска: CTR по карточкам товаров вырос в 5 раз, переходы на маркетплейс — в 15 раз, заказы из авторских магазинов — в 20 раз.