Ежедневный дайджест
18 пунктов · ~18 мин · Неделя 2026-W26
Обязательно к прочтению (3)
ByteDance представляет Doubao-Seed-2.1-Pro на конференции Volcano Engine FORCE
ByteDanceByteDance представила Doubao-Seed-2.1-Pro 23 июня на конференции Volcano Engine FORCE в Пекине — производственную frontier-LLM для задач кодирования, долгосрочных агентных задач и мультимодального понимания. Также выпущена Doubao-Seed-2.1-Turbo вдвое дешевле (6 юаней за миллион входных токенов / 30 юаней за миллион выходных у Pro). ByteDance заявляет о паритете с GPT-5.5 на бенчмарках по кодированию и агентным задачам, занимая первые места на OSWorld, MobileWorld и MMMU-Pro. Семейство Doubao теперь превышает 180 триллионов токенов в сутки — рост в 10 раз год к году.
Anthropic запускает Claude Tag — постоянного AI-участника команды в Slack
AnthropicAnthropic запустила Claude Tag в бета-версии 23 июня 2026 года для клиентов Claude Enterprise и Team. Функция добавляет Claude в Slack как постоянного мультипользовательского участника команды, которого можно вызывать через @-упоминание для делегирования задач. Claude со временем обучается на истории каналов, может работать асинхронно, а при включении ambient mode — проактивно сообщает о релевантной информации без явных запросов. Функция работает на базе Claude Opus 4.8 и заменяет существующее приложение Claude for Slack. По данным Anthropic, внутренняя версия уже генерирует 65% кода продуктовой команды компании.
OpenAI расширяет Daybreak: полный релиз GPT-5.5-Cyber, плагин Codex Security и Patch the Planet
OpenAI22 июня 2026 года OpenAI расширила свою платформу кибербезопасности Daybreak: выпустила GPT-5.5-Cyber в полном релизе (85,6% на CyberGym — наивысший результат среди одиночных моделей на сегодняшний день), плагин Codex Security для поиска и устранения уязвимостей в рамках разработческих воркфлоу, а также «Patch the Planet» — open-source-инициативу, основанную совместно с Trail of Bits. Доступ к GPT-5.5-Cyber по-прежнему ограничен верифицированными специалистами по защите. В партнёрской программе Cyber Partner Program теперь более 20 вендоров, включая Cisco, CrowdStrike, Palo Alto Networks и Cloudflare; более 30 open-source-проектов — cURL, Go, Python и другие — присоединились к Patch the Planet.
Стоит знать (9)
Krea публикует открытые веса Krea 2 Raw и Turbo: 12B DiT-модель генерации изображений за 2 секунды
KreaKrea опубликовала открытые веса Krea 2 22 июня 2026 года на Hugging Face по кастомной сообщественной лицензии (коммерческое использование требует корпоративного соглашения для организаций с 50+ рабочими местами). Два варианта: Krea 2 Raw (базовый чекпойнт до RLHF, из середины обучения) и Krea 2 Turbo (дистиллированный, дообученный). 12B Diffusion Transformer генерирует изображения примерно за 2 секунды в режиме Turbo. По данным Krea, сервисом пользуются 30 миллионов пользователей в 191 стране.
Google DeepMind и A24 объявляют о партнёрстве в области AI-исследований на $75 млн для киноиндустрии
Google DeepMindGoogle DeepMind инвестировала $75 млн в кинокомпанию A24 и объявила о многолетнем неэксклюзивном партнёрстве в области исследований и разработок 22 июня 2026 года. Исследователи DeepMind будут работать вместе с кинематографистами A24 на активных съёмочных площадках для создания AI-воркфлоу на базе Veo. Это первая в истории Google инвестиция в виде доли в кинокомпании.
Беспилотный грузовик Яндекса совершил первый полностью автономный рейс Москва–Санкт-Петербург протяжённостью 700 км
Yandex23 июня 2026 года автономный грузовик Яндекса «Роботрак» преодолел 700 км без водителя по трассе М-11 от Москвы до Санкт-Петербурга — первый подобный случай в России. AI-система самостоятельно выполняла обгоны, проезжала через зоны дорожных работ и оплачивала проезд по платным участкам на скорости около 90 км/ч. В кабине находился водитель-испытатель, но к управлению не прикасался. Яндекс опубликовал непрерывную 8-часовую видеозапись поездки.
Prime Intellect выпускает prime-rl v0.6.0 для агентного RL на триллионно-параметрических MoE-моделях
Prime IntellectPrime Intellect выпустила prime-rl v0.6.0 (22–23 июня 2026 года) — open-source-фреймворк для асинхронного обучения с подкреплением на триллионно-параметрических MoE-моделях, ориентированный на длительные агентные задачи наподобие разработки программного обеспечения. Фреймворк разделяет тренер и инференс на независимые асинхронные процессы. Демонстрация на GLM-5 запускала SWE-задачи при длине последовательности 131K с шагом менее 5 минут и размером батча роллаутов 256 всего на 28 узлах H200. Router replay сокращает KL-рассогласование между тренером и инференсом примерно в 10 раз.
Qwen-AgentWorld: языковые world-модели для универсальных агентов в семи средах
Alibaba/QwenКоманда Qwen от Alibaba опубликовала Qwen-AgentWorld (arXiv 2606.24597, 23 июня) — языковые world-модели в вариантах 35B-A3B и 397B-A17B MoE, симулирующие семь агентных сред: MCP, Search, Terminal, Software Engineering, Android, Web и OS. Обучены на более чем 10 миллионах траекторий реальных взаимодействий со средой. Также представлен AgentWorldBench, охватывающий все семь доменов. Модели могут служить масштабируемыми симуляторами для RL-обучения или в качестве разогрева для дальнейших агентных задач.
Sakana AI выпускает Fugu: мульти-LLM-оркестратор, достигающий SoTA на SWE-Bench Pro
Sakana AISakana AI опубликовала технический отчёт Fugu (arXiv 2606.21228, обновлён 23 июня 2026 года). Fugu — семейство моделей-оркестраторов, обученных координировать адаптивную команду специализированных LLM, динамически выстраивая агентные скаффолды под каждый запрос с помощью файн-тюнинга, эволюционных алгоритмов и RL. Два варианта: Fugu (баланс производительности и латентности) и Fugu-Ultra (максимальное качество). Достигает state-of-the-art результатов на SWE-Bench Pro, Terminal Bench, LiveCodeBench и GPQA-Diamond среди публично доступных моделей.
Mistral выпускает OCR 4 с bounding box'ами, классификацией блоков и поддержкой 170 языков
MistralMistral опубликовала OCR 4 23 июня 2026 года. Новые возможности: bounding box'ы на уровне слов, типизированная классификация блоков (заголовки, таблицы, формулы, подписи) и оценки уверенности на уровне слов — что обеспечивает привязанные к источнику цитаты и пространственную индексацию. Модель поддерживает 170 языков в 10 языковых группах, обрабатывает форматы PDF, DOC, PPT и OpenDocument и запускается в режиме self-hosted в одном контейнере. На OlmOCRBench — 85,20 баллов (лучший общий результат), на OmniDocBench — 93,07. Цена: $4 за 1 000 страниц через API, $2 — через Batch API.
xAI запускает /goal в Grok Build для длительных автономных задач кодирования
xAIxAI добавила команду /goal в Grok Build 22 июня 2026 года, обеспечивая долгосрочное автономное выполнение задач в терминальном агенте кодирования. При вызове агент создаёт чеклист прогресса и затем последовательно его выполняет — включая код-ревью, просмотр веб-страниц и запуск скриптов — вплоть до завершения и верификации задачи. Функция использует мультимодельную архитектуру, объединяющую Composer 2.5 и Grok Build 0.1. Доступ пока ограничен подписчиками SuperGrok Heavy ($300/месяц).
ByteDance анонсирует Seedance 2.5: нативное 4K-видео длительностью 30 секунд с 50 референсными входами
ByteDanceНа той же конференции Volcano Engine FORCE 23 июня ByteDance анонсировала Seedance 2.5 — видеомодель нового поколения. Модель генерирует нативное 30-секундное видео в одном клипе при разрешении 4K и цветовой глубине 10 бит, принимая до 50 мультимодальных референсных входов одновременно — изображения, аудио, 3D-модели, стилевые референсы — против 12 в предыдущей версии. Локальное постгенерационное редактирование сохраняет визуальный стиль. Модель находится в глобальной корпоративной бета-версии; публичный запуск запланирован на начало июля 2026 года.
Справочно (6)
SHERLOC: структурированная диагностическая локализация сокращает потребление токенов при ремонте кода на 36,7%
SHERLOC (arXiv 2606.24820, 23 июня) — фреймворк без дообучения, решающий задачу локализации ошибок при ремонте кода на уровне репозитория. Он связывает reasoning-LLM с компактными инструментами для работы с репозиторием и механизмом самовосстановления, производя структурированные диагностические выводы. Достигает 84,33% accuracy@1 на SWE-Bench Lite, сокращая суммарное потребление токенов на 36,7%, и улучшает показатель успешного ремонта downstream-агента на 5,95 процентных пункта.
Переработанный терминальный интерфейс GitHub Copilot CLI выходит в General Availability
GitHubПереработанный терминальный интерфейс GitHub Copilot CLI, анонсированный на Microsoft Build 2026, теперь общедоступен. Он вводит табличный макет (Session, Gists, Issues, Pull Requests) для навигации по GitHub прямо из терминала, управляемую конфигурацию инструментов внутри сессии через команды `/mcp add`, `/skills` и `/plugin` вместо ручного редактирования файлов, а также тема-адаптивные доступные цвета с поддержкой скринридеров.
Алиса Яндекса получила агентное бронирование ресторанов и салонов красоты по всей России
YandexЯндекс запустил возможность агентного бронирования в чате Алисы 23 июня 2026 года. Теперь пользователи могут бронировать столики в ресторанах и записываться в салоны красоты через диалог на естественном языке — охват более 30 000 ресторанов и 40 000 сервисных бизнесов по всей стране. Для заведений, подключённых к Яндекс Еде, бронирование подтверждается автоматически; для остальных Алиса заполняет форму резервирования на сайте заведения. Доступно в alice.yandex.ru, приложении Алиса, Яндекс Браузере и основном приложении Яндекса.
Claude Code v2.1.187: изоляция учётных данных в sandbox и исправление зависания remote MCP
AnthropicClaude Code v2.1.187 (23 июня) добавляет настройку `sandbox.credentials`, блокирующую чтение файлов учётных данных и секретных переменных окружения сандбоксированными командами, вводит ограничения на выбор модели, настраиваемые организацией через пикер моделей, и устраняет зависание вызовов remote MCP-инструментов, которые ранее могли ожидать до 5 минут перед отменой.
Cursor 3.9 запускает единую страницу Customize для плагинов, навыков, MCP и субагентов
CursorCursor 3.9 (22 июня) объединяет плагины, навыки, MCP, субагентов, правила, команды и хуки в единую страницу Customize, управляемую на уровне пользователя, команды или рабочего пространства. Витрина с рейтингом расширений показывает самые популярные из них в команде с установкой в один клик. Плагины теперь поддерживают готовые канвасы (например, Hex Canvas для визуализации данных, Atlassian Canvas для отслеживания задач в реальном времени). Командные маркетплейсы расширены для импорта репозиториев плагинов из GitLab, BitBucket и Azure DevOps.
Modal запускает Auto Endpoints для производственного LLM-инференса на базе open-source-моделей
ModalModal опубликовала Auto Endpoints 23 июня 2026 года. Продукт разворачивает оптимизированные, совместимые с OpenAI API эндпоинты LLM-инференса одной командой, автоматически выбирая тип GPU, регион и флаги движка инференса, сохраняя при этом полный код обслуживания видимым и редактируемым. Включает спекулятивное декодирование с кастомными drafter-моделями. Базовое Modal App полностью доступно для инспекции и форка.