Ежедневный дайджест

18 пунктов · ~18 мин · Неделя 2026-W26

Обязательно к прочтению (3)

ByteDance представляет Doubao-Seed-2.1-Pro на конференции Volcano Engine FORCE

ByteDance
модели/LLM офиц. + СМИ 4 ист. ~1 мин

ByteDance представила Doubao-Seed-2.1-Pro 23 июня на конференции Volcano Engine FORCE в Пекине — производственную frontier-LLM для задач кодирования, долгосрочных агентных задач и мультимодального понимания. Также выпущена Doubao-Seed-2.1-Turbo вдвое дешевле (6 юаней за миллион входных токенов / 30 юаней за миллион выходных у Pro). ByteDance заявляет о паритете с GPT-5.5 на бенчмарках по кодированию и агентным задачам, занимая первые места на OSWorld, MobileWorld и MMMU-Pro. Семейство Doubao теперь превышает 180 триллионов токенов в сутки — рост в 10 раз год к году.

Почему это важно
ByteDance напрямую конкурирует с frontier-закрытыми моделями по ценам китайского рынка, используя потребительский продукт Doubao как канал дистрибуции и внутренний стенд для оценки. 180 триллионов токенов в сутки свидетельствуют о гиперпроизводственном масштабе Seed-моделей — это уже не исследовательский уровень.

Anthropic запускает Claude Tag — постоянного AI-участника команды в Slack

Anthropic
инструменты офиц. + СМИ 4 ист. ~1 мин

Anthropic запустила Claude Tag в бета-версии 23 июня 2026 года для клиентов Claude Enterprise и Team. Функция добавляет Claude в Slack как постоянного мультипользовательского участника команды, которого можно вызывать через @-упоминание для делегирования задач. Claude со временем обучается на истории каналов, может работать асинхронно, а при включении ambient mode — проактивно сообщает о релевантной информации без явных запросов. Функция работает на базе Claude Opus 4.8 и заменяет существующее приложение Claude for Slack. По данным Anthropic, внутренняя версия уже генерирует 65% кода продуктовой команды компании.

Почему это важно
Claude Tag — наиболее прямой выход Anthropic на рынок корпоративного коллаборационного ПО: Claude превращается из чат-бота в постоянно доступного автономного агента, встроенного в рабочий слой, где реально работают команды. Мультипользовательский дизайн — один общий Claude на Slack-канал — представляет новую парадигму взаимодействия, обеспечивающую коллективное делегирование вместо индивидуальных промптов.

OpenAI расширяет Daybreak: полный релиз GPT-5.5-Cyber, плагин Codex Security и Patch the Planet

OpenAI
инструменты офиц. + СМИ 4 ист. ~1 мин

22 июня 2026 года OpenAI расширила свою платформу кибербезопасности Daybreak: выпустила GPT-5.5-Cyber в полном релизе (85,6% на CyberGym — наивысший результат среди одиночных моделей на сегодняшний день), плагин Codex Security для поиска и устранения уязвимостей в рамках разработческих воркфлоу, а также «Patch the Planet» — open-source-инициативу, основанную совместно с Trail of Bits. Доступ к GPT-5.5-Cyber по-прежнему ограничен верифицированными специалистами по защите. В партнёрской программе Cyber Partner Program теперь более 20 вендоров, включая Cisco, CrowdStrike, Palo Alto Networks и Cloudflare; более 30 open-source-проектов — cURL, Go, Python и другие — присоединились к Patch the Planet.

Почему это важно
Расширение Daybreak — наиболее конкретный шаг OpenAI в сторону корпоративной инфраструктуры кибербезопасности: сочетание специализированной дообученной модели, инструментария для разработчиков и скоординированной программы патчинга open-source позиционирует AI как системный защитный слой, а не точечный инструмент.

Стоит знать (9)

Krea публикует открытые веса Krea 2 Raw и Turbo: 12B DiT-модель генерации изображений за 2 секунды

Krea
изображения офиц. + СМИ 3 ист. ~1 мин

Krea опубликовала открытые веса Krea 2 22 июня 2026 года на Hugging Face по кастомной сообщественной лицензии (коммерческое использование требует корпоративного соглашения для организаций с 50+ рабочими местами). Два варианта: Krea 2 Raw (базовый чекпойнт до RLHF, из середины обучения) и Krea 2 Turbo (дистиллированный, дообученный). 12B Diffusion Transformer генерирует изображения примерно за 2 секунды в режиме Turbo. По данным Krea, сервисом пользуются 30 миллионов пользователей в 191 стране.

Почему это важно
Скорость генерации Krea 2 Turbo — 2 секунды при 12B параметрах — одна из самых высоких среди доступных open-weight text-to-image-моделей. Публикация базового чекпойнта Raw до RLHF предоставляет исследователям доступ к недистиллированному снимку середины обучения для файн-тюнинга и исследований в области выравнивания.

Google DeepMind и A24 объявляют о партнёрстве в области AI-исследований на $75 млн для киноиндустрии

Google DeepMind
индустрия офиц. + СМИ 4 ист. ~1 мин

Google DeepMind инвестировала $75 млн в кинокомпанию A24 и объявила о многолетнем неэксклюзивном партнёрстве в области исследований и разработок 22 июня 2026 года. Исследователи DeepMind будут работать вместе с кинематографистами A24 на активных съёмочных площадках для создания AI-воркфлоу на базе Veo. Это первая в истории Google инвестиция в виде доли в кинокомпании.

Почему это важно
Наиболее прямая на сегодня интеграция frontier AI-лаборатории в голливудское производство: DeepMind получает реальные обратные связи от работающих кинематографистов, а Veo позиционируется как предпочтительный AI-инструмент для видео в арт-хаусном кино. Вслед за инвестициями Netflix и Amazon MGM в AI, это сигнализирует о консолидации AI в студийные пайплайны на уровне всей индустрии.

Беспилотный грузовик Яндекса совершил первый полностью автономный рейс Москва–Санкт-Петербург протяжённостью 700 км

Yandex
индустрия офиц. + СМИ 3 ист. ~1 мин

23 июня 2026 года автономный грузовик Яндекса «Роботрак» преодолел 700 км без водителя по трассе М-11 от Москвы до Санкт-Петербурга — первый подобный случай в России. AI-система самостоятельно выполняла обгоны, проезжала через зоны дорожных работ и оплачивала проезд по платным участкам на скорости около 90 км/ч. В кабине находился водитель-испытатель, но к управлению не прикасался. Яндекс опубликовал непрерывную 8-часовую видеозапись поездки.

Почему это важно
Знаковая веха для автономной AI-логистики в России, подтверждающая, что стек беспилотного вождения Яндекса достиг зрелости для дальних магистральных маршрутов. Подтверждает коммерческую состоятельность автономных грузоперевозок и укрепляет позиции Яндекса как ведущего разработчика беспилотных транспортных средств на российском рынке.

Prime Intellect выпускает prime-rl v0.6.0 для агентного RL на триллионно-параметрических MoE-моделях

Prime Intellect
исследования офиц. + СМИ 3 ист. ~1 мин

Prime Intellect выпустила prime-rl v0.6.0 (22–23 июня 2026 года) — open-source-фреймворк для асинхронного обучения с подкреплением на триллионно-параметрических MoE-моделях, ориентированный на длительные агентные задачи наподобие разработки программного обеспечения. Фреймворк разделяет тренер и инференс на независимые асинхронные процессы. Демонстрация на GLM-5 запускала SWE-задачи при длине последовательности 131K с шагом менее 5 минут и размером батча роллаутов 256 всего на 28 узлах H200. Router replay сокращает KL-рассогласование между тренером и инференсом примерно в 10 раз.

Почему это важно
Прежде масштабирование агентного RL до триллионного масштаба требовало кластеров, недоступных большинству исследовательских бюджетов. prime-rl 0.6.0 демонстрирует реализуемость на 28 узлах H200 — доступно для лабораторий среднего размера — а open-source-релиз позволяет другим организациям воспроизвести эту возможность.

Qwen-AgentWorld: языковые world-модели для универсальных агентов в семи средах

Alibaba/Qwen
исследования офиц. + СМИ 2 ист. ~1 мин

Команда Qwen от Alibaba опубликовала Qwen-AgentWorld (arXiv 2606.24597, 23 июня) — языковые world-модели в вариантах 35B-A3B и 397B-A17B MoE, симулирующие семь агентных сред: MCP, Search, Terminal, Software Engineering, Android, Web и OS. Обучены на более чем 10 миллионах траекторий реальных взаимодействий со средой. Также представлен AgentWorldBench, охватывающий все семь доменов. Модели могут служить масштабируемыми симуляторами для RL-обучения или в качестве разогрева для дальнейших агентных задач.

Почему это важно
Первая языковая world-модель, охватывающая такой широкий спектр агентных сред, — единый симулятор для RL-обучения в семи доменах без необходимости поддерживать семь отдельных реальных сред — способна существенно снизить стоимость и сложность обучения дееспособных агентов. Самая голосованная статья на HF Daily Papers за 24 июня (36 голосов).

Sakana AI выпускает Fugu: мульти-LLM-оркестратор, достигающий SoTA на SWE-Bench Pro

Sakana AI
исследования офиц. + СМИ 2 ист. ~1 мин

Sakana AI опубликовала технический отчёт Fugu (arXiv 2606.21228, обновлён 23 июня 2026 года). Fugu — семейство моделей-оркестраторов, обученных координировать адаптивную команду специализированных LLM, динамически выстраивая агентные скаффолды под каждый запрос с помощью файн-тюнинга, эволюционных алгоритмов и RL. Два варианта: Fugu (баланс производительности и латентности) и Fugu-Ultra (максимальное качество). Достигает state-of-the-art результатов на SWE-Bench Pro, Terminal Bench, LiveCodeBench и GPQA-Diamond среди публично доступных моделей.

Почему это важно
Fugu напрямую решает проблему привязки к одному вендору и фрагментации frontier-LLM, обучаясь компоновать специализированные модели вместо опоры на единственного провайдера. Достижение SoTA на сложных бенчмарках GPQA-Diamond и SWE-Bench Pro без монолитной модели — значимый архитектурный результат.

Mistral выпускает OCR 4 с bounding box'ами, классификацией блоков и поддержкой 170 языков

Mistral
инструменты офиц. + СМИ 4 ист. ~1 мин

Mistral опубликовала OCR 4 23 июня 2026 года. Новые возможности: bounding box'ы на уровне слов, типизированная классификация блоков (заголовки, таблицы, формулы, подписи) и оценки уверенности на уровне слов — что обеспечивает привязанные к источнику цитаты и пространственную индексацию. Модель поддерживает 170 языков в 10 языковых группах, обрабатывает форматы PDF, DOC, PPT и OpenDocument и запускается в режиме self-hosted в одном контейнере. На OlmOCRBench — 85,20 баллов (лучший общий результат), на OmniDocBench — 93,07. Цена: $4 за 1 000 страниц через API, $2 — через Batch API.

Почему это важно
Bounding box'ы и оценки уверенности — наиболее востребованные возможности для document AI пайплайнов, позволяющие выделять фрагменты в контексте, извлекать данные из форм и выполнять пространственные рассуждения, недоступные при чисто текстовом извлечении. Поддержка self-hosting устраняет опасения по поводу утечки данных в регулируемых отраслях.

xAI запускает /goal в Grok Build для длительных автономных задач кодирования

xAI
инструменты офиц. + СМИ 2 ист. ~1 мин

xAI добавила команду /goal в Grok Build 22 июня 2026 года, обеспечивая долгосрочное автономное выполнение задач в терминальном агенте кодирования. При вызове агент создаёт чеклист прогресса и затем последовательно его выполняет — включая код-ревью, просмотр веб-страниц и запуск скриптов — вплоть до завершения и верификации задачи. Функция использует мультимодельную архитектуру, объединяющую Composer 2.5 и Grok Build 0.1. Доступ пока ограничен подписчиками SuperGrok Heavy ($300/месяц).

Почему это важно
Команда /goal продвигает Grok Build от интерактивного ассистента кодирования к более автономному агенту программной инженерии, способному выполнять многошаговые проекты без постоянного участия человека, напрямую конкурируя с Codex от OpenAI и Claude Code от Anthropic в пространстве агентного кодирования.

ByteDance анонсирует Seedance 2.5: нативное 4K-видео длительностью 30 секунд с 50 референсными входами

ByteDance
видео офиц. + СМИ 3 ист. ~1 мин

На той же конференции Volcano Engine FORCE 23 июня ByteDance анонсировала Seedance 2.5 — видеомодель нового поколения. Модель генерирует нативное 30-секундное видео в одном клипе при разрешении 4K и цветовой глубине 10 бит, принимая до 50 мультимодальных референсных входов одновременно — изображения, аудио, 3D-модели, стилевые референсы — против 12 в предыдущей версии. Локальное постгенерационное редактирование сохраняет визуальный стиль. Модель находится в глобальной корпоративной бета-версии; публичный запуск запланирован на начало июля 2026 года.

Почему это важно
Расширение однопроходной генерации видео до 30 секунд при 4K преодолевает ключевой производственный барьер, который большинство существующих моделей не могут преодолеть без артефактов склейки. Возможность принимать 50 мультимодальных референсов ориентирована на профессиональные кино- и рекламные пайплайны и напрямую конкурирует с Runway и Kling в высшем сегменте.
Справочно (6)

SHERLOC: структурированная диагностическая локализация сокращает потребление токенов при ремонте кода на 36,7%

исследования официальный 1 ист. ~1 мин

SHERLOC (arXiv 2606.24820, 23 июня) — фреймворк без дообучения, решающий задачу локализации ошибок при ремонте кода на уровне репозитория. Он связывает reasoning-LLM с компактными инструментами для работы с репозиторием и механизмом самовосстановления, производя структурированные диагностические выводы. Достигает 84,33% accuracy@1 на SWE-Bench Lite, сокращая суммарное потребление токенов на 36,7%, и улучшает показатель успешного ремонта downstream-агента на 5,95 процентных пункта.

Почему это важно
Эффективность по токенам — практический потолок для агентных задач кодирования. Уполовинив стоимость локализации без какого-либо дообучения, SHERLOC делает дееспособных агентов ремонта кода существенно дешевле и проще в интеграции в существующие пайплайны.

Переработанный терминальный интерфейс GitHub Copilot CLI выходит в General Availability

GitHub
инструменты офиц. + СМИ 2 ист. ~1 мин

Переработанный терминальный интерфейс GitHub Copilot CLI, анонсированный на Microsoft Build 2026, теперь общедоступен. Он вводит табличный макет (Session, Gists, Issues, Pull Requests) для навигации по GitHub прямо из терминала, управляемую конфигурацию инструментов внутри сессии через команды `/mcp add`, `/skills` и `/plugin` вместо ручного редактирования файлов, а также тема-адаптивные доступные цвета с поддержкой скринридеров.

Почему это важно
Весь GitHub-воркфлоу, управляемый агентом кодирования, переносится полностью в терминал, устраняя переключение контекста между написанием кода и управлением задачами или PR. Интерактивный поток `/mcp add` снижает порог подключения Copilot CLI к кастомным MCP-серверам.

Алиса Яндекса получила агентное бронирование ресторанов и салонов красоты по всей России

Yandex
инструменты офиц. + СМИ 3 ист. ~1 мин

Яндекс запустил возможность агентного бронирования в чате Алисы 23 июня 2026 года. Теперь пользователи могут бронировать столики в ресторанах и записываться в салоны красоты через диалог на естественном языке — охват более 30 000 ресторанов и 40 000 сервисных бизнесов по всей стране. Для заведений, подключённых к Яндекс Еде, бронирование подтверждается автоматически; для остальных Алиса заполняет форму резервирования на сайте заведения. Доступно в alice.yandex.ru, приложении Алиса, Яндекс Браузере и основном приложении Яндекса.

Почему это важно
Конкретный переход от AI-ассистента к транзакционному AI-агенту: Алиса теперь выполняет реальные действия (бронирование, заполнение форм), а не просто даёт рекомендации, расширяя практическую пользу для десятков миллионов российских пользователей.

Claude Code v2.1.187: изоляция учётных данных в sandbox и исправление зависания remote MCP

Anthropic
инструменты официальный 1 ист. ~1 мин

Claude Code v2.1.187 (23 июня) добавляет настройку `sandbox.credentials`, блокирующую чтение файлов учётных данных и секретных переменных окружения сандбоксированными командами, вводит ограничения на выбор модели, настраиваемые организацией через пикер моделей, и устраняет зависание вызовов remote MCP-инструментов, которые ранее могли ожидать до 5 минут перед отменой.

Почему это важно
Настройка изоляции учётных данных закрывает реальную уязвимость, при которой сандбоксированные подпроцессы могли извлекать секреты; исправление зависания MCP устраняет блокирующую проблему надёжности для команд, запускающих агентные воркфлоу с внешними серверами инструментов.

Cursor 3.9 запускает единую страницу Customize для плагинов, навыков, MCP и субагентов

Cursor
инструменты официальный 1 ист. ~1 мин

Cursor 3.9 (22 июня) объединяет плагины, навыки, MCP, субагентов, правила, команды и хуки в единую страницу Customize, управляемую на уровне пользователя, команды или рабочего пространства. Витрина с рейтингом расширений показывает самые популярные из них в команде с установкой в один клик. Плагины теперь поддерживают готовые канвасы (например, Hex Canvas для визуализации данных, Atlassian Canvas для отслеживания задач в реальном времени). Командные маркетплейсы расширены для импорта репозиториев плагинов из GitLab, BitBucket и Azure DevOps.

Почему это важно
Cursor движется к полноценной экосистеме плагинов с управлением на уровне команды, эволюционируя от персонального IDE к управляемой и разделяемой платформе для разработчиков. Готовые канвасы превращают плагины в полноправные интерактивные поверхности, а не просто хуки автоматизации.

Modal запускает Auto Endpoints для производственного LLM-инференса на базе open-source-моделей

Modal
инструменты официальный 1 ист. ~1 мин

Modal опубликовала Auto Endpoints 23 июня 2026 года. Продукт разворачивает оптимизированные, совместимые с OpenAI API эндпоинты LLM-инференса одной командой, автоматически выбирая тип GPU, регион и флаги движка инференса, сохраняя при этом полный код обслуживания видимым и редактируемым. Включает спекулятивное декодирование с кастомными drafter-моделями. Базовое Modal App полностью доступно для инспекции и форка.

Почему это важно
Занимает нишу между непрозрачными управляемыми API и DIY-самохостингом: производственно-оптимизированные настройки по умолчанию при полном владении конфигурацией — практично для команд, которым нужны соответствие требованиям или кастомные компромиссы по латентности и стоимости.