AI Digest

Ежедневный обзор значимых релизов и событий в мире AI на русском, с акцентом на верифицируемость источников.

Baidu выпустил ERNIE-5.1-Preview — №1 среди китайских моделей на LMArena

Baidu
модели/LLM офиц. + СМИ 2 ист. ~1 мин

30 апреля 2026 Baidu представил предварительную версию ERNIE-5.1-Preview. Модель дебютировала на 13-м месте глобального рейтинга LMArena Text Arena со счётом 1476 и стала №1 среди китайских моделей, обогнав DeepSeek-V4-Pro. По заявлению Baidu, модель использует около трети от общих параметров и половину активных параметров ERNIE-5.0 при ~6% затрат на pre-training сопоставимых моделей. Полная версия ERNIE 5.1 ожидается на конференции Baidu Create.

Почему это важно
Подтверждает резкое ускорение китайской гонки вслед за DeepSeek V4: Baidu заявляет лидерство среди китайских лабораторий на LMArena при существенно меньшей стоимости обучения.

OpenAI Codex CLI 0.128.0 — persisted /goal-воркфлоу и расширенные permission-профили

OpenAI
инструменты официальный 2 ист. ~1 мин

OpenAI выпустила stable-релиз Codex CLI v0.128.0 после серии alpha-версий 0.126.x. Главное нововведение — persisted /goal workflows: long-running цели хранятся через app-server API, доступны как model tools, поддерживают runtime-continuation и имеют отдельные TUI-контролы. Расширены permission-профили со встроенными defaults и выбором sandbox-профиля прямо из CLI; флаг --full-auto deprecated в пользу явных permission-профилей. Улучшены plugin-воркфлоу (установка из marketplace, кэш remote-bundle), добавлен импорт сессий внешних агентов с background-import. MultiAgentV2 получил настраиваемые thread caps и wait-time.

Почему это важно
Persisted /goal превращает Codex CLI из stateless-помощника в платформу для долгоживущих автономных задач, конкурируя с Claude Code и Cursor за background-агентов.

AutoResearchBench — бенчмарк автономного поиска научной литературы для AI-агентов

BAAI
исследования офиц. + СМИ 2 ист. ~1 мин

Опубликован новый бенчмарк для оценки агентов на задаче автономного поиска и обзора научных публикаций. Содержит две комплементарные постановки: Deep Research (multi-step расследование, ведущее к конкретной целевой статье) и Wide Research (полный сбор публикаций по заданным критериям, метрика — IoU). Даже сильнейшие LLM-агенты выбивают лишь 9.39% accuracy на Deep Research и 9.31% IoU на Wide Research.

Почему это важно
Закрывает методологическую дыру между общими web-агентами и реальной работой исследователя; цифры в районе 9% задают потолок, от которого можно мерить прогресс research-агентов в 2026.
Полный выпуск →

DeepSeek V4: официальный open-source релиз с Day-0 адаптацией под Huawei Ascend

DeepSeek
модели/LLM офиц. + СМИ 5 ист. ~1 мин

DeepSeek 29 апреля официально выпустила линейку V4 в open-source под лицензией MIT. В неё входят DeepSeek-V4-Pro на 1.6 трлн параметров (49 млрд активных) и DeepSeek-V4 на 284 млрд (13 млрд активных) — обе модели MoE с нативным контекстом 1 млн токенов. Заявлено снижение требований к памяти примерно в 9.5 раза против V3.2 и почти ликвидированный разрыв с фронтирными закрытыми моделями на бенчмарках рассуждений. Особенность релиза — оптимизация под китайские ускорители: Huawei Ascend, Cambricon, Hygon и Moore Threads завершили Day-0 адаптацию в день релиза, мультидеплой Ascend 950 ожидается во втором полугодии.

Почему это важно
Первый крупный фронтирный open-weights релиз, изначально заточенный под Ascend, а не Nvidia — это инфраструктурный сдвиг для китайского AI-стека и сигнал, что экспортные ограничения США ускорили формирование самостоятельной экосистемы инференса.

GLM-5V-Turbo: нативная foundation-модель для мультимодальных агентов

Z.ai
исследования офиц. + СМИ 2 ист. ~1 мин

Z.ai представила GLM-5V-Turbo — мультимодальную foundation-модель, в которой визуальное восприятие встроено как первоклассный компонент reasoning, планирования и tool use, а не подключено постфактум. Модель работает с изображениями, видео, веб-страницами и документами; авторы рапортуют рост на multimodal coding, visual tool use и агентских задачах при сохранении text-only качества. Подчёркивается роль end-to-end верификации агентских траекторий в обучении.

Почему это важно
Один из самых хайповых релизов недели на HF Daily — 2.28k upvotes. Заявка на нативно-мультимодального агента (а не VLM с прикрученным tool use) — направление, в котором Z.ai системно конкурирует с GPT-5 и Gemini.

Yandex Commerce Protocol: первые ретейлеры запускают продажи через Алису AI

Yandex
индустрия офиц. + СМИ 5 ист. ~1 мин

Яндекс раскрыл первых партнёров Yandex Commerce Protocol (YCP) — стандарта интеграции интернет-магазинов с ИИ-сценариями Алисы AI, Поиска и Яндекс Ритма. К запуску продаж напрямую из чата с Алисой AI подключаются «Стокманн», restore:, аптечные сети «Горздрав» и «36,6», оператор Билайн, бренд The Act и ряд других ритейлеров; интеграцию по YCP начали более 200 крупных онлайн-ритейлеров и брендов, ещё свыше 1600 магазинов подали заявки. Технология позволяет покупателю переходить к оплате прямо из диалога с ассистентом, без перехода на сайт магазина — Алиса AI выступает в роли торгового ИИ-агента поверх каталогов партнёров.

Почему это важно
YCP — заявка Яндекса на роль AI-commerce-стандарта в Рунете и один из первых масштабных запусков LLM-ассистента как канала прямых продаж в России. Если протокол приживётся, это меняет роль голосовых и чат-ассистентов с информационной на транзакционную.
Полный выпуск →

Anthropic выпустила Claude for Creative Work с коннекторами к Adobe, Blender, Ableton

Anthropic
инструменты офиц. + СМИ 4 ист. ~1 мин

Anthropic анонсировала пакет Claude for Creative Work — девять официальных коннекторов, позволяющих Claude работать прямо с Adobe Creative Cloud, Blender, Autodesk Fusion, Ableton Live/Push, Affinity by Canva, Resolume, SketchUp и Splice. Параллельно в Anthropic Labs запущен новый продукт Claude Design для быстрых визуальных прототипов и анонсированы образовательные программы с RISD, Ringling и Goldsmiths.

Почему это важно
Anthropic выходит из ниши «помощник для кода и текста» в профессиональные творческие пайплайны — впервые крупная фронтирная лаборатория получает официальное место внутри Adobe и Blender.

OpenAI вывела GPT-5.5, Codex и Managed Agents на Amazon Bedrock

OpenAI
индустрия офиц. + СМИ 6 ист. ~1 мин

AWS и OpenAI расширили партнёрство и в режиме limited preview запустили на Amazon Bedrock сразу три предложения: фронтирные модели OpenAI (GPT-5.5 и GPT-5.4), агент Codex с поддержкой CLI/desktop/VS Code и Bedrock Managed Agents на базе OpenAI. GA обещают в течение нескольких недель; модели интегрированы с IAM, PrivateLink, guardrails и CloudTrail.

Почему это важно
Релиз состоялся через сутки после окончания эксклюзивности OpenAI с Microsoft и фактически делает Bedrock вторым полноценным каналом дистрибуции фронтирных моделей OpenAI для энтерпрайза.

Mistral выпустила Medium 3.5 — 128B dense, 256k контекста, открытые веса

Mistral
модели/LLM офиц. + СМИ 5 ист. ~1 мин

Mistral AI представила Mistral Medium 3.5 — флагманскую dense-модель на 128B параметров с контекстом 256k и переключаемым reasoning effort. Веса открыты под модифицированной MIT-лицензией и доступны на Hugging Face. Параллельно запущены remote-агенты в Vibe (облачные coding-сессии с CLI и «телепортацией» локальной сессии в облако) и режим Work mode в Le Chat для многошаговых задач. Заявлено 77,6% на SWE-Bench Verified и 91,4% на τ³-Telecom; цена API — $1,5/$7,5 за миллион токенов.

Почему это важно
Mistral возвращается на фронтир с дешёвой open-weight моделью уровня Claude Sonnet 4.5 в кодинге и одновременно даёт собственный аналог Codex/Claude Code — самый сильный европейский релиз весны 2026.
Полный выпуск →

DeepSeek V4 — снижение цен в API

DeepSeek
модели/LLM офиц. + СМИ 4 ист. ~1 мин

27 апреля DeepSeek агрессивно снизил цены на V4-Pro и V4-Flash (preview от 24 апреля, 1.6T MoE / 49B активных, 1M контекст, оптимизация под Huawei Ascend, open weights), запустив очередной виток ценовой войны на китайском рынке.

Firefly AI Assistant — Public Beta

Adobe
изображения офиц. + СМИ 3 ист. ~1 мин

27 апреля Adobe запустил глобальную публичную бету ИИ-ассистента, который оркестрирует мультишаговые креативные воркфлоу через 60+ инструментов Creative Cloud по чат-промту; включает Creative Skills и интеграцию с партнёрскими моделями (GPT Image 2, Veo 3.1, Runway Gen-4.5, ElevenLabs Multilingual v2).

Полный выпуск →

Реструктуризация Microsoft–OpenAI

Microsoft / OpenAI
индустрия офиц. + СМИ 3 ист. ~1 мин

Конец cloud-эксклюзивности: OpenAI может продавать продукты через AWS/Google Cloud, лицензия Microsoft → non-exclusive. Microsoft остаётся primary cloud partner, не платит OpenAI revenue share. OpenAI продолжает делиться revenue с Microsoft до 2030; IP-лицензия до 2032.

OpenClaw 2026.4.25

OpenClaw
инструменты официальный 2 ист. ~1 мин

Расширение TTS (`/tts latest`, новые провайдеры включая Azure Speech). Plugin registry перенесён в cold storage для быстрого старта. Расширенный OpenTelemetry мониторинг. Календарное версионирование `YYYY.M.D`.

Полный выпуск →