5 пунктов
модели/LLM
офиц. + СМИ
2 ист.
~1 мин
30 апреля 2026 Baidu представил предварительную версию ERNIE-5.1-Preview. Модель дебютировала на 13-м месте глобального рейтинга LMArena Text Arena со счётом 1476 и стала №1 среди китайских моделей, обогнав DeepSeek-V4-Pro. По заявлению Baidu, модель использует около трети от общих параметров и половину активных параметров ERNIE-5.0 при ~6% затрат на pre-training сопоставимых моделей. Полная версия ERNIE 5.1 ожидается на конференции Baidu Create.
Почему это важно
Подтверждает резкое ускорение китайской гонки вслед за DeepSeek V4: Baidu заявляет лидерство среди китайских лабораторий на LMArena при существенно меньшей стоимости обучения.
инструменты
официальный
2 ист.
~1 мин
OpenAI выпустила stable-релиз Codex CLI v0.128.0 после серии alpha-версий 0.126.x. Главное нововведение — persisted /goal workflows: long-running цели хранятся через app-server API, доступны как model tools, поддерживают runtime-continuation и имеют отдельные TUI-контролы. Расширены permission-профили со встроенными defaults и выбором sandbox-профиля прямо из CLI; флаг --full-auto deprecated в пользу явных permission-профилей. Улучшены plugin-воркфлоу (установка из marketplace, кэш remote-bundle), добавлен импорт сессий внешних агентов с background-import. MultiAgentV2 получил настраиваемые thread caps и wait-time.
Почему это важно
Persisted /goal превращает Codex CLI из stateless-помощника в платформу для долгоживущих автономных задач, конкурируя с Claude Code и Cursor за background-агентов.
исследования
офиц. + СМИ
2 ист.
~1 мин
Опубликован новый бенчмарк для оценки агентов на задаче автономного поиска и обзора научных публикаций. Содержит две комплементарные постановки: Deep Research (multi-step расследование, ведущее к конкретной целевой статье) и Wide Research (полный сбор публикаций по заданным критериям, метрика — IoU). Даже сильнейшие LLM-агенты выбивают лишь 9.39% accuracy на Deep Research и 9.31% IoU на Wide Research.
Почему это важно
Закрывает методологическую дыру между общими web-агентами и реальной работой исследователя; цифры в районе 9% задают потолок, от которого можно мерить прогресс research-агентов в 2026.
Полный выпуск →
10 пунктов
модели/LLM
офиц. + СМИ
5 ист.
~1 мин
DeepSeek 29 апреля официально выпустила линейку V4 в open-source под лицензией MIT. В неё входят DeepSeek-V4-Pro на 1.6 трлн параметров (49 млрд активных) и DeepSeek-V4 на 284 млрд (13 млрд активных) — обе модели MoE с нативным контекстом 1 млн токенов. Заявлено снижение требований к памяти примерно в 9.5 раза против V3.2 и почти ликвидированный разрыв с фронтирными закрытыми моделями на бенчмарках рассуждений. Особенность релиза — оптимизация под китайские ускорители: Huawei Ascend, Cambricon, Hygon и Moore Threads завершили Day-0 адаптацию в день релиза, мультидеплой Ascend 950 ожидается во втором полугодии.
Почему это важно
Первый крупный фронтирный open-weights релиз, изначально заточенный под Ascend, а не Nvidia — это инфраструктурный сдвиг для китайского AI-стека и сигнал, что экспортные ограничения США ускорили формирование самостоятельной экосистемы инференса.
исследования
офиц. + СМИ
2 ист.
~1 мин
Z.ai представила GLM-5V-Turbo — мультимодальную foundation-модель, в которой визуальное восприятие встроено как первоклассный компонент reasoning, планирования и tool use, а не подключено постфактум. Модель работает с изображениями, видео, веб-страницами и документами; авторы рапортуют рост на multimodal coding, visual tool use и агентских задачах при сохранении text-only качества. Подчёркивается роль end-to-end верификации агентских траекторий в обучении.
Почему это важно
Один из самых хайповых релизов недели на HF Daily — 2.28k upvotes. Заявка на нативно-мультимодального агента (а не VLM с прикрученным tool use) — направление, в котором Z.ai системно конкурирует с GPT-5 и Gemini.
индустрия
офиц. + СМИ
5 ист.
~1 мин
Яндекс раскрыл первых партнёров Yandex Commerce Protocol (YCP) — стандарта интеграции интернет-магазинов с ИИ-сценариями Алисы AI, Поиска и Яндекс Ритма. К запуску продаж напрямую из чата с Алисой AI подключаются «Стокманн», restore:, аптечные сети «Горздрав» и «36,6», оператор Билайн, бренд The Act и ряд других ритейлеров; интеграцию по YCP начали более 200 крупных онлайн-ритейлеров и брендов, ещё свыше 1600 магазинов подали заявки. Технология позволяет покупателю переходить к оплате прямо из диалога с ассистентом, без перехода на сайт магазина — Алиса AI выступает в роли торгового ИИ-агента поверх каталогов партнёров.
Почему это важно
YCP — заявка Яндекса на роль AI-commerce-стандарта в Рунете и один из первых масштабных запусков LLM-ассистента как канала прямых продаж в России. Если протокол приживётся, это меняет роль голосовых и чат-ассистентов с информационной на транзакционную.
Полный выпуск →
12 пунктов
инструменты
офиц. + СМИ
4 ист.
~1 мин
Anthropic анонсировала пакет Claude for Creative Work — девять официальных коннекторов, позволяющих Claude работать прямо с Adobe Creative Cloud, Blender, Autodesk Fusion, Ableton Live/Push, Affinity by Canva, Resolume, SketchUp и Splice. Параллельно в Anthropic Labs запущен новый продукт Claude Design для быстрых визуальных прототипов и анонсированы образовательные программы с RISD, Ringling и Goldsmiths.
Почему это важно
Anthropic выходит из ниши «помощник для кода и текста» в профессиональные творческие пайплайны — впервые крупная фронтирная лаборатория получает официальное место внутри Adobe и Blender.
индустрия
офиц. + СМИ
6 ист.
~1 мин
AWS и OpenAI расширили партнёрство и в режиме limited preview запустили на Amazon Bedrock сразу три предложения: фронтирные модели OpenAI (GPT-5.5 и GPT-5.4), агент Codex с поддержкой CLI/desktop/VS Code и Bedrock Managed Agents на базе OpenAI. GA обещают в течение нескольких недель; модели интегрированы с IAM, PrivateLink, guardrails и CloudTrail.
Почему это важно
Релиз состоялся через сутки после окончания эксклюзивности OpenAI с Microsoft и фактически делает Bedrock вторым полноценным каналом дистрибуции фронтирных моделей OpenAI для энтерпрайза.
модели/LLM
офиц. + СМИ
5 ист.
~1 мин
Mistral AI представила Mistral Medium 3.5 — флагманскую dense-модель на 128B параметров с контекстом 256k и переключаемым reasoning effort. Веса открыты под модифицированной MIT-лицензией и доступны на Hugging Face. Параллельно запущены remote-агенты в Vibe (облачные coding-сессии с CLI и «телепортацией» локальной сессии в облако) и режим Work mode в Le Chat для многошаговых задач. Заявлено 77,6% на SWE-Bench Verified и 91,4% на τ³-Telecom; цена API — $1,5/$7,5 за миллион токенов.
Почему это важно
Mistral возвращается на фронтир с дешёвой open-weight моделью уровня Claude Sonnet 4.5 в кодинге и одновременно даёт собственный аналог Codex/Claude Code — самый сильный европейский релиз весны 2026.
Полный выпуск →
11 пунктов
модели/LLM
офиц. + СМИ
4 ист.
~1 мин
27 апреля DeepSeek агрессивно снизил цены на V4-Pro и V4-Flash (preview от 24 апреля, 1.6T MoE / 49B активных, 1M контекст, оптимизация под Huawei Ascend, open weights), запустив очередной виток ценовой войны на китайском рынке.
изображения
офиц. + СМИ
3 ист.
~1 мин
27 апреля Adobe запустил глобальную публичную бету ИИ-ассистента, который оркестрирует мультишаговые креативные воркфлоу через 60+ инструментов Creative Cloud по чат-промту; включает Creative Skills и интеграцию с партнёрскими моделями (GPT Image 2, Veo 3.1, Runway Gen-4.5, ElevenLabs Multilingual v2).
видео
официальный
1 ист.
~1 мин
26 апреля окончательно отключены веб- и мобильное приложения Sora; API будет отключён 24 сентября 2026.
Полный выпуск →
3 пункта
индустрия
офиц. + СМИ
3 ист.
~1 мин
Конец cloud-эксклюзивности: OpenAI может продавать продукты через AWS/Google Cloud, лицензия Microsoft → non-exclusive. Microsoft остаётся primary cloud partner, не платит OpenAI revenue share. OpenAI продолжает делиться revenue с Microsoft до 2030; IP-лицензия до 2032.
инструменты
официальный
2 ист.
~1 мин
Расширение TTS (`/tts latest`, новые провайдеры включая Azure Speech). Plugin registry перенесён в cold storage для быстрого старта. Расширенный OpenTelemetry мониторинг. Календарное версионирование `YYYY.M.D`.
индустрия
только СМИ
3 ист.
~1 мин
Сообщение о совместной разработке чипов; акции Qualcomm +12% pre-market. Mass production планируется на 2028. По отчёту аналитика Ming-Chi Kuo, официально не подтверждено сторонами.
Полный выпуск →