Ежедневный дайджест
12 пунктов · ~12 мин · Неделя 2026-W19
Обязательно к прочтению (1)
Anthropic и OpenAI одновременно запустили венчурные структуры для корпоративного внедрения ИИ
Anthropic / OpenAI4 мая Anthropic официально запустила совместное предприятие по корпоративным ИИ-услугам с капитализацией $1,5 млрд при поддержке Blackstone, Hellman & Friedman, Goldman Sachs, Apollo, General Atlantic, GIC, Leonard Green и Sequoia — каждый якорный инвестор вложил около $300 млн. Самостоятельная структура будет внедрять инженеров Anthropic непосредственно в компании среднего бизнеса для перестройки рабочих процессов под агентов Claude. Несколько часов спустя OpenAI завершила формирование «The Deployment Company» — инструмента с капиталом $10 млрд при поддержке TPG, Brookfield, Advent, Bain Capital и 15 других инвесторов; OpenAI гарантирует инвесторам доходность 17,5% годовых на пять лет. Обе структуры следуют модели Palantir с forward-deployed-инженерами и ориентированы на портфельные компании прямых инвестиций в здравоохранении, производстве, финансовых услугах и логистике.
Стоит знать (5)
ElevenLabs запускает ElevenMusic: ИИ-создание музыки, ремикширование и стриминг на одной платформе
ElevenLabsElevenLabs запустила ElevenMusic 29–30 апреля, объединив ИИ-генерацию музыки, ремикширование и стриминг. Пользователи могут создавать треки из текстов, мелодий или промптов по настроению, а также ремиксировать существующие треки по жанру и темпу. На старте доступны около 4 000 реальных артистов для стриминга и ремикширования, с роялти, привязанными к вовлечённости слушателей. Бесплатный тариф: 7 треков/день; Pro: $9,99/месяц, до 500 треков. Доступна как iOS-приложение и как интегрированная функция внутри ElevenLabs.
Suno нацелена на оценку $5 млрд в Series D, достигнув 100 миллионов пользователей
SunoПо данным Axios от 4 мая, Suno ведёт переговоры о закрытии раунда Series D при оценке свыше $5 млрд — что более чем вдвое превышает $2,45 млрд Series C из ноября 2025 года. Компания достигла 100 миллионов пользователей и генерирует свыше 7 миллионов треков в день. Отдельно Suno объявила о планах по переосмыслению приобретённой платформы для поиска концертов Songkick с помощью ИИ, наняв генерального менеджера для интеграции данных о живых событиях в платформу.
Midjourney V8.1 вышла в GA: HD-режим ускорен в 3 раза, восстановлены image prompts
MidjourneyMidjourney выпустила V8.1 30 апреля — на midjourney.com и в Discord. HD-режим стал в 3 раза быстрее и в 3 раза дешевле; стандартное разрешение — на 50% быстрее и на 25% дешевле. V8.1 восстанавливает image prompts и image weights, добавляет Prompt Shortener, обновляет Describe для более подробных результатов и поддерживает нативное разрешение 2K. Мудборды и Style References теперь значительно стабильнее по сравнению с V8.0 Alpha.
AI2 публикует в открытый доступ MolmoAct2: роботизированная VLA, превосходящая GPT-5 в воплощённом рассуждении
AI2Allen Institute for AI выпускает MolmoAct2 — систему управления роботами с открытым исходным кодом, построенную на MolmoER, визуально-языковой модели, обученной на 3,3 млн примеров для пространственного рассуждения. Релиз включает три новых датасета — в том числе крупнейший открытый двуручный датасет на сегодняшний день с 720 часами телеуправляемых траекторий, — открытый токенизатор действий (OpenFAST) и MolmoThink — адаптивный механизм рассуждения, повторно предсказывающий токены глубины только для изменившихся областей сцены с целью снижения задержки. Полные веса модели, обучающий код и датасеты опубликованы публично.
UniVidX: единый диффузионный бэкбон для генерации RGB, карт внутренних признаков и RGBA-видео
UniVidX предлагает единый фреймворк для решения нескольких задач генерации видео — синтеза RGB, генерации карт внутренних признаков и декомпозиции RGBA-слоёв — без использования отдельных моделей. Это обеспечивают три компонента: Stochastic Condition Masking (SCM) случайным образом разбивает модальности на условия и цели во время обучения; Decoupled Gated LoRA (DGL) применяет адаптации для каждой модальности; Cross-Modal Self-Attention (CMSA) обменивается информацией между модальностями. Система демонстрирует конкурентоспособные результаты при обучении менее чем на 1 000 видео.
Справочно (6)
Odysseus: обучение VLM для интерактивного принятия решений на 100+ ходов с помощью RL
Princeton UniversityOdysseus обучает визуально-языковые модели играть в Super Mario Land на протяжении 100+ последовательных ходов с использованием варианта PPO с лёгким критиком на уровне хода. Предобученные VLM формируют сильные априорные данные об действиях, что существенно повышает эффективность обучения по сравнению с классическим deep RL с нуля. Фреймворк достигает как минимум 3-кратного среднего прогресса в игре по сравнению с frontier-моделями, сохраняя при этом общие возможности VLM.
Meta публикует отчёт о готовности Code World Model перед выпуском в открытый доступ
MetaКоманда безопасности Meta опубликовала оценку перед релизом Code World Model (CWM) — модели генерации кода, — оценив потенциальный катастрофический риск по выявленным угрозам и проанализировав склонности к неоднозначному поведению. В отчёте сделан вывод, что CWM не создаёт дополнительных frontier-рисков сверх уже существующих в текущей экосистеме ИИ, и модель одобрена к выпуску с открытыми весами.
Claude Code v2.1.128: отображение количества MCP-инструментов, ZIP-архивы плагинов и исправление ошибок
AnthropicClaude Code v2.1.128 (4 мая) добавляет отображение количества инструментов MCP-сервера в /mcp с отметкой серверов, сообщающих 0 инструментов; --plugin-dir теперь принимает .zip-архивы; --channels работает с консольной авторизацией (по API-ключу); в выборщике /model убраны дублирующиеся записи Opus 4.7; дочерние процессы больше не наследуют переменные среды OTEL_*; workspace теперь зарезервированное имя MCP-сервера; переподключение MCP-серверов больше не заполняет разговор полными списками имён инструментов. Исправлены: затемнение в режиме фокуса, сбой уведомлений рабочего стола при /exit в Kitty, зависания при drag-and-drop загрузке изображений, краш при большом вводе (>10 МБ через stdin) и ошибки параллельных вызовов инструмента командной оболочки.
OpenClaw 2026.5.3: плагин для передачи файлов и надёжность кроссплатформенного обмена сообщениями
OpenClaw выпустила версию 2026.5.3 4 мая. Главное новшество — встроенный плагин для передачи файлов, обеспечивающий операции с бинарными файлами на сопряжённых узлах с политикой default-deny по путям для каждого узла. Другие изменения: ленивая загрузка функций discovery, cron и метаданных для более быстрого запуска; улучшенная надёжность каналов в Discord, Telegram, Matrix и Slack. В бета-сборках того же дня добавлены команда /steer для управления на лету и конфигурация шлюза с fail-closed при некорректных настройках. OpenClaw — автономный ИИ-агент с открытым исходным кодом, использующий платформы обмена сообщениями в качестве UI (~247 тыс. звёзд на GitHub по состоянию на март 2026 года).
OpenCode v1.14.34–35: аутентификационные билеты PTY WebSocket и исправление отображения диффов
SSTOpenCode выпустила две версии 4–5 мая. v1.14.34 добавляет билеты PTY-соединений для аутентифицированных терминальных WebSocket-ов, события сбоев v2 сессий для обнаружения ошибок на стороне клиента и улучшенную обработку сессий Bash/PowerShell/cmd; также исправлены структурированные ответы об ошибках от HTTP effect server, разрешение модели Azure Anthropic и загрузка прокси-ресурсов web UI. v1.14.35 исправляет границы diff-патчей, чтобы диффы сессий отображались корректно, когда содержимое файлов включает текст 'diff --git'.
Cursor добавляет гранулярные настройки моделей, лимиты расходов и аналитику использования для команд
CursorВ ченджлоге Cursor от 4 мая представлены гранулярные списки разрешённых/заблокированных моделей и провайдеров — команды могут ограничивать модели по скорости или размеру контекстного окна. Мягкие лимиты расходов отправляют оповещения при достижении 50%, 80% и 100% бюджетных порогов. Аналитика использования теперь фильтруется по пользователю и продуктовой поверхности (чат, автодополнения, inline-редактирование и т.д.).