Ежедневный дайджест

16 пунктов · ~16 мин · Неделя 2026-W20

Обязательно к прочтению (2)

OpenAI запускает Deployment Company с инвестициями $4 млрд+ и поглощением Tomoro

OpenAI
индустрия офиц. + СМИ 3 ист. ~1 мин

11 мая 2026 года OpenAI объявила о создании OpenAI Deployment Company — совместного предприятия с мажоритарной долей OpenAI, поддержанного 19 инвестиционными фирмами с начальным капиталом свыше $4 млрд; лид-инвесторы — TPG, Advent, Bain Capital и Brookfield. Одновременно OpenAI договорилась о поглощении эдинбургской AI-консалтинговой компании Tomoro, что позволит привлечь около 150 Forward Deployed Engineers для внедрения у корпоративных клиентов и вывода frontier-моделей в производственные процессы.

Почему это важно
Структура сделки — СП с крупными PE-фондами плюс поглощение консалтинга — свидетельствует о прямой конкуренции OpenAI с системными интеграторами за крупные корпоративные контракты на развёртывание AI, воспроизводя модель Palantir/Accenture для frontier-моделей.

Pixal3D: попиксельная генерация 3D из изображений принята на SIGGRAPH 2026

Tencent ARC Lab
исследования офиц. + СМИ 2 ист. ~1 мин

Pixal3D представляет парадигму попиксельной генерации 3D из изображений, принятую на SIGGRAPH 2026. Вместо приблизительного внедрения признаков изображения через attention метод явно поднимает многомасштабные пиксельные признаки в 3D-объём через обратную проекцию, устанавливая прямые соответствия пиксель-3D и обеспечивая точность, близкую к реконструкции, с детализированной геометрией и PBR-текстурами. Код, демо и модель на HuggingFace выпущены одновременно.

Почему это важно
#1 в HF Daily Paper за 12 мая с 263 голосами; принята на SIGGRAPH 2026; устраняет ключевой барьер точности в генерации 3D из изображений, заменяя приблизительное встраивание через attention явным отображением пиксель-3D.

Стоит знать (7)

Alibaba интегрирует Qwen AI с Taobao для сквозного агентного шопинга

Alibaba
индустрия только СМИ 4 ист. ~1 мин

11 мая 2026 года Alibaba объявила об объединении платформы Qwen AI с маркетплейсом Taobao: ключевой поиск по товарам заменяется разговорным AI-агентом, способным самостоятельно просматривать, сравнивать и оформлять покупки в каталоге из более чем 4 млрд товаров. Интеграция включает виртуальную примерку, 30-дневное отслеживание цен и автономное оформление заказов через Alipay.

Почему это важно
Крупнейшее развёртывание агентной коммерции на китайской платформе — AI самостоятельно закрывает полный цикл покупки, включая просмотр, оплату и послепродажные действия, опережая западные реализации AI-шопинга, передающие управление ритейлерам.

Mean Mode Screaming: исправление патологии обучения открывает путь к 1000-слойным Diffusion Transformer

исследования офиц. + СМИ 2 ист. ~1 мин

В статье идентифицируется Mean Mode Screaming (MMS) — коллапс обучения, при котором Diffusion Transformer на экстремальных глубинах подавляет вариацию токенов при внешне стабильных значениях потерь. Предложенные Mean-Variance Split (MV-Split) Residuals объединяют отдельно масштабируемое центрированное остаточное обновление с заменой leaky trunk-mean, устраняя события коллапса и обеспечивая стабильное обучение DiT с 1000 слоями.

Почему это важно
119 голосов в HF Daily; напрямую касается масштабирования генеративных моделей — предыдущие попытки наращивания глубины для конвейеров на основе DiT имели этот скрытый режим отказа, который лишь сейчас был диагностирован и устранён на архитектурном уровне.

Flow-OPD: on-policy дистилляция даёт +29 пунктов по GenEval на Stable Diffusion 3.5

исследования офиц. + СМИ 2 ист. ~1 мин

Flow-OPD — первый фреймворк для интеграции on-policy дистилляции в text-to-image-модели на основе flow matching. Двухэтапная стратегия — тонкая настройка специализированных teacher-моделей через single-reward GRPO, затем консолидация через плотный контроль векторных полей на уровне траекторий с Manifold Anchor Regularization — достигает +29 пунктов по GenEval (63→92) и +35 пунктов по точности OCR (59→94) на Stable Diffusion 3.5 Medium, превосходя отдельные teacher-модели.

Почему это важно
113 голосов в HF Daily; предлагает принципиальное решение задачи multi-objective RLHF выравнивания для диффузионных моделей — ключевая нерешённая проблема для производственных text-to-image систем, пытающихся одновременно удовлетворить конкурирующим целям.

Claude Platform от Anthropic выходит в general availability на AWS

Anthropic
инструменты офиц. + СМИ 3 ист. ~1 мин

11 мая 2026 года Anthropic перевела нативную Claude Platform в статус general availability через Amazon Web Services — первый облачный провайдер, предлагающий полный нативный опыт Claude Platform с биллингом AWS и аутентификацией через IAM. Предложение включает Claude Managed Agents (beta), веб-поиск и fetch, выполнение кода, Files API, Skills, коннектор MCP, кэширование промптов, citations и пакетную обработку в 19 регионах.

Почему это важно
Корпоративные клиенты получают доступ к полному набору функций Claude API — включая возможности раннего доступа в бета-версии — напрямую через существующие AWS-аккаунты без отдельных контрактов, объединяя биллинг и аутентификацию с доступом к агентным функциям, ранее доступным только на anthropic.com.

Claude Code v2.1.139–v2.1.140: Agent View в режиме research preview и команда /goal

Anthropic
инструменты офиц. + СМИ 3 ист. ~1 мин

Claude Code v2.1.139 (11 мая) поставляет Agent View в режиме research preview — `claude agents` открывает единый дашборд со всеми запущенными, заблокированными и завершёнными сессиями, позволяя разработчикам контролировать параллельные автономные задачи программирования из одной панели терминала. Сопутствующая команда /goal позволяет пользователю задать условие завершения и поддерживает автономную итерацию Claude между ходами с живым оверлеем времени/ходов/токенов. v2.1.140 (12 мая) содержит исправления ошибок: устраняет зависание /goal при ограничениях хуков, краш `claude --bg` на корпоративных эндпоинтах, зависание event loop на Windows и ошибку валидации параметра offset в инструменте Read.

Почему это важно
Agent View и /goal вместе обозначают переход от однопользовательского CLI-инструмента к поверхности оркестрации мульти-агентов, позволяя управлять параллельными автономными агентами Claude из одного терминала.

AWS MCP Server и Agent Toolkit достигают general availability

AWS
инструменты официальный 2 ист. ~1 мин

AWS анонсировала general availability AWS MCP Server — управляемого удалённого MCP-эндпоинта с безопасным, IAM-контролируемым доступом ко всем сервисам AWS через фиксированный набор инструментов — и Agent Toolkit для AWS, производственного набора навыков, рекомендаций и изолированного выполнения скриптов без доплаты. Оба продукта были анонсированы 6 мая и представлены в AWS Weekly Roundup 11 мая.

Почему это важно
Официальный, enterprise-готовый MCP-сервер от AWS снижает порог вхождения для AI-агентов программирования при провизионировании и управлении облачной инфраструктурой с встроенным аудит-логированием и IAM-ограждениями.

Фейковый репозиторий OpenAI занял #1 в трендах Hugging Face с 244 тыс. загрузок и доставил инфостилер

инструменты только СМИ 3 ист. ~1 мин

Репозиторий с именем 'Open-OSS/privacy-filter' скопировал карточку легитимной модели OpenAI Privacy Filter практически дословно и вышел на #1 в трендах Hugging Face за 18 часов, набрав около 244 000 загрузок до удаления. Файл loader.py доставлял шестиэтапный инфостилер на Rust, собирающий учётные данные браузеров, токены Discord, ключи криптокошельков и SSH-ключи; предполагаются связи с группировкой Silver Fox. Также были обнаружены шесть связанных репозиториев, имитирующих Qwen3, DeepSeek и другие популярные модели.

Почему это важно
Атаки на цепочки поставок через репозитории AI-моделей стремительно совершенствуются; манипуляция списком трендов и 244 тыс. загрузок показывают, что поверхность Hugging Face является высокоценной целью для кампаний по краже учётных данных у AI-разработчиков.
Справочно (7)

OpenAI выводит из эксплуатации API DALL-E 2 и DALL-E 3 12 мая

OpenAI
изображения офиц. + СМИ 2 ист. ~1 мин

12 мая 2026 года OpenAI отключила эндпоинты API DALL-E 2 и DALL-E 3, уведомив разработчиков в ноябре 2025 года. Все вызовы /v1/images/generations с использованием любой из этих строк модели теперь возвращают ошибки; разработчики должны перейти на gpt-image-1 или gpt-image-1-mini, использующие другой формат ответа (base64 PNG вместо URL) и тарификацию на основе токенов вместо оплаты за изображение.

Почему это важно
Завершение поддержки DALL-E 3 — некогда доминирующего коммерческого text-to-image API — знаменует смену поколений в стеке изображений OpenAI, вынуждая тысячи производственных интеграций мигрировать на семейство GPT Image с кардинально иной семантикой API.

Soohak: 64 математика создали исследовательский бенчмарк, который ставит frontier LLM в тупик

Seoul National University
исследования офиц. + СМИ 2 ист. ~1 мин

Soohak — бенчмарк из 439 задач, созданных с нуля 64 профессиональными математиками для оценки способности frontier LLM рассуждать на уровне, необходимом для продвижения математических знаний. Лучшие модели набирают лишь 10,4–30,4% на сложных задачах (Claude Opus 4.5 — 10,4%, Gemini 3 Pro — 30,4%, GPT-5 — 26,4%). Отдельное подмножество с отказами проверяет способность моделей обнаруживать некорректно поставленные задачи и воздерживаться от ответа — ни одна модель не превышает 50% по этому измерению.

Почему это важно
Обеспечивает наиболее строгую на сегодняшний день оценку математических рассуждений frontier-моделей, показывая, что даже лучшие модели кардинально проигрывают на реальных исследовательских задачах и не могут надёжно распознавать некорректно поставленные вопросы.

AutoTTS: LLM-агенты автоматически открывают стратегии test-time scaling за $40

исследования офиц. + СМИ 2 ист. ~1 мин

AutoTTS предлагает среду, в которой LLM-агенты автоматически открывают стратегии test-time scaling вместо их ручного проектирования исследователями. Формулируя ширину-глубину TTS как синтез контроллера над заранее собранными траекториями рассуждений, метод открывает Confidence Momentum Controller (CMC), улучшающий соотношение точности и стоимости относительно ручных базовых линий с обобщением на различные бенчмарки и масштабы моделей — при затратах всего $39,90 и 160 минут работы.

Почему это важно
Автоматизирует открытие стратегий test-time scaling, открывая возможность самосовершенствующихся инференс-конвейеров при минимальных затратах и указывая на делегируемость проектирования TTS-стратегий агентам.

GitHub Copilot CLI v1.0.45: переключение /autopilot и ветвление сессий /fork

GitHub
инструменты официальный 1 ист. ~1 мин

GitHub Copilot CLI v1.0.45 (11 мая) добавляет /autopilot для переключения между интерактивным и полностью автономным режимами, команду /fork для создания независимой копии текущей сессии, выравнивание OpenTelemetry по GenAI semantic conventions (MCP tool calls получают стандартные спаны tool_call), запасной вариант для Windows PowerShell 5 и ускорение запуска примерно на 1,5 секунды.

Почему это важно
/autopilot и /fork расширяют агентную поверхность CLI — пользователи могут полностью делегировать задачи или создавать параллельные ветви сессий без перезапуска инструмента.

Cursor запускает интеграцию с Microsoft Teams для делегирования задач облачному агенту

Cursor
инструменты официальный 1 ист. ~1 мин

11 мая Cursor запустил интеграцию с Microsoft Teams, позволяющую упоминать @Cursor в любом канале Teams для делегирования задач программирования облачному агенту. Cursor читает весь тред для контекста, автоматически выбирает нужный репозиторий и модель, затем открывает pull request для ревью командой — без выхода из интерфейса чата.

Почему это важно
Переносит агентное программирование непосредственно на уровень совместной работы, где принимаются инженерные решения, сокращая переключение контекста между чатом и IDE и обеспечивая асинхронное делегирование кода.

OpenCode v1.14.45–v1.14.48: встроенный навык customize и исправления прикрепления изображений

SST
инструменты официальный 1 ист. ~1 мин

SST выпустила четыре релиза OpenCode 10–11 мая. В v1.14.46 введён встроенный навык `customize-opencode` для более безопасного редактирования конфигурации; v1.14.47 восстановил горячие клавиши редактирования промптов и исправил сохранение модели между сессиями; v1.14.48 сохраняет оригинальные прикреплённые изображения вместо даунсемплинга перед отправкой в модель.

Почему это важно
Стабильный ритм UX и исправлений надёжности удерживает OpenCode конкурентоспособным как open-source альтернативу Claude Code и Copilot CLI для команд, которым нужен полный контроль над исходным кодом агента программирования.

ShengShu Technology запускает Vidu Claw: AI-платформу для сквозного производства рекламы

ShengShu Technology
видео официальный 1 ист. ~1 мин

12 мая 2026 года ShengShu Technology запустила Vidu Claw — AI-маркетинговую платформу на базе видеомодели Vidu Q3, которая принимает единый маркетинговый бриф и выдаёт готовую рекламную кампанию, включая планирование, сценарий, раскадровку и видео под конкретные платформы. Flash Mode создаёт клипы 1080p за 80–150 секунд; подписка Video Plan тарифицируется за готовый рекламный ролик, а не за кредиты.

Почему это важно
Представляет полный сквозной AI-конвейер производства рекламы примерно за 1% стоимости традиционного производства, сигнализируя о переходе от инструментов генерации видео к интегрированным AI-креативным агентствам на базе frontier видеомоделей.