Ежедневный дайджест
16 пунктов · ~16 мин · Неделя 2026-W20
Обязательно к прочтению (2)
OpenAI запускает Deployment Company с инвестициями $4 млрд+ и поглощением Tomoro
OpenAI11 мая 2026 года OpenAI объявила о создании OpenAI Deployment Company — совместного предприятия с мажоритарной долей OpenAI, поддержанного 19 инвестиционными фирмами с начальным капиталом свыше $4 млрд; лид-инвесторы — TPG, Advent, Bain Capital и Brookfield. Одновременно OpenAI договорилась о поглощении эдинбургской AI-консалтинговой компании Tomoro, что позволит привлечь около 150 Forward Deployed Engineers для внедрения у корпоративных клиентов и вывода frontier-моделей в производственные процессы.
Pixal3D: попиксельная генерация 3D из изображений принята на SIGGRAPH 2026
Tencent ARC LabPixal3D представляет парадигму попиксельной генерации 3D из изображений, принятую на SIGGRAPH 2026. Вместо приблизительного внедрения признаков изображения через attention метод явно поднимает многомасштабные пиксельные признаки в 3D-объём через обратную проекцию, устанавливая прямые соответствия пиксель-3D и обеспечивая точность, близкую к реконструкции, с детализированной геометрией и PBR-текстурами. Код, демо и модель на HuggingFace выпущены одновременно.
Стоит знать (7)
Alibaba интегрирует Qwen AI с Taobao для сквозного агентного шопинга
Alibaba11 мая 2026 года Alibaba объявила об объединении платформы Qwen AI с маркетплейсом Taobao: ключевой поиск по товарам заменяется разговорным AI-агентом, способным самостоятельно просматривать, сравнивать и оформлять покупки в каталоге из более чем 4 млрд товаров. Интеграция включает виртуальную примерку, 30-дневное отслеживание цен и автономное оформление заказов через Alipay.
Mean Mode Screaming: исправление патологии обучения открывает путь к 1000-слойным Diffusion Transformer
В статье идентифицируется Mean Mode Screaming (MMS) — коллапс обучения, при котором Diffusion Transformer на экстремальных глубинах подавляет вариацию токенов при внешне стабильных значениях потерь. Предложенные Mean-Variance Split (MV-Split) Residuals объединяют отдельно масштабируемое центрированное остаточное обновление с заменой leaky trunk-mean, устраняя события коллапса и обеспечивая стабильное обучение DiT с 1000 слоями.
Flow-OPD: on-policy дистилляция даёт +29 пунктов по GenEval на Stable Diffusion 3.5
Flow-OPD — первый фреймворк для интеграции on-policy дистилляции в text-to-image-модели на основе flow matching. Двухэтапная стратегия — тонкая настройка специализированных teacher-моделей через single-reward GRPO, затем консолидация через плотный контроль векторных полей на уровне траекторий с Manifold Anchor Regularization — достигает +29 пунктов по GenEval (63→92) и +35 пунктов по точности OCR (59→94) на Stable Diffusion 3.5 Medium, превосходя отдельные teacher-модели.
Claude Platform от Anthropic выходит в general availability на AWS
Anthropic11 мая 2026 года Anthropic перевела нативную Claude Platform в статус general availability через Amazon Web Services — первый облачный провайдер, предлагающий полный нативный опыт Claude Platform с биллингом AWS и аутентификацией через IAM. Предложение включает Claude Managed Agents (beta), веб-поиск и fetch, выполнение кода, Files API, Skills, коннектор MCP, кэширование промптов, citations и пакетную обработку в 19 регионах.
Claude Code v2.1.139–v2.1.140: Agent View в режиме research preview и команда /goal
AnthropicClaude Code v2.1.139 (11 мая) поставляет Agent View в режиме research preview — `claude agents` открывает единый дашборд со всеми запущенными, заблокированными и завершёнными сессиями, позволяя разработчикам контролировать параллельные автономные задачи программирования из одной панели терминала. Сопутствующая команда /goal позволяет пользователю задать условие завершения и поддерживает автономную итерацию Claude между ходами с живым оверлеем времени/ходов/токенов. v2.1.140 (12 мая) содержит исправления ошибок: устраняет зависание /goal при ограничениях хуков, краш `claude --bg` на корпоративных эндпоинтах, зависание event loop на Windows и ошибку валидации параметра offset в инструменте Read.
AWS MCP Server и Agent Toolkit достигают general availability
AWSAWS анонсировала general availability AWS MCP Server — управляемого удалённого MCP-эндпоинта с безопасным, IAM-контролируемым доступом ко всем сервисам AWS через фиксированный набор инструментов — и Agent Toolkit для AWS, производственного набора навыков, рекомендаций и изолированного выполнения скриптов без доплаты. Оба продукта были анонсированы 6 мая и представлены в AWS Weekly Roundup 11 мая.
Фейковый репозиторий OpenAI занял #1 в трендах Hugging Face с 244 тыс. загрузок и доставил инфостилер
Репозиторий с именем 'Open-OSS/privacy-filter' скопировал карточку легитимной модели OpenAI Privacy Filter практически дословно и вышел на #1 в трендах Hugging Face за 18 часов, набрав около 244 000 загрузок до удаления. Файл loader.py доставлял шестиэтапный инфостилер на Rust, собирающий учётные данные браузеров, токены Discord, ключи криптокошельков и SSH-ключи; предполагаются связи с группировкой Silver Fox. Также были обнаружены шесть связанных репозиториев, имитирующих Qwen3, DeepSeek и другие популярные модели.
Справочно (7)
OpenAI выводит из эксплуатации API DALL-E 2 и DALL-E 3 12 мая
OpenAI12 мая 2026 года OpenAI отключила эндпоинты API DALL-E 2 и DALL-E 3, уведомив разработчиков в ноябре 2025 года. Все вызовы /v1/images/generations с использованием любой из этих строк модели теперь возвращают ошибки; разработчики должны перейти на gpt-image-1 или gpt-image-1-mini, использующие другой формат ответа (base64 PNG вместо URL) и тарификацию на основе токенов вместо оплаты за изображение.
Soohak: 64 математика создали исследовательский бенчмарк, который ставит frontier LLM в тупик
Seoul National UniversitySoohak — бенчмарк из 439 задач, созданных с нуля 64 профессиональными математиками для оценки способности frontier LLM рассуждать на уровне, необходимом для продвижения математических знаний. Лучшие модели набирают лишь 10,4–30,4% на сложных задачах (Claude Opus 4.5 — 10,4%, Gemini 3 Pro — 30,4%, GPT-5 — 26,4%). Отдельное подмножество с отказами проверяет способность моделей обнаруживать некорректно поставленные задачи и воздерживаться от ответа — ни одна модель не превышает 50% по этому измерению.
AutoTTS: LLM-агенты автоматически открывают стратегии test-time scaling за $40
AutoTTS предлагает среду, в которой LLM-агенты автоматически открывают стратегии test-time scaling вместо их ручного проектирования исследователями. Формулируя ширину-глубину TTS как синтез контроллера над заранее собранными траекториями рассуждений, метод открывает Confidence Momentum Controller (CMC), улучшающий соотношение точности и стоимости относительно ручных базовых линий с обобщением на различные бенчмарки и масштабы моделей — при затратах всего $39,90 и 160 минут работы.
GitHub Copilot CLI v1.0.45: переключение /autopilot и ветвление сессий /fork
GitHubGitHub Copilot CLI v1.0.45 (11 мая) добавляет /autopilot для переключения между интерактивным и полностью автономным режимами, команду /fork для создания независимой копии текущей сессии, выравнивание OpenTelemetry по GenAI semantic conventions (MCP tool calls получают стандартные спаны tool_call), запасной вариант для Windows PowerShell 5 и ускорение запуска примерно на 1,5 секунды.
Cursor запускает интеграцию с Microsoft Teams для делегирования задач облачному агенту
Cursor11 мая Cursor запустил интеграцию с Microsoft Teams, позволяющую упоминать @Cursor в любом канале Teams для делегирования задач программирования облачному агенту. Cursor читает весь тред для контекста, автоматически выбирает нужный репозиторий и модель, затем открывает pull request для ревью командой — без выхода из интерфейса чата.
OpenCode v1.14.45–v1.14.48: встроенный навык customize и исправления прикрепления изображений
SSTSST выпустила четыре релиза OpenCode 10–11 мая. В v1.14.46 введён встроенный навык `customize-opencode` для более безопасного редактирования конфигурации; v1.14.47 восстановил горячие клавиши редактирования промптов и исправил сохранение модели между сессиями; v1.14.48 сохраняет оригинальные прикреплённые изображения вместо даунсемплинга перед отправкой в модель.
ShengShu Technology запускает Vidu Claw: AI-платформу для сквозного производства рекламы
ShengShu Technology12 мая 2026 года ShengShu Technology запустила Vidu Claw — AI-маркетинговую платформу на базе видеомодели Vidu Q3, которая принимает единый маркетинговый бриф и выдаёт готовую рекламную кампанию, включая планирование, сценарий, раскадровку и видео под конкретные платформы. Flash Mode создаёт клипы 1080p за 80–150 секунд; подписка Video Plan тарифицируется за готовый рекламный ролик, а не за кредиты.