Ежедневный дайджест
12 пунктов · ~12 мин · Неделя 2026-W26
Обязательно к прочтению (2)
Правительство США частично восстановило доступ к Anthropic Mythos 5 примерно для 100 организаций критической инфраструктуры
Anthropic27 июня Министерство торговли США уведомило Anthropic о том, что Claude Mythos 5 может быть повторно развёрнут примерно для 100 американских организаций, эксплуатирующих и защищающих критическую инфраструктуру — энергетику, здравоохранение, финансовые услуги и телекоммуникации. Claude Fable 5 (публичная модель) остаётся под запретом. Anthropic продолжает переговоры о расширении доступа к Mythos 5 и возврате Fable 5. Первоначальное предписание об экспортном контроле было введено 12 июня после того, как исследователи Amazon выявили векторы взлома защиты в системе кибербезопасности Fable 5.
OpenAI представляет семейство GPT-5.6: Sol, Terra и Luna — ограниченный выпуск только для одобренных правительством организаций
OpenAIOpenAI запустила ограниченный предварительный показ GPT-5.6 26 июня, включающий три уровня: Sol (флагман, $5/$30 за 1M токенов, с мультиагентной оркестровкой в «ultra mode»), Terra (сбалансированный, $2.50/$15) и Luna (быстрый, $1/$6). Доступ ограничен примерно 20 предварительно одобренными организациями по запросу правительства США для оценки перед широким выпуском. Sol занимает первое место в Terminal-Bench 2.1 по агентному программированию и ~53.5% в SecureBio Virology Capabilities Test. Пользователи ChatGPT остаются на GPT-5.5; общая доступность ожидается в течение нескольких недель. GPT-4.5 был выведен из ChatGPT в тот же день.
Стоит знать (2)
DeepSeek закрывает раунд финансирования на $7.4 млрд и планирует удвоить штат всех отделов
DeepSeekDeepSeek завершила крупнейший в истории Китая раунд финансирования ИИ-стартапа — около 50 млрд юаней (~$7.4 млрд) — с Tencent и CATL в роли крупнейших частных инвесторов наряду с государственным Национальным инвестиционным фондом ИИ-индустрии. Постинвестиционная оценка составляет около 350–400 млрд юаней (~$52–59 млрд). Bloomberg сообщил 25 июня, что одновременно DeepSeek объявила о планах как минимум удвоить численность каждого отдела, с акцентом на предобучение, данные, агентную инфраструктуру и межотраслевые роли в ИИ. В настоящее время в компании работают около 150–170 человек.
ViQ: текстово-выровненные дискретные визуальные представления с поддержкой произвольного разрешения (ECCV 2026)
Tencent HunyuanViQ представляет фреймворк дискретного визуального представления, построенный на визуальной башне SigLIP2 с позиционно-осведомлённой, пошаговой конечной скалярной квантизацией (FSQ). Он преобразует изображения произвольного нативного разрешения в компактные дискретные коды, пригодные как для мультимодальных LLM (для понимания), так и для декодеров (для высококачественной реконструкции). Обучение проходит в два этапа: семантическое предобучение с выравниванием по тексту и дискретизация признаков через проксимальное обучение представлениям. ViQ соответствует непрерывным кодировщикам признаков на мультимодальных бенчмарках, обеспечивая при этом ускорение инференса на 20–70%. Принят на ECCV 2026.
Справочно (8)
Открывается AI Engineer World's Fair 2026; Anthropic анонсирует MCP Registry API
AI Engineer World's Fair 2026 открылась 29 июня в Moscone Center, Сан-Франциско: более 6000 инженеров, 300 докладчиков и 29 секций. Anthropic объявила официальный MCP Registry API на мероприятии — канонический каталог MCP-серверов, который инструменты разработки вроде Claude Code, Codex и OpenCode могут использовать программно, формализуя MCP из протокола в производственную инфраструктуру.
DanceOPD: дистилляция генеративных полей на основе онлайн-выборки для унифицированной генерации изображений
ByteDance SeedDanceOPD рассматривает каждую возможность генерации изображений (text-to-image, локальное редактирование, глобальное редактирование) как поле скоростей и дистиллирует их в унифицированную студенческую модель flow-matching через онлайн-выборку. Для каждого обучающего примера студент направляется к одному замороженному полю возможностей, запрашивает его в состоянии малого шума при онлайн-выборке и согласовывает результирующую скорость с помощью локального MSE-лосса. Это позволяет избежать интерференции возможностей. Показатели редактирования улучшаются до 21.9% в отдельных категориях, а метрики text-to-image сохраняются или улучшаются до 2.0%. 64 голоса на HF Daily Papers.
Qwen-Image-Agent: агентное построение контекста для преодоления разрыва в неполноте промптов в T2I
Qwen (Alibaba)Qwen-Image-Agent решает проблему контекстного разрыва в text-to-image генерации: пользовательские промпты часто неполны, имплицитны или требуют актуальных знаний. Фреймворк итеративно строит полный контекст генерации через два модуля: Context-Aware Planning (выявление недостающего контекста) и Context Grounding (его сбор через рассуждение, веб-поиск, память и обратную связь с пользователем). Система достигает лучших показателей на IA-Bench (45.4%), WISE-Verified (0.9020) и MindBench (0.42). 41 голос на HF Daily Papers.
Галлюцинации в моделях мира предсказуемы и предотвратимы
UC San DiegoHansen и Wang переосмысляют галлюцинации в визуальных моделях мира как проблему покрытия данных, а не ёмкости модели. Выявлены три режима сбоев: перцептивный, маргинализованный по действиям и расходящийся по сцене. Выведены три внутримодельных сигнала, предсказывающих галлюцинации с корреляцией Спирмена около -0.80. Представлен MMBench2 — датасет из 427 часов и 210 задач с эталонными действиями и вознаграждениями. Обучение с учётом покрытия и дообучение с вознаграждением за любопытство позволяют адаптироваться к новым средам при наличии всего 50 траекторий. 41 голос на HF Daily Papers.
Горизонт верификации: ни одна функция вознаграждения не работает для агентов программирования при масштабировании
Qwen (Alibaba)Эта статья команды Qwen оспаривает предположение, что верификация — это простая половина подхода «сгенерировать, затем проверить» для агентов программирования. Изучив четыре конструкции вознаграждений для задач общего программирования, фронтенда и долгосрочных задач, авторы обнаруживают, что ни одна статическая функция вознаграждения не остаётся эффективной по мере роста возможностей политики. Верификация должна со-эволюционировать с генератором и характеризуется по трём осям: масштабируемость, достоверность и робастность.
Tencent Hunyuan публикует в открытый доступ UniRL: унифицированное RL-дообучение для LLM и диффузионных моделей
Tencent / HunyuanКоманда Tencent Hunyuan выпустила UniRL — фреймворк с открытым исходным кодом для унифицированного RL-дообучения LLM, визуально-языковых моделей и диффузионных/flow-matching-моделей. Он реализует единый цикл «генерация–оценка–преимущество–обновление–синхронизация», применимый к разнородным семействам моделей. В комплекте поставляются два алгоритма: Flow-DPPO для диффузионных/flow-моделей с масками доверительной области на основе точной дивергенции и DRPO для LLM со сглаженным квадратичным регуляризатором, взвешенным по преимуществу.
Claude Code v2.1.195: исправление матчера хуков для MCP-серверов с дефисами, управление мышью в полноэкранном режиме
AnthropicAnthropic выпустила Claude Code v2.1.195 26 июня. Исправлено: матчеры хуков с дефисными идентификаторами (например, mcp__brave-search) теперь используют точное совпадение вместо совпадения по подстроке — ошибка затрагивала все идентификаторы MCP-серверов, содержащие дефисы. Добавлена переменная CLAUDE_CODE_DISABLE_MOUSE_CLICKS для отключения кликов/перетаскивания/наведения мыши в полноэкранном режиме при сохранении прокрутки. Исправлена голосовая диктовка на macOS для длинных сессий и языков без пробелов между словами (японский, китайский, тайский).
Runway добавляет Seedance 2.0 Mini в API: более доступная генерация видео в 480p/720p
Runway / ByteDance26 июня Runway добавил Seedance 2.0 Mini (идентификатор модели: seedance2_mini) в свой API. Модель поддерживает текстовый, изображение и видеовход с управлением ключевыми кадрами, референсными изображениями, референсными видео и генерируемым аудио — тот же набор функций, что и у полного Seedance 2.0, но с более низким потолком разрешения (480p или 720p) и стоимостью 16 кредитов в секунду, примерно вдвое дешевле стандартного уровня. Длительность клипа — от 4 до 15 секунд.