Ежедневный дайджест

28 июня 2026

12 пунктов · ~12 мин · Неделя 2026-W26

Обязательно к прочтению (2)

индустрия офиц. + СМИ 4 ист. ~1 мин

27 июня Министерство торговли США уведомило Anthropic о том, что Claude Mythos 5 может быть повторно развёрнут примерно для 100 американских организаций, эксплуатирующих и защищающих критическую инфраструктуру — энергетику, здравоохранение, финансовые услуги и телекоммуникации. Claude Fable 5 (публичная модель) остаётся под запретом. Anthropic продолжает переговоры о расширении доступа к Mythos 5 и возврате Fable 5. Первоначальное предписание об экспортном контроле было введено 12 июня после того, как исследователи Amazon выявили векторы взлома защиты в системе кибербезопасности Fable 5.

Почему это важно

Это первая частичная отмена экспортного контроля правительства США, применённого к коммерческой модели ИИ, формирующая отраслевую систему доверенного доступа. Фронтирные модели с возможностями автономного обнаружения уязвимостей теперь подпадают под режимы экспортного контроля, ранее применявшиеся к вооружениям и полупроводниковым технологиям.

#mythos-5 #fable-5 #export-controls #us-policy #cybersecurity #national-security

модели/LLM офиц. + СМИ 4 ист. ~1 мин

OpenAI запустила ограниченный предварительный показ GPT-5.6 26 июня, включающий три уровня: Sol (флагман, $5/$30 за 1M токенов, с мультиагентной оркестровкой в «ultra mode»), Terra (сбалансированный, $2.50/$15) и Luna (быстрый, $1/$6). Доступ ограничен примерно 20 предварительно одобренными организациями по запросу правительства США для оценки перед широким выпуском. Sol занимает первое место в Terminal-Bench 2.1 по агентному программированию и ~53.5% в SecureBio Virology Capabilities Test. Пользователи ChatGPT остаются на GPT-5.5; общая доступность ожидается в течение нескольких недель. GPT-4.5 был выведен из ChatGPT в тот же день.

Почему это важно

Принудительное правительственное ограничение на предвыпуск GPT-5.6 создаёт прецедент для развёртывания фронтирных моделей: правительство США теперь активно контролирует, кто получает ранний доступ к наиболее мощным системам ИИ. Трёхуровневая структура ценообразования также сигнализирует о том, что ИИ топового уровня по умолчанию становится всё более агентным.

#gpt-5.6 #reasoning #agentic #api #us-policy #safety

Стоит знать (2)

индустрия только СМИ 2 ист. ~1 мин

DeepSeek завершила крупнейший в истории Китая раунд финансирования ИИ-стартапа — около 50 млрд юаней (~$7.4 млрд) — с Tencent и CATL в роли крупнейших частных инвесторов наряду с государственным Национальным инвестиционным фондом ИИ-индустрии. Постинвестиционная оценка составляет около 350–400 млрд юаней (~$52–59 млрд). Bloomberg сообщил 25 июня, что одновременно DeepSeek объявила о планах как минимум удвоить численность каждого отдела, с акцентом на предобучение, данные, агентную инфраструктуру и межотраслевые роли в ИИ. В настоящее время в компании работают около 150–170 человек.

Почему это важно

Первое внешнее финансирование DeepSeek сигнализирует о переходе от компактной исследовательской лаборатории к операционно масштабируемой компании. Раунд $7.4 млрд входит в число крупнейших инвестиций в ИИ-стартапы в мире в 2026 году, а государственное со-инвестирование наряду со стратегическими корпоративными партнёрами даёт DeepSeek вычислительный и инфраструктурный рычаг для долгосрочной конкуренции с OpenAI и Anthropic.

#funding #deepseek #hiring #china-ai #open-source

исследования офиц. + СМИ 2 ист. ~1 мин

ViQ представляет фреймворк дискретного визуального представления, построенный на визуальной башне SigLIP2 с позиционно-осведомлённой, пошаговой конечной скалярной квантизацией (FSQ). Он преобразует изображения произвольного нативного разрешения в компактные дискретные коды, пригодные как для мультимодальных LLM (для понимания), так и для декодеров (для высококачественной реконструкции). Обучение проходит в два этапа: семантическое предобучение с выравниванием по тексту и дискретизация признаков через проксимальное обучение представлениям. ViQ соответствует непрерывным кодировщикам признаков на мультимодальных бенчмарках, обеспечивая при этом ускорение инференса на 20–70%. Принят на ECCV 2026.

Почему это важно

Дискретные визуальные токены являются ключевым узким местом для унифицированных моделей изображение-язык: предыдущие методы жертвовали либо качеством реконструкции ради семантики, либо наоборот. Агностичная к разрешению, текстово-выровненная квантизация ViQ устраняет этот разрыв. 80 голосов на HF Daily Papers.

#multimodal #visual-tokenization #quantization #representation-learning #eccv-2026

Справочно (8)

индустрия официальный 1 ист. ~1 мин

AI Engineer World's Fair 2026 открылась 29 июня в Moscone Center, Сан-Франциско: более 6000 инженеров, 300 докладчиков и 29 секций. Anthropic объявила официальный MCP Registry API на мероприятии — канонический каталог MCP-серверов, который инструменты разработки вроде Claude Code, Codex и OpenCode могут использовать программно, формализуя MCP из протокола в производственную инфраструктуру.

Почему это важно

MCP Registry API даёт разработчикам стандартизированный способ обнаруживать и интегрировать MCP-серверы во всех основных агентах разработки. Конференция является крупнейшим собранием практиков ИИ-инженерии в 2026 году.

#conference #mcp #mcp-registry #agents #tools

исследования офиц. + СМИ 2 ист. ~1 мин

DanceOPD рассматривает каждую возможность генерации изображений (text-to-image, локальное редактирование, глобальное редактирование) как поле скоростей и дистиллирует их в унифицированную студенческую модель flow-matching через онлайн-выборку. Для каждого обучающего примера студент направляется к одному замороженному полю возможностей, запрашивает его в состоянии малого шума при онлайн-выборке и согласовывает результирующую скорость с помощью локального MSE-лосса. Это позволяет избежать интерференции возможностей. Показатели редактирования улучшаются до 21.9% в отдельных категориях, а метрики text-to-image сохраняются или улучшаются до 2.0%. 64 голоса на HF Daily Papers.

Почему это важно

Объединение разнообразных генеративных возможностей без катастрофического забывания — устойчивая проблема в генерации изображений. Подход дистилляции на основе онлайн-выборки в DanceOPD архитектурно чист и демонстрирует сильные эмпирические результаты по всем трём измерениям возможностей.

#image-generation #flow-matching #distillation #multi-capability #generative-models

исследования офиц. + СМИ 2 ист. ~1 мин

Qwen-Image-Agent решает проблему контекстного разрыва в text-to-image генерации: пользовательские промпты часто неполны, имплицитны или требуют актуальных знаний. Фреймворк итеративно строит полный контекст генерации через два модуля: Context-Aware Planning (выявление недостающего контекста) и Context Grounding (его сбор через рассуждение, веб-поиск, память и обратную связь с пользователем). Система достигает лучших показателей на IA-Bench (45.4%), WISE-Verified (0.9020) и MindBench (0.42). 41 голос на HF Daily Papers.

Почему это важно

Большинство исследований T2I фокусируется на качестве модели; этот подход нацелен на разрыв при развёртывании, когда реальные пользователи дают неполные промпты. Агентный цикл построения контекста отражает то, как люди описывают творческие задачи дизайнерам.

#image-generation #agentic #multimodal #retrieval #text-to-image

исследования офиц. + СМИ 2 ист. ~1 мин

Hansen и Wang переосмысляют галлюцинации в визуальных моделях мира как проблему покрытия данных, а не ёмкости модели. Выявлены три режима сбоев: перцептивный, маргинализованный по действиям и расходящийся по сцене. Выведены три внутримодельных сигнала, предсказывающих галлюцинации с корреляцией Спирмена около -0.80. Представлен MMBench2 — датасет из 427 часов и 210 задач с эталонными действиями и вознаграждениями. Обучение с учётом покрытия и дообучение с вознаграждением за любопытство позволяют адаптироваться к новым средам при наличии всего 50 траекторий. 41 голос на HF Daily Papers.

Почему это важно

Модели мира лежат в основе предиктивного управления для робототехники. Переосмысление галлюцинаций как проблемы покрытия данных и предоставление прогностических диагностических сигналов — практически применимые результаты с прямым влиянием на развёртывание роботов в новых средах.

#world-models #hallucination #robustness #model-based-rl #robotics #embodied-ai

исследования офиц. + СМИ 2 ист. ~1 мин

Эта статья команды Qwen оспаривает предположение, что верификация — это простая половина подхода «сгенерировать, затем проверить» для агентов программирования. Изучив четыре конструкции вознаграждений для задач общего программирования, фронтенда и долгосрочных задач, авторы обнаруживают, что ни одна статическая функция вознаграждения не остаётся эффективной по мере роста возможностей политики. Верификация должна со-эволюционировать с генератором и характеризуется по трём осям: масштабируемость, достоверность и робастность.

Почему это важно

Взлом вознаграждений и игра на спецификациях — центральные проблемы при обучении способных агентов программирования. Статья предоставляет строгую систему для режимов сбоев верификации на фронтире с прямыми последствиями для разработки RL-пайплайнов в лабораториях.

#rl #reward-hacking #coding-agents #agentic-rl #scalable-oversight #verification

исследования официальный 1 ист. ~1 мин

Команда Tencent Hunyuan выпустила UniRL — фреймворк с открытым исходным кодом для унифицированного RL-дообучения LLM, визуально-языковых моделей и диффузионных/flow-matching-моделей. Он реализует единый цикл «генерация–оценка–преимущество–обновление–синхронизация», применимый к разнородным семействам моделей. В комплекте поставляются два алгоритма: Flow-DPPO для диффузионных/flow-моделей с масками доверительной области на основе точной дивергенции и DRPO для LLM со сглаженным квадратичным регуляризатором, взвешенным по преимуществу.

Почему это важно

RL-дообучение стало доминирующим путём к качеству фронтирных моделей. UniRL — один из первых публичных фреймворков, объединяющих этот пайплайн для семейств моделей текста, зрения и генерации изображений в единой кодовой базе.

#reinforcement-learning #post-training #open-source #diffusion #rlhf #framework

инструменты официальный 1 ист. ~1 мин

Anthropic выпустила Claude Code v2.1.195 26 июня. Исправлено: матчеры хуков с дефисными идентификаторами (например, mcp__brave-search) теперь используют точное совпадение вместо совпадения по подстроке — ошибка затрагивала все идентификаторы MCP-серверов, содержащие дефисы. Добавлена переменная CLAUDE_CODE_DISABLE_MOUSE_CLICKS для отключения кликов/перетаскивания/наведения мыши в полноэкранном режиме при сохранении прокрутки. Исправлена голосовая диктовка на macOS для длинных сессий и языков без пробелов между словами (японский, китайский, тайский).

Почему это важно

Ошибка матчера хуков затрагивала значительную часть реальных конфигураций MCP, поскольку дефисные имена серверов являются доминирующим соглашением. Исправление разблокирует производственные пайплайны, вынужденные обходить некорректную маршрутизацию хуков.

#claude-code #coding-agent #cli #mcp #voice-dictation

видео официальный 1 ист. ~1 мин

26 июня Runway добавил Seedance 2.0 Mini (идентификатор модели: seedance2_mini) в свой API. Модель поддерживает текстовый, изображение и видеовход с управлением ключевыми кадрами, референсными изображениями, референсными видео и генерируемым аудио — тот же набор функций, что и у полного Seedance 2.0, но с более низким потолком разрешения (480p или 720p) и стоимостью 16 кредитов в секунду, примерно вдвое дешевле стандартного уровня. Длительность клипа — от 4 до 15 секунд.

Почему это важно

Seedance 2.0 Mini делает ведущую модель генерации видео от ByteDance доступной более широкой аудитории разработчиков по существенно меньшей стоимости. В сочетании с уровнем 4K, добавленным 24 июня, Runway теперь предлагает полный спектр соотношения цены и качества Seedance 2.0 через единый API.

#text-to-video #image-to-video #video-to-video #api #seedance

28 июня 2026

Обязательно к прочтению (2)

Правительство США частично восстановило доступ к Anthropic Mythos 5 примерно для 100 организаций критической инфраструктуры

OpenAI представляет семейство GPT-5.6: Sol, Terra и Luna — ограниченный выпуск только для одобренных правительством организаций

Стоит знать (2)

DeepSeek закрывает раунд финансирования на $7.4 млрд и планирует удвоить штат всех отделов

ViQ: текстово-выровненные дискретные визуальные представления с поддержкой произвольного разрешения (ECCV 2026)

Открывается AI Engineer World's Fair 2026; Anthropic анонсирует MCP Registry API

DanceOPD: дистилляция генеративных полей на основе онлайн-выборки для унифицированной генерации изображений

Qwen-Image-Agent: агентное построение контекста для преодоления разрыва в неполноте промптов в T2I

Галлюцинации в моделях мира предсказуемы и предотвратимы

Горизонт верификации: ни одна функция вознаграждения не работает для агентов программирования при масштабировании

Tencent Hunyuan публикует в открытый доступ UniRL: унифицированное RL-дообучение для LLM и диффузионных моделей

Claude Code v2.1.195: исправление матчера хуков для MCP-серверов с дефисами, управление мышью в полноэкранном режиме

Runway добавляет Seedance 2.0 Mini в API: более доступная генерация видео в 480p/720p