Ежедневный дайджест
12 пунктов · ~12 мин · Неделя 2026-W23
Исключены как дубликаты предыдущих дайджестов: семейство моделей Microsoft MAI (2026-06-02), IPO S-1 Anthropic (2026-06-02), MiniMax M3 (2026-06-02), Qwen3.7-Plus (2026-06-02), MiniMax Hailuo 2.3 (2026-06-03), Ideogram 4.0 (2026-06-04), Suno Series D на $400 млн (2026-06-04). Исключено: GigaChat для Global South — все 3 источника являются синдикацией от Reuters (считается как 1 независимый источник, официального нет; не прошёл верификацию). Исключено: OpenClaw — единственный официальный источник github.com/openclaw/openclaw, мета-релиз 2026.6.2-beta без подтверждения в СМИ. Предупреждения по тегам (новые теги, мягкий режим): memory (новый). Примечание по исследованию: по данным HuggingFace trending, статья AIM набрала 101 голос; MLEvolve — 301 голос — оба выше порога значимости в 100 голосов.
Обязательно к прочтению (1)
MLEvolve: самоэволюционирующий мультиагентный LLM-фреймворк для автоматического поиска алгоритмов машинного обучения
MLEvolve — самоэволюционирующий мультиагентный LLM-фреймворк для автоматического поиска алгоритмов машинного обучения. Представлены: Progressive Monte Carlo Graph Search (MCGS) с межветочным информационным потоком, Retrospective Memory (база знаний холодного старта + динамическая память для конкретных задач) и иерархическое планирование, разделяющее стратегию и генерацию кода. На MLE-Bench фреймворк достигает рекордного медального рейтинга при бюджете 12 часов — вдвое меньше стандартного — и превосходит AlphaEvolve на задачах оптимизации математических алгоритмов. Исходный код открыт и доступен на GitHub.
Стоит знать (8)
Конгресс США опубликовал 269-страничный проект «Great American AI Act» с трёхлетним приоритетом над законами штатов
4 июня 2026 года члены Палаты представителей Джей Обернолте (R-CA) и Лори Трахан (D-MA) опубликовали двухпартийный обсуждаемый проект Great American AI Act объёмом 269 страниц — первую комплексную федеральную систему регулирования AI в США. Ключевые положения: трёхлетний приоритет над законами штатов об AI-разработке (с истечением срока действия; законы о внедрении не затрагиваются), официальное учреждение CAISI, $100 млн в год на Центр стандартов и инноваций в области AI, требования к управлению frontier-моделями и отчётность о влиянии на рынок труда. Проект подвергается критике со стороны профсоюзов и гражданского общества из-за широты приоритета над законами штатов.
Детерминированный горизонт: теоретико-информационное доказательство ограничений расширенного CoT и необходимости использования инструментов
В статье доказывается теорема Attention Bottleneck Theorem, устанавливающая теоретико-информационные пределы отслеживания состояния decoder-only трансформерами в рамках чисто нейронного цепочечного рассуждения. Deterministic Horizon существует примерно на уровне 19–31 шага, после которого точность падает сверхэкспоненциально. Для 12 моделей и 8 предметных областей (SWE-Bench, WebArena, SQL-Multi) рассуждение с интеграцией инструментов достигает точности 86–94% против 24–42% для нейронного CoT. Дообучение улучшает показатели менее чем на 5%, что подтверждает архитектурный, а не обучающий характер ограничений. Принята на ICML 2026.
Иллюзия самокоррекции: LLM исправляют чужие ошибки, но не свои — причина в ролевых метках
LLM охотно исправляют ошибки, представленные как внешний ввод, но не справляются с коррекцией идентичных ошибок, оформленных как собственный предыдущий вывод. Статья изолирует причину: ролевые метки шаблона чата (сообщение пользователя, внутренняя мысль, вывод инструмента, системная память), а не само содержимое. Переметка ошибочного внутреннего утверждения как внешнего источника увеличивает частоту явных исправлений на 23–93 процентных пункта для 7 семейств моделей и 3 предметных областей (p < 0,001 в 10/13 тестовых ячейках). Вмешательство на уровне структуры промпта, не требующее дообучения, обеспечивает значительные улучшения.
Audio Interaction Model: унифицированный стриминговый фреймворк, объединяющий офлайн и реальновременную обработку аудио по инструкциям
Исследователи из Национального университета Сингапура опубликовали Audio Interaction Model (AIM) — унифицированный стриминговый аудиофреймворк, объединяющий офлайн-выполнение задач (транскрипция, перевод, генерация музыки) и реальновременное следование аудиоинструкциям через сквозную архитектуру. AIM обеспечивает одновременно низкую задержку при стриминге и высокое качество офлайн-обработки аудио без отдельных моделей для каждого режима работы и набрал 101 голос на HuggingFace Daily Papers.
OpenAI запускает Dreaming V3: фоновый синтез памяти для ChatGPT с пятикратным снижением вычислительных затрат
OpenAI4–5 июня 2026 года OpenAI начала поэтапное развёртывание Dreaming V3 — фонового процесса, который автоматически синтезирует память ChatGPT сразу из множества разговоров, заменяя ручной список сохранённых воспоминаний. Система ставит приоритет на актуальность (автоматическое обновление устаревших записей), непрерывность (связывание сессий на протяжении дней и недель) и фильтрацию по релевантности. Внутренние оценки точности фактического воспроизведения выросли с 41,5% (2024) до 82,8% (2026). Примерно пятикратное снижение вычислительных затрат делает развёртывание для бесплатного уровня экономически обоснованным; пользователи Plus и Pro в США получают доступ первыми.
OpenAI выпускает Lockdown Mode для блокировки эксфильтрации через prompt injection в ChatGPT
OpenAI5 июня 2026 года OpenAI запустила Lockdown Mode — опциональную расширенную настройку безопасности, ограничивающую исходящие сетевые возможности ChatGPT (веб-поиск, Deep Research, Agent Mode, загрузка файлов) для блокировки эксфильтрации данных через атаки prompt injection. Доступно для всех авторизованных личных аккаунтов (Free, Plus, Pro) и самообслуживаемого ChatGPT Business. Сопутствующая метка Elevated Risk отображается в ChatGPT, ChatGPT Atlas и Codex для предупреждения о высокорискованных операциях.
xAI Grok Imagine Video 1.5: image-to-video с нативным звуком возглавляет Arena Leaderboard, API уже доступен
xAI30–31 мая 2026 года xAI выпустила Grok Imagine Video 1.5 в режиме превью; 3 июня API стал доступен на api.x.ai под псевдонимом `grok-imagine-video-1.5-2026-05-30`. Модель анимирует неподвижное изображение (или текстовый запрос) в видеоклип с нативным синхронизированным звуком — музыкой, звуковыми эффектами и губной синхронизацией диалогов — с поддержкой расширения видео и генерации с использованием референса в разрешении 720p. При запуске модель заняла первое место в Image-to-Video Arena leaderboard, опередив v1.0 на 52 очка Elo. Цены: $0,08/с при 480p, $0,14/с при 720p.
Google Veo 3.1 добавляет звук во все режимы редактирования Flow и новые инструменты Insert/Remove
Google DeepMind5 июня 2026 года Google опубликовала официальное обновление с анонсом новых возможностей Veo 3.1 в платформе видеомонтажа Flow. Обновление добавляет генерацию звука в ранее беззвучные функции — Ingredients to Video, Frames to Video и Extend — а также вводит инструменты точного редактирования: функцию Insert для добавления новых элементов сцены с реалистичным освещением и готовящийся инструмент Remove для удаления нежелательных объектов с восстановлением фона. Veo 3.1 также доступен через Gemini API и Vertex AI. С момента запуска на Flow создано более 275 миллионов видео.
Справочно (3)
Сбер представил мультиагентного бизнес-ассистента на базе GigaChat для корпоративного банкинга на ПМЭФ 2026
SberНа Петербургском международном экономическом форуме (ПМЭФ, 3–6 июня 2026 года) Сбер анонсировал нового Бизнес-ассистента для мобильного приложения СберБизнес — разговорный AI-интерфейс на базе GigaChat, заменяющий традиционный интернет-банк. Система использует мультиагентную архитектуру с более чем 160 специализированными AI-агентами, охватывающими платежи, счета, аналитику и документооборот. Ограниченная консультационная версия уже обрабатывает более 7,5 миллиона запросов от свыше одного миллиона предпринимателей. Полное развёртывание запланировано на осень 2026 года.
Claude Code v2.1.166: настройка резервной модели, расширенные glob-правила запрета, межсессионная безопасность
AnthropicClaude Code v2.1.166 (впервые замечен 6 июня) добавляет настройку `fallbackModel` для конфигурации до трёх резервных моделей, перебираемых по порядку при перегрузке основной, расширенную поддержку glob в правилах запрета и усиленную безопасность межсессионных сообщений. Также отключается thinking для моделей, у которых он включён по умолчанию, через `MAX_THINKING_TOKENS=0` и переключатели для конкретных моделей. Исправлен широкий спектр ошибок терминала, аутентификации, сессий и UI, включая повторяющиеся проблемы с отрисовкой терминала JetBrains, зависания валидации команд PowerShell и сброс аутентификации в голосовом режиме. Два более ранних выпуска 5 июня (v2.1.163, v2.1.165) добавили `/plugin list` с фильтрацией, управляемые настройки `requiredMinimumVersion`/`requiredMaximumVersion` и возврат `additionalContext` из хуков.
OpenCode v1.16: клонирование рабочих пространств, запуск на 38% быстрее, провайдер Snowflake Cortex, воспроизведение сессий
5 июня 2026 года OpenCode (SST) выпустила v1.16.0 и v1.16.2. В v1.16.0 добавлено управляемое клонирование рабочих пространств с сохранением изменённых и неотслеживаемых файлов, перемещение сессий между рабочими пространствами, корректная поддержка моделей OpenAI через AWS Bedrock, обнаружение навыков с загрузкой агентов из файлов, новые цветовые темы и выбор уровня thinking для десктопа, а также режим `run --replay` для интерактивного воспроизведения сессий. Время запуска ускорилось на 38%. В v1.16.2 исправлено выполнение reasoning summaries только для поддерживающих их провайдеров (устраняет сбои GPT-5), отказ от нечётких совпадений редактирования для предотвращения перезаписи неправильного кода, зависания сессий Bedrock, добавлена навигация по фрагментам в просмотрщике diff и Snowflake Cortex как новый LLM-провайдер.