Ежедневный дайджест

6 июня 2026

12 пунктов · ~12 мин · Неделя 2026-W23

Исключены как дубликаты предыдущих дайджестов: семейство моделей Microsoft MAI (2026-06-02), IPO S-1 Anthropic (2026-06-02), MiniMax M3 (2026-06-02), Qwen3.7-Plus (2026-06-02), MiniMax Hailuo 2.3 (2026-06-03), Ideogram 4.0 (2026-06-04), Suno Series D на $400 млн (2026-06-04). Исключено: GigaChat для Global South — все 3 источника являются синдикацией от Reuters (считается как 1 независимый источник, официального нет; не прошёл верификацию). Исключено: OpenClaw — единственный официальный источник github.com/openclaw/openclaw, мета-релиз 2026.6.2-beta без подтверждения в СМИ. Предупреждения по тегам (новые теги, мягкий режим): memory (новый). Примечание по исследованию: по данным HuggingFace trending, статья AIM набрала 101 голос; MLEvolve — 301 голос — оба выше порога значимости в 100 голосов.

Обязательно к прочтению (1)

исследования официальный 2 ист. ~1 мин

MLEvolve — самоэволюционирующий мультиагентный LLM-фреймворк для автоматического поиска алгоритмов машинного обучения. Представлены: Progressive Monte Carlo Graph Search (MCGS) с межветочным информационным потоком, Retrospective Memory (база знаний холодного старта + динамическая память для конкретных задач) и иерархическое планирование, разделяющее стратегию и генерацию кода. На MLE-Bench фреймворк достигает рекордного медального рейтинга при бюджете 12 часов — вдвое меньше стандартного — и превосходит AlphaEvolve на задачах оптимизации математических алгоритмов. Исходный код открыт и доступен на GitHub.

Почему это важно

Автоматический поиск алгоритмов, превзошедший AlphaEvolve, свидетельствует о том, что LLM-агенты способны вести полноценные AI-исследования. Статья набрала 301 голос на HuggingFace Daily Papers — наибольший показатель за рассматриваемый период.

#automated-research #algorithm-discovery #agents #multi-agent #paper

Стоит знать (8)

индустрия офиц. + СМИ 3 ист. ~1 мин

4 июня 2026 года члены Палаты представителей Джей Обернолте (R-CA) и Лори Трахан (D-MA) опубликовали двухпартийный обсуждаемый проект Great American AI Act объёмом 269 страниц — первую комплексную федеральную систему регулирования AI в США. Ключевые положения: трёхлетний приоритет над законами штатов об AI-разработке (с истечением срока действия; законы о внедрении не затрагиваются), официальное учреждение CAISI, $100 млн в год на Центр стандартов и инноваций в области AI, требования к управлению frontier-моделями и отчётность о влиянии на рынок труда. Проект подвергается критике со стороны профсоюзов и гражданского общества из-за широты приоритета над законами штатов.

Почему это важно

Первая серьёзная попытка создать федеральную систему регулирования AI в США, которая на три года заменит законы Калифорнии, Колорадо и других штатов в критически важный период развития отрасли.

#regulation #policy #us #safety

исследования официальный 1 ист. ~1 мин

В статье доказывается теорема Attention Bottleneck Theorem, устанавливающая теоретико-информационные пределы отслеживания состояния decoder-only трансформерами в рамках чисто нейронного цепочечного рассуждения. Deterministic Horizon существует примерно на уровне 19–31 шага, после которого точность падает сверхэкспоненциально. Для 12 моделей и 8 предметных областей (SWE-Bench, WebArena, SQL-Multi) рассуждение с интеграцией инструментов достигает точности 86–94% против 24–42% для нейронного CoT. Дообучение улучшает показатели менее чем на 5%, что подтверждает архитектурный, а не обучающий характер ограничений. Принята на ICML 2026.

Почему это важно

Обеспечивает строгое теоретическое обоснование необходимости агентного использования инструментов — не просто эмпирически лучшего, но доказуемо обязательного после определённого порога сложности — и закладывает принципиальную основу для проектирования агентных архитектур.

#chain-of-thought #reasoning #agents #paper #icml-2026

исследования официальный 1 ист. ~1 мин

LLM охотно исправляют ошибки, представленные как внешний ввод, но не справляются с коррекцией идентичных ошибок, оформленных как собственный предыдущий вывод. Статья изолирует причину: ролевые метки шаблона чата (сообщение пользователя, внутренняя мысль, вывод инструмента, системная память), а не само содержимое. Переметка ошибочного внутреннего утверждения как внешнего источника увеличивает частоту явных исправлений на 23–93 процентных пункта для 7 семейств моделей и 3 предметных областей (p < 0,001 в 10/13 тестовых ячейках). Вмешательство на уровне структуры промпта, не требующее дообучения, обеспечивает значительные улучшения.

Почему это важно

Переосмысляет сбои самокоррекции LLM как артефакт структуры промпта, а не фундаментальное когнитивное ограничение — это одновременно более практично (устраняется через промптинг) и раскрывает, насколько чувствительно поведение модели к фреймингу.

#reasoning #hallucination #paper

исследования официальный 1 ист. ~1 мин

Исследователи из Национального университета Сингапура опубликовали Audio Interaction Model (AIM) — унифицированный стриминговый аудиофреймворк, объединяющий офлайн-выполнение задач (транскрипция, перевод, генерация музыки) и реальновременное следование аудиоинструкциям через сквозную архитектуру. AIM обеспечивает одновременно низкую задержку при стриминге и высокое качество офлайн-обработки аудио без отдельных моделей для каждого режима работы и набрал 101 голос на HuggingFace Daily Papers.

Почему это важно

Объединение реальновременной и офлайн-обработки аудио в единой сквозной модели устраняет ключевой архитектурный компромисс, вынуждающий большинство современных систем выбирать один из режимов.

#streaming #paper #multimodal #speech

инструменты офиц. + СМИ 3 ист. ~1 мин

4–5 июня 2026 года OpenAI начала поэтапное развёртывание Dreaming V3 — фонового процесса, который автоматически синтезирует память ChatGPT сразу из множества разговоров, заменяя ручной список сохранённых воспоминаний. Система ставит приоритет на актуальность (автоматическое обновление устаревших записей), непрерывность (связывание сессий на протяжении дней и недель) и фильтрацию по релевантности. Внутренние оценки точности фактического воспроизведения выросли с 41,5% (2024) до 82,8% (2026). Примерно пятикратное снижение вычислительных затрат делает развёртывание для бесплатного уровня экономически обоснованным; пользователи Plus и Pro в США получают доступ первыми.

Почему это важно

Крупнейшая переработка памяти с момента запуска ChatGPT — молчаливый фоновый синтез означает, что пользователям теперь нужно проверять автоматически сделанные выводы, а не только явно сохранённые записи.

#openai #chatgpt #personalization #memory #release

инструменты офиц. + СМИ 3 ист. ~1 мин

5 июня 2026 года OpenAI запустила Lockdown Mode — опциональную расширенную настройку безопасности, ограничивающую исходящие сетевые возможности ChatGPT (веб-поиск, Deep Research, Agent Mode, загрузка файлов) для блокировки эксфильтрации данных через атаки prompt injection. Доступно для всех авторизованных личных аккаунтов (Free, Plus, Pro) и самообслуживаемого ChatGPT Business. Сопутствующая метка Elevated Risk отображается в ChatGPT, ChatGPT Atlas и Codex для предупреждения о высокорискованных операциях.

Почему это важно

Prompt injection — главный вектор атак на LLM-агентов, работающих с чувствительными данными; Lockdown Mode — первый детерминированный, управляемый пользователем механизм от крупной лаборатории, устраняющий звено эксфильтрации в цепочке атаки.

#openai #chatgpt #security #agents #release

видео офиц. + СМИ 3 ист. ~1 мин

30–31 мая 2026 года xAI выпустила Grok Imagine Video 1.5 в режиме превью; 3 июня API стал доступен на api.x.ai под псевдонимом `grok-imagine-video-1.5-2026-05-30`. Модель анимирует неподвижное изображение (или текстовый запрос) в видеоклип с нативным синхронизированным звуком — музыкой, звуковыми эффектами и губной синхронизацией диалогов — с поддержкой расширения видео и генерации с использованием референса в разрешении 720p. При запуске модель заняла первое место в Image-to-Video Arena leaderboard, опередив v1.0 на 52 очка Elo. Цены: $0,08/с при 480p, $0,14/с при 720p.

Почему это важно

Первое место в Image-to-Video Arena leaderboard сразу при запуске; нативная синхронизация звука непосредственно в генерации видео по-прежнему редко встречается в публично доступных моделях.

#grok #xai #image-to-video #video-generation #api #release

видео офиц. + СМИ 3 ист. ~1 мин

5 июня 2026 года Google опубликовала официальное обновление с анонсом новых возможностей Veo 3.1 в платформе видеомонтажа Flow. Обновление добавляет генерацию звука в ранее беззвучные функции — Ingredients to Video, Frames to Video и Extend — а также вводит инструменты точного редактирования: функцию Insert для добавления новых элементов сцены с реалистичным освещением и готовящийся инструмент Remove для удаления нежелательных объектов с восстановлением фона. Veo 3.1 также доступен через Gemini API и Vertex AI. С момента запуска на Flow создано более 275 миллионов видео.

Почему это важно

Добавление нативного звука во все режимы редактирования Flow сокращает разрыв между AI-генерацией видео и профессиональным постпродакшном; инструменты редактирования Insert/Remove переводят Veo в категорию полноценных платформ видеомонтажа.

#google-deepmind #video-generation #video-editing #text-to-video #gemini #release

Справочно (3)

индустрия офиц. + СМИ 3 ист. ~1 мин

На Петербургском международном экономическом форуме (ПМЭФ, 3–6 июня 2026 года) Сбер анонсировал нового Бизнес-ассистента для мобильного приложения СберБизнес — разговорный AI-интерфейс на базе GigaChat, заменяющий традиционный интернет-банк. Система использует мультиагентную архитектуру с более чем 160 специализированными AI-агентами, охватывающими платежи, счета, аналитику и документооборот. Ограниченная консультационная версия уже обрабатывает более 7,5 миллиона запросов от свыше одного миллиона предпринимателей. Полное развёртывание запланировано на осень 2026 года.

Почему это важно

Сбер выводит GigaChat за рамки потребительского чатбота в полноценную операционную систему для корпоративного банкинга с агентной архитектурой, полностью заменяющей структурированный UI — одно из наиболее конкретных производственных внедрений российской LLM в высокорисковых финансовых рабочих процессах.

#gigachat #russia #enterprise #agents #release

инструменты официальный 2 ист. ~1 мин

Claude Code v2.1.166 (впервые замечен 6 июня) добавляет настройку `fallbackModel` для конфигурации до трёх резервных моделей, перебираемых по порядку при перегрузке основной, расширенную поддержку glob в правилах запрета и усиленную безопасность межсессионных сообщений. Также отключается thinking для моделей, у которых он включён по умолчанию, через `MAX_THINKING_TOKENS=0` и переключатели для конкретных моделей. Исправлен широкий спектр ошибок терминала, аутентификации, сессий и UI, включая повторяющиеся проблемы с отрисовкой терминала JetBrains, зависания валидации команд PowerShell и сброс аутентификации в голосовом режиме. Два более ранних выпуска 5 июня (v2.1.163, v2.1.165) добавили `/plugin list` с фильтрацией, управляемые настройки `requiredMinimumVersion`/`requiredMaximumVersion` и возврат `additionalContext` из хуков.

Почему это важно

Настройка резервной модели — значимое улучшение надёжности для производственных развёртываний, где доступность основной модели может быть непредсказуемой.

#claude-code #anthropic #cli #coding-agent #security #release

инструменты официальный 2 ист. ~1 мин

5 июня 2026 года OpenCode (SST) выпустила v1.16.0 и v1.16.2. В v1.16.0 добавлено управляемое клонирование рабочих пространств с сохранением изменённых и неотслеживаемых файлов, перемещение сессий между рабочими пространствами, корректная поддержка моделей OpenAI через AWS Bedrock, обнаружение навыков с загрузкой агентов из файлов, новые цветовые темы и выбор уровня thinking для десктопа, а также режим `run --replay` для интерактивного воспроизведения сессий. Время запуска ускорилось на 38%. В v1.16.2 исправлено выполнение reasoning summaries только для поддерживающих их провайдеров (устраняет сбои GPT-5), отказ от нечётких совпадений редактирования для предотвращения перезаписи неправильного кода, зависания сессий Bedrock, добавлена навигация по фрагментам в просмотрщике diff и Snowflake Cortex как новый LLM-провайдер.

Почему это важно

Клонирование рабочих пространств и воспроизведение сессий — значительные улучшения удобства работы для процессов разработки с несколькими рабочими пространствами; поддержка Snowflake Cortex расширяет корпоративное покрытие.

#opencode #coding-agent #cli #open-source #release

6 июня 2026

Обязательно к прочтению (1)

MLEvolve: самоэволюционирующий мультиагентный LLM-фреймворк для автоматического поиска алгоритмов машинного обучения

Стоит знать (8)

Конгресс США опубликовал 269-страничный проект «Great American AI Act» с трёхлетним приоритетом над законами штатов

Детерминированный горизонт: теоретико-информационное доказательство ограничений расширенного CoT и необходимости использования инструментов

Иллюзия самокоррекции: LLM исправляют чужие ошибки, но не свои — причина в ролевых метках

Audio Interaction Model: унифицированный стриминговый фреймворк, объединяющий офлайн и реальновременную обработку аудио по инструкциям

OpenAI запускает Dreaming V3: фоновый синтез памяти для ChatGPT с пятикратным снижением вычислительных затрат

OpenAI выпускает Lockdown Mode для блокировки эксфильтрации через prompt injection в ChatGPT

xAI Grok Imagine Video 1.5: image-to-video с нативным звуком возглавляет Arena Leaderboard, API уже доступен

Google Veo 3.1 добавляет звук во все режимы редактирования Flow и новые инструменты Insert/Remove

Сбер представил мультиагентного бизнес-ассистента на базе GigaChat для корпоративного банкинга на ПМЭФ 2026

Claude Code v2.1.166: настройка резервной модели, расширенные glob-правила запрета, межсессионная безопасность

OpenCode v1.16: клонирование рабочих пространств, запуск на 38% быстрее, провайдер Snowflake Cortex, воспроизведение сессий