Ежедневный дайджест
10 пунктов · ~10 мин · Неделя 2026-W24
Стоит знать (4)
ElevenLabs Music v2: смена жанра по ходу трека, inpainting и коммерческий клиренс
ElevenLabsElevenLabs выпустила Music v2 26 мая 2026 года, представив переходы между жанрами в середине трека (например, опера в хэви-метал в рамках одной композиции), пошаговое структурное построение (вступление, куплет, припев, бридж, аутро), audio inpainting для регенерации отдельных сегментов без влияния на остальную часть, встраивание немузыкальных звуковых эффектов внутри треков, а также плотную лирическую подачу включая быстрый рэп. Модель обучена исключительно на лицензионных данных и разрешена для коммерческого использования без платы за синхронизацию. Цены снижены до 50% для ElevenAPI и до 40% для самообслуживания ElevenCreative.
Claude Code v2.1.169: флаг Safe Mode, команда /cd и настройка disableBundledSkills
AnthropicВерсия 2.1.169 (8 июня 2026) добавляет флаг `--safe-mode` (и переменную среды `CLAUDE_CODE_SAFE_MODE`), который отключает все кастомизации — CLAUDE.md, плагины, навыки, хуки, MCP-серверы — для чистой диагностики. Команда `/cd` позволяет переключить сессию в новую рабочую директорию без сброса кеша промптов. Настройка `disableBundledSkills` скрывает встроенные навыки и slash-команды от модели. Среди исправлений: навигация стрелками Up/Down в длинных строках ввода, ошибки применения политик MCP в корпоративной среде, зависание UI на macOS для пользователей, аутентифицированных через claude.ai, и медленная работа `claude -p` на Windows (регрессия из v2.1.161). Предыдущая версия v2.1.166 (6 июня) добавила поддержку `fallbackModel` с возможностью указать до трёх резервных моделей, поддержку glob-паттернов в правилах запрета и усиленную защиту безопасности межсессионных сообщений.
Cursor 3.7: Design Mode в канвасах, отчёты об использовании контекста и вложенные субагенты SDK
CursorCursor 3.7 (4–5 июня 2026) представляет Design Mode в канвасах: разработчики кликают, рисуют или голосом описывают изменения UI прямо поверх отрендеренных компонентов, направляя правки без написания описаний. Множественное выделение и голосовой ввод работают пока агент выполняет задачу. Новый интерактивный отчёт об использовании контекста в канвасах показывает распределение токенов по системному промпту, определениям инструментов, правилам, навыкам и другим элементам. Обновление SDK добавляет кастомные инструменты через `local.customTools`, автоматическую маршрутизацию проверок для вызовов инструментов, варианты хранения JSONL и кастомные хранилища, а также вложенные субагенты, способные порождать собственные субагенты на любую глубину. Корпоративные клиенты получили управление мультикомандными организациями с раздельными настройками безопасности, управления и бюджета (GA с 3 июня).
vLLM Semantic Router v0.3 Themis: производственная маршрутизация с сохранением состояния и Session-Aware Agentic Routing
vLLM Semantic Router v0.3 (кодовое имя Themis), выпущен 5 июня 2026, превращает маршрутизацию из инструмента классификации в полноценную производственную систему с сохранением состояния и наблюдаемостью. Ключевые нововведения: унифицированный формат конфигурации v0.3, устраняющий фрагментацию диалектов; обогащение сигналов с извлечением признаков из 15+ семейств сигналов (аутентификация, безопасность, структура диалога, обнаружение циклов инструментов); Session-Aware Agentic Routing (SAAR), объединяющий собственную память сессий роутера, блокировки безопасности во время циклов инструментов, проверки переносимости состояния провайдера и воспроизводимую диагностику; обновлённая панель оператора; и привязки Intel OpenVINO для интеграции с C++/Go. Релиз включает 350+ коммитов с версии v0.2.0. Роутер занял первое место в RouterArena с взвешенным Arena Score 75.4 и получил нативную поддержку протокола Anthropic `/v1/messages` наряду с совместимостью с OpenAI.
Справочно (6)
Echo-Memory: контролируемое исследование механизмов памяти в видеомоделях мира с условием на действие
Microsoft ResearchEcho-Memory (arXiv:2606.09803) представляет контролируемый фреймворк для изоляции и сравнения механизмов памяти в моделях генерации видео с условием на действие. Фиксируя основу и варьируя только компоненты памяти, статья разделяет четыре оси: ёмкость, сжатие, стратегию считывания и рекуррентность. Ключевые выводы: сырой контекст оказывается сильнее, чем ожидалось; агрессивное сжатие снижает точность; блочная рекуррентность на основе пространства состояний побеждает в задачах возврата в открытых сценах; качество воспроизведения не является надёжным индикатором истинной памяти сцены.
SWE-Explore: бенчмарк, выявляющий исследование репозитория как ключевое ограничение в агентах для написания кода
Shanghai Jiao Tong UniversitySWE-Explore (arXiv:2606.07297) представляет бенчмарк из 848 GitHub-задач на 10 языках программирования и 203 репозиториях для оценки исследования репозитория — шага перед генерацией патча, на котором агент должен найти релевантный код. Классические ретриверы (BM25, TF-IDF) показывают результаты близкие к случайной базовой линии; агентные инструменты исследования достигают >65% точности на уровне файлов, но лишь ~15% точности на уровне строк. Замена GPT-5 на Gemini меняет абсолютные показатели, но не устраняет узкое место по полноте охвата, что указывает на то, что ограничение — в стратегии исследования, а не в сырой мощности модели.
О геометрии on-policy дистилляции: парадигма обучения, отличная от SFT и RLVR
Hong Kong University of Science and TechnologyВ этой статье (arXiv:2606.07082) on-policy дистилляция (OPD) характеризуется как самостоятельная парадигма обучения путём анализа геометрии в пространстве параметров. OPD оставляет 51,6% весов неизменными (между SFT с 8,1% и RLVR с 77,2%), сильнее избегает главных направлений, чем SFT, и проявляет «блокировку подпространства» — накопленные обновления быстро входят в стабильный низкоразмерный канал. Ограничение обучения этим рано сформировавшимся подпространством сохраняет производительность, а само подпространство устойчиво к разреживанию токенов и off-policy роллаутам, но меняется при смешивании целей.
Слабые критики создают сильных учеников: On-Policy Critique Distillation для масштабируемого надзора
Rutgers UniversityПредлагается Progressive On-Policy Critique Distillation (OPCD), где слабая модель выступает критиком, указывающим направления для улучшения, а не выносящим бинарные суждения (arXiv:2606.00424). Ключевой инсайт: слабым критикам достаточно предлагать ненаправляющие в сторону ошибки направления улучшений — а не правильные финальные ответы — что позволяет сильным моделям использовать собственные знания для самосовершенствования. Метод фильтрует высококачественные критики и дистиллирует поведение, направляемое критиком, в сильную модель через адаптивное самообучение. Демонстрирует улучшения на бенчмарках рассуждений и согласования на протяжении итераций обучения.
OpenAI Codex CLI v0.138.0: Desktop Handoff, структурированный вывод плагинов и видимость токенов аккаунта
OpenAIВерсия 0.138.0 (8 июня 2026) добавляет desktop handoff для команды `/app` на macOS и Windows, передачу локальных путей к файлам изображений в модели для последующего редактирования, расширенный выбор уровня рассуждений с резервными сочетаниями клавиш для терминалов без привязок Alt, видимость использования токенов аккаунта и поддержку персональных токенов доступа v2, а также структурированный JSON-вывод для автоматизации плагинов (`codex plugin list --json`). Оптимизации TUI-стриминга устраняют артефакты с пустыми строками, улучшена загрузка инструкций рабочего пространства для удалённых и символически связанных окружений. 9 июня также была собрана альфа-версия v0.139.0.
Ollama v0.30.7: поддержка Hermes Desktop, Gemma 4 QAT и Nemotron-3-Ultra
OllamaOllama v0.30.7 (7 июня 2026) добавляет нативную поддержку Windows для Hermes Desktop и синхронизирует списки моделей OpenAI-совместимого API с доступными тегами. Релиз v0.30.6 (5 июня) добавил модели Gemma 4, оптимизированные с помощью Quantization-Aware Training (QAT), снижающего требования к памяти примерно на 72% при сохранении качества, близкого к оригинальному. Версия v0.30.4 (3 июня) представила поддержку Nemotron-3-Ultra для рассуждений и длительных агентных воркфлоу, а также исправила выгрузку на Metal GPU для мультимодальных моделей на Apple Silicon. Версия v0.30.2 добавила поддержку Qwen Code и улучшила подсчёт токенов для кешированных промптов.