Ежедневный дайджест

9 пунктов · ~9 мин · Неделя 2026-W25

Стоит знать (5)

Kimi K2.7-Code HighSpeed: рост производительности в 6× для продакшн-пайплайнов агентов по коду

Moonshot AI
модели/LLM офиц. + СМИ 4 ист. ~1 мин

15 июня 2026 года Moonshot AI анонсировала вариант HighSpeed для Kimi K2.7-Code, доступный пользователям Kimi Code Beta и Kimi Business. Режим HighSpeed обеспечивает около 180 токенов/с на задачах медианной длины и до 260 токенов/с на коротких — примерно в шесть раз быстрее стандартного релиза. Базовая модель K2.7-Code (MoE с 1 трлн параметров, 32B активных, контекст 256K) вышла 12 июня и показала +21,8% на Kimi Code Bench v2 и примерно на 30% меньше токенов при рассуждении по сравнению с K2.6.

Почему это важно
При цене около $0,95 за миллион входных токенов и открытых весах для самостоятельного хостинга Kimi K2.7-Code HighSpeed напрямую атакует узкое место по пропускной способности в продакшн-пайплайнах агентов по коду — где скорость генерации токенов ограничивает количество итераций агента в единицу времени.

DreamX-World 1.0: интерактивная модель мира общего назначения с управлением камерой 6DoF

AMAP-ML (Alibaba Maps AI Lab)
исследования официальный 3 ист. ~1 мин

DreamX-World — интерактивная модель мира общего назначения, генерирующая разнообразные высококачественные миры по текстовым или графическим промптам и позволяющая пользователям или агентам исследовать их с помощью управления камерой 6DoF в стиле WASD. Обученная на смеси данных Unreal Engine, игрового видеозаписи и видео реального мира, модель поддерживает генерацию в разрешении 720P длительностью до 7,5 секунд на клип и долгосрочные роллауты до одной минуты. Под лицензией Apache 2.0 выпущены два варианта: DreamX-World-5B-Cam (двунаправленный, 5 с) и DreamX-World-5B (авторегрессионный, долгосрочный).

Почему это важно
Одна из первых открыто опубликованных интерактивных моделей мира общего назначения, способных реагировать на точное управление камерой и событиями в помещениях, городских, природных, фантастических и игровых сценах. 264 голоса на HuggingFace Daily Papers свидетельствуют о высоком интересе сообщества. Сочетание обучения на основе RL с памятью на основе геометрии повышает практичность моделей мира как симуляционных сред для агентов.

FastContext: специализированный субагент-исследователь сокращает использование токенов агентами по коду на 60%

Microsoft / Shanghai Jiao Tong University
исследования официальный 3 ист. ~1 мин

FastContext отделяет исследование репозитория от решения задач в LLM-агентах для работы с кодом, вводя специализированный субагент-исследователь (4B–30B параметров), который выполняет параллельные вызовы инструментов read/glob/grep и возвращает компактные ссылки на пути к файлам и диапазоны строк основному решателю. Обучение включает supervised fine-tuning с последующим обучением с подкреплением на задачах. Интегрированный в Mini-SWE-Agent, FastContext улучшает показатели решения задач до 5,5 процентных пунктов на SWE-bench Multilingual, SWE-bench Pro и SWE-QA, сокращая при этом использование токенов основным агентом до 60%.

Почему это важно
Навигация по репозиторию — крупная скрытая статья затрат в современных агентах для работы с кодом: модели тратят значительную часть контекстного окна только на поиск нужных файлов. Подход FastContext с разделением ответственности показывает, что специализированная малая модель справляется с исследованием значительно эффективнее монолитного решателя. 152 голоса на HuggingFace Daily Papers.

NVIDIA SkillSpector: сканер безопасности с открытым кодом для скиллов AI-агентов

NVIDIA
инструменты офиц. + СМИ 3 ист. ~1 мин

NVIDIA выпустила SkillSpector (13 июня 2026) — сканер безопасности с открытым кодом, созданный специально для скиллов AI-агентов. Инструмент проверяет 64 паттерна уязвимостей в 16 категориях, охватывая как традиционные программные риски, так и специфичные для агентов — инъекции промптов, небезопасная обработка данных и логические уязвимости. Инструмент основан на рекомендациях OWASP LLM и MITRE ATLAS. Сопутствующий аудит Snyk по 3 984 скиллам выявил, что 26,1% содержат уязвимости, а 5,2% демонстрируют признаки вредоносного умысла, включая 1 467 вредоносных payload-ов: трояны, криптомайнеры и сборщики учётных данных. Репозиторий доступен на github.com/NVIDIA/SkillSpector.

Почему это важно
По мере роста маркетплейсов скиллов для агентов — в том числе для Claude Code и OpenClaw — безопасность цепочки поставок скиллов становится реальной поверхностью атаки. SkillSpector — первый специализированный стандартизированный инструмент для этой проблемы, аналог того, что Snyk делает для зависимостей пакетов. Институциональная поддержка NVIDIA даёт ему шансы стать стандартным шагом аудита в пайплайнах развёртывания агентов.

Claude Code 2.1.178: параметризованные правила разрешений и вложенные скиллы

Anthropic
инструменты официальный 1 ист. ~1 мин

Claude Code версии 2.1.178 (15 июня 2026) добавляет синтаксис Tool(param:value) для правил разрешений, позволяющий точно сопоставлять входные параметры инструментов с поддержкой wildcard — например, Agent(model:opus) может блокировать именно субагентов на Opus. Вложенные директории .claude/skills теперь загружаются автоматически при работе в соответствующих директориях, а конфликты имён разрешаются через пространства имён <dir>:<name>. Режим Auto теперь выполняет проверку классификатором перед запуском субагентов, чтобы предотвратить делегирование заблокированных действий. Среди исправлений — OOM-краши из-за устаревших переменных окружения с файловыми дескрипторами, несоответствия OAuth-аккаунтов в Chrome, обработка транскриптов субагентов, резервная модель компактизации и закрытие CJK IME в VSCode.

Почему это важно
Параметризованный синтаксис разрешений — существенное улучшение эргономики для команд, применяющих политики выбора модели в агентных пайплайнах: контроль затрат и безопасности переходит от грубой блокировки моделей к точечным правилам на уровне параметров. Наследование вложенных скиллов по принципу «ближайшая директория побеждает» делает монорепозитории с несколькими проектами удобными в работе без лишних запросов на разрешения.
Справочно (4)

OpenAI запускает партнёрскую сеть с инвестициями $150 млн

OpenAI
индустрия офиц. + СМИ 3 ист. ~1 мин

OpenAI официально представила OpenAI Partner Network 14–15 июня 2026 года — формальную глобальную партнёрскую программу с бюджетом $150 млн, ориентированную на консалтинговые компании, системных интеграторов и технологических специалистов. Программа включает три уровня — Select, Advanced и Elite — и ставит цель сертифицировать 300 000 консультантов к концу 2026 года. В числе партнёров-основателей — Accenture, BCG, Bain, PwC и QuantumBlack от McKinsey. OpenAI представила инициативу в контексте тезиса о том, что узким местом для получения ценности от корпоративного AI сегодня является уже не возможности моделей, а внедрение и перестройка рабочих процессов.

Почему это важно
Сигнализирует о стратегическом повороте OpenAI в сторону уровня корпоративных сервисов. Структурированная партнёрская экосистема со значительными инвестициями воспроизводит стратегии Salesforce и Microsoft, указывая на позиционирование OpenAI для долгосрочного захвата выручки за пределами платы за использование API.

Память реконструируется, а не извлекается: графовая память улучшает запоминание у LLM-агентов на 23%

National University of Singapore
исследования официальный 2 ист. ~1 мин

MRAgent заменяет стандартную парадигму «сначала извлечь, потом рассуждать» активной реконструкцией: память агента хранится в виде графа Cue-Tag-Content, где ассоциативные теги выступают семантическими мостами. При инференсе агент итеративно исследует и отсекает пути извлечения, руководствуясь промежуточными рассуждениями, что позволяет избежать комбинаторного взрыва. На бенчмарках LoCoMo и LongMemEval MRAgent достигает улучшения до 23% по сравнению с сильными базовыми методами извлечения.

Почему это важно
Статическое извлечение (поиск по эмбеддинг-сходству) даёт сбой, когда нужная память зависит от того, что агент уже вывел в ходе задачи. Объединяя рассуждения LLM непосредственно с обходом памяти, эта работа устраняет фундаментальное узкое место для долгосрочных агентных задач и предлагает граф-структурированную память как более надёжную альтернативу плоским векторным хранилищам.

OpenAI Codex CLI 0.140.0: отслеживание использования токенов, импорт из Claude Code и аутентификация Amazon Bedrock

OpenAI
инструменты официальный 2 ист. ~1 мин

Codex CLI 0.140.0 (15 июня 2026) включает дашборды активности токенов через представления /usage (дневное, недельное, накопленное), удаление сессий с подтверждением через команды codex delete и /delete, а также команду /import для чтения конфигураций проектов Claude Code. Добавлена поддержка аутентификации Amazon Bedrock API с зашифрованным локальным хранением учётных данных. Единое меню @ упоминаний заменяет разрозненные точки входа для инъекции контекста. Также исправлены: автовосстановление повреждённых SQLite, краши /review, проблемы надёжности MCP-серверов и ошибки установки плагинов.

Почему это важно
Команда /import для конфигураций Claude Code значительно снижает порог переключения между агентами для написания кода или их сравнения. Поддержка Bedrock охватывает корпоративные команды, использующие модели на базе AWS вместо прямого API OpenAI. Дашборды использования токенов отвечают на давний запрос активных пользователей, управляющих затратами в агентных сессиях.

OpenClaw v2026.6.8-beta.2: поддержка GLM-5.2 и Claude Haiku 4.5, расширенное форматирование в Telegram

OpenClaw
инструменты официальный 1 ист. ~1 мин

OpenClaw v2026.6.8-beta.2 (16 июня 2026) добавляет поддержку моделей GLM-5.2 и Claude Haiku 4.5 и унифицирует идентификаторы моделей с указанием провайдера для OpenRouter и Google Vertex. Доставка в Telegram теперь поддерживает структурированный rich text — таблицы, списки и разворачиваемые блок-цитаты — с сохранением намеренных переносов строк. В WhatsApp добавлена настройка привязок ACP. Улучшено восстановление агентов и шлюзов при отправке DM, завершении медиазапросов, обработке авто-ответов, перезапусках сессий и операциях субагентов. В интерфейсе добавлены сворачиваемые файлы рабочего пространства, улучшена стабильность обратной прокрутки в WebChat и исправлено переподключение шлюза на iOS.

Почему это важно
OpenClaw — ведущая платформа автономных агентов с открытым кодом, распространяемая через мессенджеры. Добавление GLM-5.2 рядом с Claude Haiku 4.5 расширяет охват моделей за счёт продуктов китайских лабораторий. Расширенное форматирование в Telegram закрывает давний пробел для команд, использующих Telegram как интерфейс агента.