Ежедневный дайджест

8 пунктов · ~8 мин · Неделя 2026-W27

Стоит знать (2)

Стабильный релиз DeepSeek V4 запланирован на середину июля с первым почасовым API-ценообразованием

DeepSeek
модели/LLM офиц. + СМИ 3 ист. ~1 мин

30 июня 2026 года DeepSeek объявила, что официальный стабильный релиз DeepSeek V4 запланирован на середину июля — модель выйдет из превью-статуса от 24 апреля. Вместе с релизом вводится первое в истории лаборатории почасовое API-ценообразование: тарифы удваиваются в часы пиковой нагрузки (9:00–12:00 и 14:00–18:00 ежедневно). V4 Pro имеет 1,6T всего / 49B активных параметров и контекстное окно 1M токенов; V4 Flash — 284B всего / 13B активных параметров с тем же контекстом.

Почему это важно
Первое семейство открытых весовых моделей с контекстным окном 1M токенов на уровне frontier-масштаба. Пиковое ценообразование сигнализирует о том, что DeepSeek управляет реальной инфраструктурной нагрузкой — заметный переломный момент для open-source-лаборатории.

Claude Opus 4.8 и Haiku 4.5 теперь в общем доступе в Microsoft Azure Foundry

Anthropic
инструменты офиц. + СМИ 4 ист. ~1 мин

29 июня 2026 года Anthropic выпустила Claude Opus 4.8 и Claude Haiku 4.5 в статусе general availability в Microsoft Azure Foundry. GA-релиз поддерживает нативное развёртывание в Azure с использованием существующих механизмов Microsoft для управления идентификацией, биллингом и governance, а также опциональную зону данных US для соблюдения требований к резидентности данных. Модели доступны в регионах East US и West Europe на GPU NVIDIA GB300 Blackwell Ultra. Azure становится единственным облаком, предлагающим как Claude, так и GPT frontier-модели на одной платформе.

Почему это важно
Корпоративные заказчики могут теперь развёртывать рабочие нагрузки Claude в production в рамках существующих соглашений Microsoft (кредиты MACC, Enterprise Agreements) без отдельных контрактов с Anthropic — что устраняет главный барьер при закупках для крупного enterprise.
Справочно (6)

Формализация латентных мыслей: аксиоматический фреймворк для оценки репрезентаций рассуждений LLM

University of British Columbia
исследования официальный 1 ист. ~1 мин

Представлен аксиоматический фреймворк для оценки репрезентаций латентных мыслей в LLM, не зависящий от результатов downstream-бенчмарков. Определены четыре аксиомы — Causality, Minimality, Separability и Stability — с количественными метриками. Тестирование на 23 задачах рассуждения на открытых весовых моделях показало, что ни одна модель не удовлетворяет всем четырём аксиомам одновременно, а репрезентации кодируют минимум информации сверх той, что уже содержится во входных эмбеддингах.

Почему это важно
Предоставляет принципиальный способ аудита, не зависящий от бенчмарков, — позволяет проверить, являются ли внутренние «мысли» модели содержательными. Важно для интерпретируемости и оценки chain-of-thought. 46 голосов на HuggingFace Daily Papers 29 июня 2026 года.

PhysisForcing: мировые модели с физическими ограничениями повышают успешность манипуляций роботов на 50%

Peking University / NVIDIA
исследования официальный 1 ист. ~1 мин

PhysisForcing применяет иерархический физический надзор к мировым моделям на основе генерации видео для обучения роботов: попиксельное выравнивание траекторий с использованием опорных траекторий точек и семантическое реляционное выравнивание через замороженный видеоэнкодер. Повышает успешность манипуляций в замкнутом контуре с 16,0% до 24,0% и обеспечивает прирост на 3,7–22,3% по сравнению с базовыми решениями. Модельно-агностический подход продемонстрирован на Cosmos3-Nano.

Почему это важно
Физическая правдоподобность мировых моделей — ключевое узкое место при sim-to-real-переносе в робототехнике. 42 голоса на HuggingFace Daily Papers 29 июня 2026 года.

Claude Code v2.1.196: стандартные модели для организаций и исправление безопасности MCP для недоверенных репозиториев

Anthropic
инструменты официальный 2 ист. ~1 мин

Claude Code v2.1.196 вышел 29 июня 2026 года. Ключевые изменения: администраторы организаций могут задавать модели по умолчанию в консоли (отображаются как «Org default» в /model); исправление безопасности предотвращает запуск MCP-серверов через .mcp.json в репозиториях с закоммиченным .claude/settings.json (вектор атаки на цепочку поставок); фоновые агенты автоматически возобновляются при перезапуске daemon; watchdog простоя стриминга включён по умолчанию; потребление токенов в /code-review снижено примерно на 25%; нагрузка на рендеринг терминала уменьшена примерно на 37% на кадр.

Почему это важно
Исправление безопасности MCP закрывает риск атаки на цепочку поставок: клонирование вредоносного репозитория с закоммиченным файлом настроек могло незаметно запускать произвольные MCP-серверы. Модели по умолчанию для организаций отвечают на главный enterprise-запрос по стандартизации модели в масштабах команды.

Cursor v3.9 iOS Public Beta: запуск и управление облачными агентами удалённо с телефона

Cursor
инструменты официальный 1 ист. ~1 мин

Cursor версии 3.9 вышел 29 июня 2026 года с публичной бетой для iOS, доступной всем платным подписчикам. Мобильное приложение позволяет запускать облачных агентов голосом и slash-командами, управлять агентами, работающими на десктопе, через Remote Control, отслеживать прогресс агента на экране блокировки iOS через Live Activities с push-уведомлениями, а также просматривать диффы, логи и скриншоты как Artifacts в приложении.

Почему это важно
Первое нативное мобильное управление агентами для Cursor: разработчики могут запускать, отслеживать и направлять длительные сессии агентного кодирования из любого места — объединяя телефон и рабочую станцию в единый агентный воркфлоу.

Яндекс запускает платформу для разработчиков AI-агентов внутри Alice AI

Yandex
инструменты только СМИ 4 ист. ~1 мин

29 июня 2026 года Яндекс представил платформу для создания, тестирования и развёртывания AI-агентов внутри Alice AI. Платформа позволяет агентам понимать естественный язык, планировать цепочки многошаговых действий и адаптироваться к контексту пользователя. Первые агенты от Яндекс Такси и Яндекс Лавки уже работают в ограниченном тестировании; следующими станут агенты Яндекс Доставки и Яндекс Маркета. Внешние партнёры получат доступ до конца 2026 года.

Почему это важно
Трансформирует Alice AI из ответа на вопросы в платформу выполнения задач — выводя Яндекс в гонку агентного AI. Открытие доступа для внешних партнёров к концу года может сделать Alice основным агентным интерфейсом для русскоязычных сервисов.

OpenClaw v2026.6.11-beta.2: режим Slack Relay и исправление Codex Partial Delta

OpenClaw
инструменты официальный 1 ист. ~1 мин

OpenClaw v2026.6.11-beta.2 вышел 28 июня 2026 года (308 смёрженных PR). Ключевые изменения: режим Slack relay для взаимодействия с агентом через канал-прокси; нативная поддержка команды /oc_queue в Mattermost; обработка частичных дельт Codex для стабильности при длинном контексте; вынос официальных плагинов во внешние репозитории для более быстрых обновлений безопасности на уровне плагина; улучшения настроек Android.

Почему это важно
Исправление Codex partial delta устраняет нестабильность кеша промптов при длинном контексте, приводившую к сбоям агента в середине задачи. Вынос официальных плагинов обеспечивает независимый цикл обновлений безопасности.