Ежедневный дайджест
14 пунктов · ~14 мин · Неделя 2026-W20
Обязательно к прочтению (1)
OpenAI запускает ChatGPT Personal Finance с интеграцией Plaid
OpenAI15 мая 2026 года OpenAI запустила предварительную версию функции личных финансов для подписчиков ChatGPT Pro в США: пользователи могут подключить более 12 000 финансовых организаций через Plaid. Функция предоставляет дашборд с данными о портфеле, расходах, подписках и предстоящих платежах, поддерживает запросы на естественном языке о бюджетировании, погашении долгов и финансовом планировании. Запуск последовал за приобретением OpenAI стартапа в области личных финансов Hiro; планируется интеграция с Intuit для анализа налоговых последствий.
Стоит знать (6)
Orthrus: 7,8-кратное ускорение инференса для Qwen3 за счёт совместного использования KV-кеша AR и диффузии
Orthrus (arXiv 2605.12825) объединяет замороженную предобученную авторегрессионную LLM с лёгким обучаемым диффузионным модулем, совместно использующим один KV-кеш, что обеспечивает параллельную генерацию токенов с точным механизмом внутримодельного консенсуса без потерь. Применённый к Qwen3 (1,7B, 4B, 8B), он достигает до 7,8-кратного ускорения токенов на один прямой проход при O(1) дополнительных затратах памяти. GitHub-реализация попала в тренды Hacker News (34 балла) и GitHub Python Trending 15–16 мая.
Causal Forcing++: 2-шаговая дистилляция для генерации интерактивного видео в реальном времени
Tsinghua UniversityCausal Forcing++ (arXiv 2605.15141, 80 голосов HF Daily) предлагает дистилляцию причинной согласованности для обучения 2-шаговых пофреймовых авторегрессионных моделей генерации видео, превосходящих 4-шаговый базовый SOTA Causal Forcing как по качеству, так и по задержке. Применённый к генерации мировых моделей с управлением действиями, метод существенно снижает стоимость обучения при сохранении точности. Обеспечивает синтез интерактивного видео в реальном времени.
SDAR: агентное обучение с подкреплением через самодистилляцию для многоходовых агентов
Zhejiang University / MeituanSDAR (arXiv 2605.15155, 69 голосов HF Daily) сочетает On-Policy Self-Distillation (OPSD) как стробируемую вспомогательную цель наряду с GRPO RL для многоходовых LLM-агентов. Сигмоидный шлюз избирательно усиливает одобренные учителем токены, ослабляя шум дистилляции от несовершенных отклонений. Оценён на Qwen2.5 и Qwen3 на бенчмарках ALFWorld, WebShop и Search-QA: улучшение на +9,4%, +10,2% и +7,0% над базовым GRPO соответственно.
SANA-WM: мировое моделирование 720p длительностью в минуту на одном GPU
NVIDIASANA-WM (arXiv 2605.15178, 54 голоса HF Daily) — мировая модель на 2,6 млрд параметров, генерирующая высококачественное видео 720p длительностью в минуты с 6-DOF управлением камерой. Использует гибридное линейное внимание для обработки длинных последовательностей и двухветвевую систему управления камерой. Генерирует 60-секундные клипы на одном GPU; дистиллированные версии работают на потребительском железе. Обучена за 15 дней на 64 GPU — существенно эффективнее сопоставимых промышленных систем.
MemLens: бенчмарк мультимодальной долгосрочной памяти для моделей визуального языка
NVIDIAMemLens (arXiv 2605.14906, 62 голоса HF Daily) оценивает долгосрочную мультимодальную память в моделях визуального языка через 789 вопросов по пяти типам памяти и четырём длинам контекста, тестируя 27 моделей и 7 агентов с расширенной памятью. Ключевой вывод: долгоконтекстные LVLM успешно справляются за счёт прямой визуальной привязки в коротких контекстах, но резко деградируют по мере роста диалогов, тогда как агенты памяти остаются стабильными, но теряют визуальную точность. Рассуждение через несколько сессий вызывает затруднения практически у всех протестированных систем.
Claude Code v2.1.143: принудительные зависимости плагинов, оценка стоимости и стабильность фоновых сессий
AnthropicClaude Code v2.1.143 вышел 15 мая с принудительным управлением зависимостями плагинов (отключение отклоняется, если другой плагин зависит от цели; включение принудительно активирует транзитивные зависимости), прогнозируемыми оценками стоимости контекста в маркетплейсе плагинов и новой настройкой worktree.bgIsolation:none для репозиториев, где воркдеревья непрактичны. В Windows PowerShell теперь передаёт -ExecutionPolicy Bypass по умолчанию для провайдеров Bedrock, Vertex и Foundry. Более 30 исправлений устраняют зависания при запуске из-за повреждённого .credentials.json, ошибки Full Disk Access в macOS для фоновых агентов, повторный запуск процессов PowerShell в claude agents и несколько регрессий стабильности фоновых сессий.
Справочно (7)
Сбер закрыл первую сделку по лизингу GigaChat Enterprise для корпоративных клиентов
Sber15 мая 2026 года Сбер (через СберЛизинг и Salute for Business) завершил первую в России лизинговую сделку по программно-аппаратному комплексу GigaChat Enterprise. Клиентом стал крупный российский девелопер в сфере недвижимости, который будет использовать GigaChat для построения AI-ассистента менеджера по продажам. Сделка предполагает минимальный первоначальный взнос и лизинговые условия сроком 36 месяцев, делая корпоративный GenAI доступным без крупных капитальных затрат.
Яндекс развернул NFC-кулоны с Alice AI на акции «Ночь в музее»
Yandex14 мая 2026 года Яндекс анонсировал NFC-кулоны с Alice AI, распределённые посетителям московской акции «Ночь в музее» (16 мая). Прикосновение кулона к смартфону открывает чат с Alice AI для получения информации об экспонатах и навигации. Развёртывание охватывает Музей Москвы, Государственный музей изобразительных искусств им. А. С. Пушкина и галерею Нестеренко; предусмотрены AI-фотозоны, стилизующие снимки посетителей под манеру музейных экспонатов.
OpenCode v1.15.1: сворачиваемый просмотр мышления и закреплённые сессии
SSTOpenCode v1.15.1 (16 мая) добавляет сворачиваемый просмотр мышления с инлайн-раскрытием, закреплённые сессии с быстрыми слотами переключения в выборщике сессий, а также исправляет дублирующиеся записи в истории промптов, отслеживание файлов для репозиториев, где .git является символической ссылкой, и обработку многострочных @-упоминаний. Релиз следует за v1.15.0 (событийная система на основе Effect) и v1.14.51 (экспериментальные фоновые субагенты), вышедшими 15 мая.
GitHub Copilot: Grok Code Fast 1 устарел, пользовательские настройки памяти для Pro
GitHub15 мая вышли два изменения Copilot: Grok Code Fast 1 устарел во всех функциях Copilot (чат, инлайн-правки, автодополнение) — администраторам следует перейти на GPT-5 mini или Claude Haiku 4.5. Отдельно Copilot Memory теперь поддерживает пользовательские настройки для подписчиков Pro и Pro+, позволяя сохранять явные и выведенные предпочтения (стиль сообщений коммитов, структура PR, тон коммуникации) для всех репозиториев и агентов; управляется в личных настройках Copilot Memory.
OpenAI Codex Alpha: переработка архитектуры разрешений и API удалённого управления
OpenAIOpenAI Codex выпустил три альфа-предрелиза 15 мая (v0.131.0-alpha.19/21/22). Активные коммиты раскрывают масштабную миграцию разрешений, заменяющую SandboxPolicy на PermissionProfile во всей кодовой базе, а также добавление runtimeWorkspaceRoots в API потоков app-server. Дополнительная работа включает обновления API удалённого управления, перенос внедрения промптов памяти в расширение app-server, паритет хука compact для удалённого уплотнения v2 и реструктуризацию TUI в специализированные модули. По-прежнему в стадии pre-alpha; стабильный релиз не анонсирован.
Pydantic AI v1.97.0: новый MCPToolset и разделение GoogleProvider
PydanticPydantic AI v1.97.0 (15 мая) вводит MCPToolset, использующий fastmcp-slim[client], и объявляет устаревшими старые реализации MCPServer* и FastMCPToolset. GoogleProvider разделяется на два класса: GoogleProvider (id: google:) для Gemini API и GoogleCloudProvider (id: google-cloud:) для Vertex AI. OnlineEvaluator получает возможность run_on_errors. Agent.to_a2a() и встроенная интеграция fasta2a объявляются устаревшими в пользу внешнего пакета fasta2a.
llama.cpp b9161/b9169: совместимость с Codex CLI и мультимодальная поддержка Qwen3A
ggml-orgllama.cpp b9161 (15 мая) добавляет совместимость с Codex CLI: неподдерживаемые инструменты Responses API обнаруживаются и пропускаются с предупреждением вместо аварийного завершения, что позволяет использовать локальные модели в качестве бэкендов для рабочего процесса OpenAI Codex CLI. b9169 добавляет поддержку чанков MTMD (мультимодальных) и исправляет предобработку для Qwen3A, включая исправление обработки аудиотокенов и ограничения размера чанков для предотвращения OOM. b9174 (16 мая) реструктурирует WebUI в tools/ui с обновлёнными переменными CMake.