Ежедневный дайджест
17 пунктов · ~17 мин · Неделя 2026-W27
Стоит знать (11)
Google выпускает Nano Banana 2 Lite: изображения за 4 секунды по $0,034 за 1000
Google DeepMind30 июня Google перевела Nano Banana 2 Lite (Gemini 3.1 Flash-Lite Image) в общий доступ: генерация изображений занимает около 4 секунд при стоимости $0,034 за 1000 изображений. Доступна в Google AI Studio и Gemini API; постепенно внедряется в AI Mode в Google Search, приложение Gemini, NotebookLM и Google Photos. Все результаты содержат водяной знак SynthID.
Meta анонсирует облачный бизнес «Meta Compute» для монетизации избыточной AI-инфраструктуры
Meta AI1 июля Meta раскрыла планы запуска облачного бизнеса под рабочим названием «Meta Compute» — продажи доступа к AI-инфраструктуре сторонним клиентам. Предусмотрены два уровня: аренда вычислительных мощностей и доступ к размещённым моделям. Проект ведут глава инфраструктуры Сантош Джанардхан, руководитель Meta Superintelligence Labs Дэниел Гросс и президент Дина Пауэлл Маккормик. На фоне новости акции Meta выросли примерно на 9%. Цены и дата запуска не объявлены.
DeepSeek подтверждает официальный выпуск V4 в середине июля и вводит пиковое ценообразование API
DeepSeekОколо 1 июля DeepSeek подтвердила, что официальный выпуск DeepSeek V4 запланирован на середину июля — после превью от 24 апреля. V4 выходит в версиях V4-Pro (1,6T параметров всего / 49B активных) и V4-Flash (284B всего / 13B активных), обе с контекстным окном в 1M токенов. Впервые DeepSeek вводит пиковое/внепиковое ценообразование API: стоимость удваивается в часы пик — 9:00–12:00 и 14:00–18:00 по пекинскому времени. Устаревшие имена моделей deepseek-chat и deepseek-reasoner выводятся из обращения 24 июля.
OpenAI выпускает GeneBench-Pro — передовой бенчмарк для AI-агентов в биологии
OpenAIOpenAI выпустила GeneBench-Pro (30 июня) — бенчмарк из 129 задач, проверяющий суждение AI в области геномики, онкологии, клинической диагностики и фармакогеномики. Задачи требуют последовательных экспертных решений, на которые человек тратит 20–40 часов. GPT-5.6 Sol набирает 28,7% (31,5% в Pro-режиме); Claude Opus 4.8 — 16,0%. Десять репрезентативных вопросов опубликованы в открытом доступе на Hugging Face.
Anthropic предлагает отраслевую шкалу оценки тяжести джейлбрейков
Anthropic2 июля Anthropic опубликовала описание четырёхуровневого классификатора кибербезопасности Fable 5 и предложила шкалу Cyber Jailbreak Severity (CJS) — от CJS-0 до CJS-4, — оценивающую джейлбрейки по приросту возможностей, охвату атаки, лёгкости оружеизации и обнаруживаемости. Разработана совместно с партнёрами Project Glasswing, включая Amazon, Microsoft и Google, и предложена для принятия всей отраслью.
Program-as-Weights: парадигма «компилируй один раз» достигает качества 32B-моделей при 1/50 объёма памяти
Исследователи из Университета Ватерлоо представляют Program-as-Weights (PAW): компилятор на 4B параметров генерирует небольшие переиспользуемые адаптерные веса для задач, не поддающихся решению на основе правил. Интерпретатор Qwen3 на 0,6B, направляемый этими адаптерами, соответствует 32B-модели при 1/50 объёма памяти на инференсе и работает со скоростью 30 токенов/с на MacBook M3. Авторы также публикуют FuzzyBench — обучающий датасет из 10 миллионов примеров.
PerceptionRubrics: атомарная рубричная оценка выявляет разрыв в 8% по восприятию между открытыми и закрытыми моделями
Исследователи Университета Джонса Хопкинса представляют PerceptionRubrics (ICML 2026): свыше 1000 визуально насыщенных изображений в паре с 12 004 атомарными рубриками оценки, разделёнными на критерии Must-Right и Easy-Wrong. Бинарный механизм оценки с учётом порогов штрафует за ошибки в обязательных визуальных элементах, а не усредняет оценки. Ключевой вывод: разрыв в 8% по восприятию сохраняется между open-source frontier-моделями и проприетарными лидерами.
Zhipu AI запускает кодирующего агента ZCode на базе GLM-5.2, нацеленного на Cursor и Claude Code
Zhipu AI2 июля Zhipu AI выпустила ZCode — десктопный кодирующий агент на основе GLM-5.2, модели с открытыми весами под лицензией MIT, насчитывающей ~750B параметров MoE и поддерживающей контекст в 1M токенов. Поставляется с более чем 20 интегрированными инструментами разработчика, включая Git и доступ к терминалу, поддержкой мультиагентного взаимодействия и удалённым управлением через WeChat, Feishu и Telegram. До 31 июля Zhipu предоставляет новым пользователям 5 миллионов бесплатных токенов.
Kimi K2.7-Code становится первой open-weight-моделью в GitHub Copilot
Moonshot AIKimi K2.7-Code — open-weight-модель от Moonshot AI с приростом +21,8% на Kimi Code Bench v2 по сравнению с предшественником — стала общедоступной в GitHub Copilot 1 июля, первой моделью с открытыми весами, доступной в переключателе моделей Copilot. Доступна в VS Code (v1.127.0+), GitHub.com, JetBrains, Xcode, Eclipse и GitHub Mobile, размещена GitHub на Microsoft Azure.
Cascade выводится из эксплуатации; запускается Devin Local с открытым протоколом ACP
CognitionCascade — агентное ядро Windsurf (переименованного в Devin Desktop 2 июня) — выведен из эксплуатации 1 июля. Его заменяет Devin Local: переписанный на Rust движок, заявляющий до 30% прироста эффективности токенов за счёт параллельных субагентов. Devin Desktop теперь поставляется с нативной поддержкой открытого протокола Agent Client Protocol (ACP, Apache 2.0), позволяя Codex, Claude Agent, Gemini CLI и OpenCode работать как полноценные сессии. CI-пайплайны, обращающиеся к Cascade по имени, требуют ручного переключения.
Runway запускает Agent Skills для автономного производства рекламных кампаний и роликов
Runway2 июля Runway выпустила Agent Skills для всех тарифных планов. Функция исполняет полные рекламные кампании, коммерческие ролики и локализованные рекламные варианты по командам на естественном языке: агент самостоятельно ведёт многошаговое креативное производство — сценаризацию, генерацию и адаптацию. Построена на видеодвижке Runway Gen-4.5, доступна на runwayml.com/agent.
Справочно (6)
Яндекс консолидирует AI-команды под Alice AI с новыми назначениями руководства
Yandex2 июля Яндекс реорганизовал руководство в сфере AI, объединив команды под Alice AI как единой кросс-функциональной платформой. Дмитрий Тимко назначен руководителем Alice AI; Александр Поповский принимает управление глобальным Поиском. Реорганизация направлена на сокращение цикла выпуска и ускорение развёртывания специализированных AI-ассистентов, включая запланированные функции «нейро-юриста» и «нейро-бухгалтера».
ELDR: маршрутизация с учётом локальности экспертов снижает задержку при обслуживании MoE-моделей на 14%
Microsoft ResearchMicrosoft Research представляет ELDR — систему маршрутизации для раздельного (prefill-decode) обслуживания MoE-моделей. На этапе prefill формируется «сигнатура экспертов» запроса; на этапе decode офлайн-кластеризация K-means и онлайн-маршрутизация по полосам локальности минимизируют загрузку различных весов экспертов между воркерами. Тестирование на до 40 GPU и трёх MoE-моделях показывает улучшение медианного времени на выходной токен на 5,9–13,9% по сравнению с базовой балансировкой нагрузки.
FlashMorph: управляемое данными размещение слоёв гибридного внимания через обучаемые гейты
ByteDance SeedИсследователи ByteDance Seed и Университета Фудань предлагают FlashMorph — метод определения оптимального размещения слоёв для гибридных архитектур внимания (полное vs линейное) с помощью обучаемых гейтов, оптимизированных на синтетических данных извлечения в длинном контексте. После обучения гейты дискретизируются в фиксированный гибридный макет. FlashMorph находит более эффективные конфигурации, чем эвристические методы, сохраняя при этом качество воспроизведения длинного контекста и производительность на бенчмарках.
Claude Code v2.1.199: стекирование slash-skill и улучшение надёжности стриминга
AnthropicClaude Code v2.1.199 (2 июля) добавляет стекирование slash-skill-вызовов — до 5 ведущих навыков на одну команду, — исправляет ошибки SSL-сертификатов с немедленным выводом понятных подсказок, а также улучшает надёжность стриминга: частичный вывод теперь сохраняется при возникновении ошибок API в середине потока.
GitHub Copilot CLI v1.0.68: поддержка Kimi K2.7-Code в headless-окружениях
GitHubGitHub Copilot CLI v1.0.68 (1 июля) добавляет поддержку модели kimi-k2.7-code вместе с улучшенной обработкой временных разрывов соединения с IDE и корректным отображением тайского и деванагари в терминале. В v1.0.69-0 (пре-релиз, 2 июля) добавлено автодополнение файлов и папок для записей пути /sandbox.
Сбербанк интегрирует AI-аналитика GigaChat в СберБизнес для продавцов маркетплейсов
Sber1 июля Сбербанк интегрировал AI-аналитика на базе GigaChat в онлайн-банк СберБизнес для продавцов маркетплейсов. Инструмент отвечает на вопросы по 110 темам, включая продажи, эффективность рекламы и рентабельность с применением ABC/XYZ-анализа. Ответы формируются примерно за 30 секунд против 5–15 минут при работе с традиционными BI-инструментами.