Ежедневный дайджест

12 мая 2026

13 пунктов · ~13 мин · Неделя 2026-W20

Обязательно к прочтению (1)

инструменты офиц. + СМИ 3 ист. ~1 мин

На мероприятии Android Show: I/O Edition 12 мая 2026 года Google представила Gemini Intelligence — набор AI-функций, обеспечивающих многошаговую автоматизацию задач между приложениями, интеллектуальное автозаполнение, инструмент преобразования речи в текст Rambler и конструктор виджетов на естественном языке. Gemini в Chrome позволит пользователям резюмировать и запрашивать веб-контент. Функции будут доступны на устройствах Samsung Galaxy и Pixel летом 2026 года, на остальных Android-устройствах — позднее в том же году.

Почему это важно

Знаменует переход Android от традиционной модели ассистента к фоновому агентному AI-слою, охватывающему приложения, браузер, клавиатуру и железо — крупнейший Android AI-анонс накануне I/O 2026

#gemini #google-deepmind #agents #multi-agent

Стоит знать (6)

индустрия только СМИ 2 ист. ~1 мин

Bloomberg сообщил 12 мая 2026 года, что Anthropic ведёт предварительные переговоры о привлечении не менее $30 млрд при оценке, превышающей $900 млрд, — что сделает компанию дороже OpenAI. Раунд может закрыться уже в конце мая и предназначен для финансирования вычислительной инфраструктуры в целях удовлетворения растущего спроса на Claude. По имеющимся данным, Anthropic также рассматривает возможность IPO уже в октябре 2026 года.

Почему это важно

В случае закрытия по указанной оценке станет крупнейшим частным раундом финансирования AI в истории и ненадолго превысит последнюю оценку OpenAI

#anthropic #funding #valuation

индустрия только СМИ 3 ист. ~1 мин

DeepSeek ведёт переговоры о привлечении до CNY 50 млрд (~$7,35 млрд) в своём первом внешнем раунде финансирования, что оценит ранее самофинансируемую ханчжоускую лабораторию примерно в $50–51,5 млрд. Государственный Национальный инвестиционный фонд AI-индустрии Китая ведёт переговоры о лидерстве в раунде; по имеющимся данным, к участию также рассматриваются Tencent и Alibaba.

Почему это важно

Знаменует исторический сдвиг для DeepSeek — отказ от статуса самофинансируемой лаборатории — и свидетельствует о глубокой государственной заинтересованности в поддержке ведущей китайской лаборатории open-source AI

#deepseek #funding #valuation #china #state-investment

исследования офиц. + СМИ 3 ист. ~1 мин

Qwen-Image-2.0 — унифицированная модель генерации и редактирования изображений, объединяющая Qwen3-VL в качестве энкодера условий с Multimodal Diffusion Transformer. Поддерживает промпты до 1000 токенов, генерирует изображения в нативном разрешении 2K и занимает первое место на AI Arena в категориях text-to-image и редактирования изображений — при этом сокращая число параметров с 20B до 7B по сравнению с предшественником.

Почему это важно

#1 HF Daily Paper (87 апвотов); трёхкратное сокращение параметров при получении разрешения 2K и поддержки промптов до 1000 токенов ставит модель выше конкурентов для профессиональной генерации контента

#qwen #multimodal #image-generation #diffusion #efficiency

инструменты офиц. + СМИ 2 ист. ~1 мин

Google DeepMind опубликовала исследовательский блог 12 мая 2026 года, описывающий AI-курсор на базе Gemini, способный понимать как то, на что указывает пользователь, так и контекстуальное значение этого объекта. Технология интегрируется в Chrome и новое устройство Googlebook; экспериментальные демо доступны в Google AI Studio для редактирования изображений и навигации по картам. Система основана на четырёх принципах взаимодействия: поддерживать поток, показывай-и-говори, принимай естественные сокращения, превращай пиксели в действенные сущности.

Почему это важно

Представляет фундаментальный сдвиг в человеко-компьютерном взаимодействии: контекстная осведомлённость AI встраивается непосредственно в курсор, а не в отдельное окно ассистента

#gemini #google-deepmind #computer-vision

инструменты офиц. + СМИ 3 ист. ~1 мин

12 мая 2026 года OpenAI запустила Daybreak — кибербезопасностную инициативу на основе AI, объединяющую GPT-5.5 и Codex Security для помощи организациям в обнаружении, верификации и устранении уязвимостей до их эксплуатации. Платформа предлагает три уровня: стандартный GPT-5.5, вариант Trusted Access for Cyber для авторизованной защитной работы и GPT-5.5-Cyber для red teaming. В числе партнёров-основателей — Akamai, Cisco, Cloudflare, CrowdStrike, Fortinet, Oracle, Palo Alto Networks и Zscaler.

Почему это важно

Напрямую конкурирует с Project Glasswing от Anthropic, сигнализируя о том, что фронтирные лаборатории борются за доминирование в области AI-управляемой наступательной и оборонительной безопасности

#openai #cybersecurity #security #codex

видео только СМИ 3 ист. ~1 мин

11 мая 2026 года в интерфейсе приложения Gemini появилась новая видеомодель «Omni»; ранние демо от пользователей Gemini Pro демонстрируют сильные возможности редактирования — удаление водяных знаков, замену объектов в чате и переработку сцен. Модель описывается как «микшируй свои видео, редактируй прямо в чате» и, по имеющимся данным, потребляла 86% дневной квоты AI Pro пользователя на одну генерацию, что указывает на высокие вычислительные требования.

Почему это важно

Gemini Omni, по всей видимости, является преемником Veo, появившимся за неделю до Google I/O 2026 (19–20 мая), где широко ожидается официальный анонс

#gemini #google-deepmind #video-generation #multimodal #preview

Справочно (6)

исследования официальный 2 ист. ~1 мин

NanoResearch — мультиагентный фреймворк для персонализированной AI-автоматизации исследований, в котором совместно эволюционируют три компонента: банк навыков с переиспользуемыми процедурными знаниями, модуль памяти, сохраняющий историю пользователя и проекта, и безлейбловый механизм обучения политике, интернализирующий предпочтения пользователя через свободную обратную связь. Система достигает 100% успешности сквозного пайплайна в раунде 1, превосходя все базовые решения.

Почему это важно

Персонализация — критически недостающий элемент в AI-автоматизации исследований; архитектура совместной эволюции NanoResearch решает эту проблему с принципиальным подходом от Shanghai AI Lab + HKUST + Пекинского университета

#agents #rl #reasoning #automated-research #multi-agent

исследования официальный 2 ист. ~1 мин

TMAS масштабирует тестовое вычисление посредством структурированной мультиагентной координации, используя две иерархические системы памяти — банк опыта для надёжных промежуточных результатов и банк рекомендаций для исследованных стратегий — наряду с гибридной схемой обучения с подкреплением на основе вознаграждений. Подход предотвращает избыточные вычисления в параллельных траекториях рассуждений и обеспечивает превосходное масштабирование на сложных бенчмарках по рассуждению.

Почему это важно

Решает малоисследованную проблему координационных накладных расходов при масштабировании мультиагентного инференса, предлагая применимый путь к улучшению рассуждений без наивного дублирования усилий

#reasoning #multi-agent #rl #inference

инструменты официальный 1 ист. ~1 мин

vLLM опубликовал релиз-кандидат v0.21.0rc1 12 мая 2026 года, включающий PyTorch 2.11, поддержку Python 3.14, CUDA 13.0 в качестве нового дефолта и совместимость с Transformers v5. Этому предшествовал v0.20.2 (10 мая), который был отозван из-за ошибки в tensor parallelism.

Почему это важно

Поддерживает ведущий open-source движок инференса в актуальном состоянии с последним тулчейном PyTorch и CUDA, что важно для производственных GPU-деплойментов

#vllm #inference #open-source #infrastructure #release

инструменты только СМИ 2 ист. ~1 мин

Alibaba выпустила значительное программное обновление для своих умных очков Qwen AI Glasses S1, добавив проактивный AI, который выводит контекстуальные напоминания на основе данных о погоде, местоположении и календаре без участия пользователя, а также систему пространственного 3D-дисплея. Обновление углубляет интеграцию с китайскими суперприложениями для вызова такси, доставки еды и планирования поездок; устройство остаётся эксклюзивным для Китая по цене ¥3 799 (~$537).

Почему это важно

Показывает, что китайские AI-лаборатории выходят за рамки выпуска моделей в сегмент потребительских AI-носимых устройств, напрямую конкурируя с Meta Ray-Bans посредством инференса LLM в реальном времени, встроенного в повседневную физическую среду

#qwen #alibaba #china #on-device

инструменты только СМИ 3 ист. ~1 мин

Яндекс объявил 12 мая 2026 года, что приложения Карты и Навигатор теперь произносят AI-генерируемые голосовые подсказки с упоминанием узнаваемых городских ориентиров — например, «Поверните направо у магазина» или «Держитесь левее у памятника через 200 метров». Система охватывает более 10 000 ориентиров по всей России; AI определяет оптимальное расположение подсказок по ориентирам вдоль каждого маршрута.

Почему это важно

Навигация по ориентирам воспроизводит естественную манеру, в которой люди объясняют дорогу, и снижает количество пропущенных поворотов на сложных городских маршрутах; практическое AI-улучшение UX в наиболее используемом картографическом продукте России

#russia #voice-ai #navigation

инструменты официальный 1 ист. ~1 мин

Релиз llama.cpp от 12 мая 2026 года добавил поддержку локального запуска модели OpenAI gpt-oss-20b, а также предсобранные бинарные файлы для macOS (Apple Silicon и Intel), Linux (бэкенды Vulkan, ROCm, OpenVINO, SYCL), Android и Windows с CUDA 12.4.

Почему это важно

Позволяет запускать недавно выпущенную модель с открытыми весами gpt-oss-20b локально без необходимости обращаться к облачному API

#inference #open-source #local-ai

12 мая 2026

Обязательно к прочтению (1)

Google анонсировала Gemini Intelligence для Android с автоматизацией задач между приложениями

Стоит знать (6)

Anthropic ведёт переговоры о привлечении $30 млрд при оценке $900 млрд

DeepSeek привлекает $7,35 млрд в первом внешнем раунде при оценке $50 млрд

Qwen-Image-2.0: унифицированная генерация и редактирование изображений в разрешении 2K, первое место на AI Arena

Google DeepMind переосмысляет курсор мыши с AI-интеграцией Gemini

OpenAI запускает кибербезопасностную инициативу Daybreak на базе моделей GPT-5.5

Видеомодель Google Gemini «Omni» появляется в ранних демо накануне I/O 2026

NanoResearch: совместная эволюция навыков, памяти и политики для персонализированной AI-автоматизации исследований

TMAS: масштабирование тестового вычисления через синергию мультиагентов с иерархической памятью

vLLM v0.21.0rc1: поддержка Python 3.14, CUDA 13.0 и Transformers v5

Alibaba обновляет Qwen AI Glasses S1, добавляя проактивный AI и пространственный 3D-дисплей

Яндекс Карты добавили AI-генерируемые голосовые подсказки по ориентирам по всей России

llama.cpp добавляет поддержку gpt-oss-20b в сборке от 12 мая