-
GLM-5V-Turbo: нативная foundation-модель для мультимодальных агентов
Z.ai
research
-
xAI выпустила Grok 4.3 с контекстом 1M токенов, снижением цен на 40–60% и улучшенными результатами в агентных бенчмарках
xAI
models-llm
-
Anthropic запускает Claude Managed Agents: Dreams, Outcomes, мультиагентная оркестрация
Anthropic
tools
-
Google анонсировала Gemini Intelligence для Android с автоматизацией задач между приложениями
Google
tools
-
EVA-Bench: сквозной фреймворк для оценки голосовых агентов
ServiceNow AI
research
-
Google I/O 2026: Gemini 4, Jules V2, Firebase Studio GA, Android XR и Aluminium OS
Google DeepMind
models-llm
-
Gemini 3.5 Flash Released at Google I/O 2026: Frontier Coding + Agentic at Flash Speed
Google DeepMind
models-llm
-
Alibaba выпускает Qwen3.7-Plus: мультимодальный агент с поддержкой зрения, рассуждений и автономного выполнения задач
Alibaba / Qwen
models-llm
-
NVIDIA Nemotron 3 Ultra: открытая модель 550B MoE теперь доступна для агентных задач
NVIDIA
models-llm
-
GitHub Copilot App стал общедоступным
GitHub
tools
-
Yandex Commerce Protocol: первые ретейлеры запускают продажи через Алису AI
Yandex
industry
-
Mistral Workflows: public preview Temporal-движка для enterprise AI-оркестрации
Mistral
tools
-
Recursive Multi-Agent Systems: общение агентов в latent space
Stanford University
research
-
Eywa: фреймворк гетерогенного взаимодействия между LLM-агентами и научными foundation-моделями
University of Illinois at Urbana-Champaign
research
-
Anthropic запускает десять шаблонов ИИ-агентов для финансового сектора с интеграцией Microsoft 365
Anthropic
tools
-
Roo Code объявляет о закрытии 15 мая и переходе к облачному агенту Roomote
Roo Code
tools
-
MiniMax Hailuo 2.3 запущена с Media Agent и генерацией видео в пакетном режиме на 50% дешевле
MiniMax
video
-
ByteDance выпускает Doubao-Seed-2.0-lite — первую омни-модальную модель в серии Seed
ByteDance
models-llm
-
AI Co-Mathematician от Google DeepMind достигает 48% на FrontierMath Tier 4
Google DeepMind
research
-
Claude Code v2.1.139–v2.1.140: Agent View в режиме research preview и команда /goal
Anthropic
tools
-
Claude Platform на AWS достигает общей доступности
Anthropic
tools
-
RubricEM: мета-RL с декомпозицией политики под руководством рубрик за пределами верифицируемых наград
Google
research
-
Anthropic запускает Claude для малого бизнеса
Anthropic
tools
-
Notion запускает Developer Platform 3.5 с External Agents API, Workers и CLI
Notion
tools
-
Anthropic приобретает Stainless — стартап по SDK и MCP-инструментарию, которым пользовались OpenAI и Google
Anthropic
industry
-
Google Launches Gemini Spark: 24/7 Personal AI Agent in Google AI Ultra
Google
tools
-
Google Launches Antigravity 2.0: Agent-First Dev Platform with Desktop App, CLI, and Managed Agents API
Google
tools
-
Code as Agent Harness: Survey Positions Code as the Substrate for Executable Agent Systems (159 HF upvotes)
Multi-institution (42 authors)
research
-
SkillsVote: Lifecycle Governance of Agent Skills — Collection, Recommendation, Evolution (219 HF upvotes)
Memtensor Research Group / IAAR-Shanghai
research
-
Microsoft запускает Scout: всегда активный Autopilot AI-агент для Microsoft 365
Microsoft
tools
-
OpenAI выпускает Lockdown Mode для блокировки эксфильтрации через prompt injection в ChatGPT
OpenAI
tools
-
OpenAI приобретает немецкий стартап Ona для развития постоянных облачных агентов Codex
OpenAI
industry
-
NVIDIA SkillSpector: сканер безопасности с открытым кодом для скиллов AI-агентов
NVIDIA
tools
-
OpenAI запускает Scheduled Tasks в ChatGPT и прекращает поддержку Pulse
OpenAI
tools
-
AWS Summit New York 2026: общая доступность Bedrock AgentCore, iOS-предпросмотр Kiro и анонс AWS Context
Amazon
tools
-
OpenAI публикует Deployment Simulation: предсказание поведения модели до релиза
OpenAI
research
-
ENPIRE: агенты кодирования ИИ замыкают цикл физических робототехнических исследований без участия человека
NVIDIA / Carnegie Mellon University / UC Berkeley
research
-
Automated Weak-to-Strong Researcher: AI-агенты превосходят людей в исследованиях по alignment
Anthropic
research
-
Anthropic устраняет агентическое поведение шантажа у Claude с помощью «Teaching Claude Why»
Anthropic
research
-
MLEvolve: самоэволюционирующий мультиагентный LLM-фреймворк для автоматического поиска алгоритмов машинного обучения
research
-
Kwai Keye-VL-2.0: открытая мультимодальная MoE-модель 30B с контекстом 256K для длинного видео
Kwai
research
-
JoyAI-VL-Interaction: открытая VLM на 8B для взаимодействия в реальном времени с автономным управлением очередью речи
JD.com
research
-
Ctx2Skill: фреймворк самосовершенствования для автономного обнаружения навыков из контекста в LLM
research
-
GitHub Copilot в VS Code, апрельские релизы: BYOK-ключи моделей, шаринг вкладок браузера, запись в терминал
GitHub
tools
-
AWS MCP Server достиг общей доступности с полным доступом к API и средствами аудита IAM
Amazon Web Services
tools
-
GitHub MCP Server: сканирование секретов в GA и сканирование зависимостей в публичном превью
GitHub
tools
-
Google DeepMind публикует годовой отчёт о результатах AlphaEvolve
Google DeepMind
research
-
AI Co-Mathematician: Google DeepMind достигает 48% на FrontierMath Tier 4
Google DeepMind
research
-
OpenSearch-VL: открытый рецепт обучения мультимодальных агентов поиска
Tencent Hunyuan
research
-
ARIS: автономные ML-исследования с помощью состязательного взаимодействия мульти-агентов
Shanghai Jiao Tong University
research
-
LangChain запускает LangSmith Engine (публичная бета) и SmithDB на Interrupt 2026
LangChain
tools
-
SDAR: агентное обучение с подкреплением через самодистилляцию для многоходовых агентов
Zhejiang University / Meituan
research
-
MemLens: бенчмарк мультимодальной долгосрочной памяти для моделей визуального языка
NVIDIA
research
-
MMSkills: переиспользуемые мультимодальные скиллы для универсальных визуальных агентов (105 апвоутов на HF)
Shanghai Jiao Tong University
research
-
Crafter: мультиагентный фреймворк для генерации редактируемых научных иллюстраций — +16 пунктов над базовыми моделями (103 апвоута на HF)
Tsinghua University
research
-
GrepSeek: обучение поисковых агентов для прямого взаимодействия с корпусом через команды оболочки (93 апвоута на HF)
University of Massachusetts Amherst
research
-
Детерминированный горизонт: теоретико-информационное доказательство ограничений расширенного CoT и необходимости использования инструментов
research
-
Агентные трансформеры доказуемо обучаются поиску в глубину через обучение с подкреплением
Carnegie Mellon University / Ohio State University
research
-
Claude Code v2.1.172–v2.1.173: вложенные суб-агенты до 5 уровней глубины
Anthropic
tools
-
Arbor: автономное ML-исследование через уточнение дерева гипотез
NLPIR Lab
research
-
DeNovoSWE: генерация полного репозитория с нуля — рост с 5.8% до 47.2% на синтетических обучающих данных
AweAI Team
research
-
Moonshot AI открывает тестирование Kimi Work: десктопный агент с роем из 300 субагентов и WebBridge
Moonshot AI
tools
-
EvoArena: LLM-агенты набирают лишь 40% в динамически изменяющихся средах
MIT / NUS / Salesforce
research
-
WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений
Microsoft Research
research
-
InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений
CUHK Multimedia Lab
research
-
FastContext: специализированный субагент-исследователь сокращает использование токенов агентами по коду на 60%
Microsoft / Shanghai Jiao Tong University
research
-
Cursor 3.7: облачные dev-окружения и субагенты /in-cloud
Cursor
tools
-
Google DeepMind публикует AI Control Roadmap: эшелонированная защита от рассогласованных агентов кодирования
Google DeepMind
research
-
Firefly AI Assistant — Public Beta
Adobe
image
-
AutoResearchBench — бенчмарк автономного поиска научной литературы для AI-агентов
BAAI
research
-
OpenClaw 2026.5.3: плагин для передачи файлов и надёжность кроссплатформенного обмена сообщениями
tools
-
AutoTTS: LLM-агенты автоматически открывают стратегии test-time scaling за $40
research
-
Сбер представил мультиагентного бизнес-ассистента на базе GigaChat для корпоративного банкинга на ПМЭФ 2026
Sber
industry
-
InterleaveThinker: RL-фреймворк для агентной генерации чередующегося текста и изображений
research
-
EvoArena: LLM-агенты набирают лишь 39,6% на бенчмарке динамически меняющихся сред
MIT
research
-
FORT-Searcher: фреймворк обучающих данных, устойчивых к «срезанию углов», для агентов глубокого поиска
research
-
Alibaba интегрирует Qwen AI с Taobao для сквозного агентного шопинга
Alibaba
industry
-
Alibaba интегрирует Qwen AI с Taobao для запуска агентных разговорных покупок
Alibaba
industry
-
Claude Code v2.1.121
Anthropic
tools
-
Codex CLI rust-v0.126.0-alpha.8
OpenAI
tools
-
Апрельское обновление GitHub Copilot для Visual Studio 2026 года приносит агентные сценарии
GitHub
tools
-
Intern-Atlas: граф эволюции методологий из 1 млн статей как исследовательская инфраструктура для AI-учёных
research
-
OpenClaw 2026.5.4: голосовой мост Google Meet через Gemini и аудио с учётом backpressure
tools
-
HeavySkill: интернализация «тяжёлого мышления» как обучаемого агентного навыка через RL
research
-
Cursor 3.3: разбивка использования контекста для диагностики агентов
Cursor
tools
-
LongSeeker: эластичная оркестрация контекста для агентов долгосрочного поиска
Shanghai Jiao Tong University
research
-
Исполняемые мировые модели для ARC-AGI-3: подход агента программирования без игровой специфики
research
-
Claude Code v2.1.133: хуки уровня усилия, настройка baseRef для worktree и ключи политик администратора
Anthropic
tools
-
OpenClaw v2026.5.5: 60+ исправлений ошибок на платформах обмена сообщениями и у AI-провайдеров
tools
-
Direct Corpus Interaction: переосмысление поиска для агентных систем
TIGER-Lab
research
-
NanoResearch: совместная эволюция навыков, памяти и политики для персонализированной AI-автоматизации исследований
Shanghai AI Lab
research
-
OpenClaw v2026.5.12-beta: вложение сессий субагентов и 20 ходов пинг-понга между агентами
tools
-
SubtleMemory: бенчмарк выявляет систематические провалы агентов в тонком реляционном запоминании
research
-
SWE-Explore: бенчмарк, выявляющий исследование репозитория как ключевое ограничение в агентах для написания кода
Shanghai Jiao Tong University
research
-
SearchSwarm: обучаемое делегирование для LLM-агентов в долгосрочных исследовательских задачах
research
-
OpenCode v1.17.1–v1.17.3: восстановление аутентификации, права суб-агентов, лаунчер для Linux
SST
tools
-
Память реконструируется, а не извлекается: графовая память улучшает запоминание у LLM-агентов на 23%
National University of Singapore
research
-
Changelog GitHub Copilot от 18 июня: MAI-Code-1-Flash расширяется, AGENTS.md появляется в code review
GitHub
tools
-
Коллапс предпочтений мультимодального оценщика: кросс-модальное заражение в циклах самоэволюции агентов
research
-
Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond
HKUST/NUS/Oxford/NTU
research
-
Яндекс запускает AI-агента Алисы для поиска записей о ветеранах ВОВ в российских архивах
Yandex
tools
-
Sber Opens Testing of GigaCowork: No-Code AI Agent Management Platform for Enterprises
Sber
tools