-
NVIDIA выпускает Cosmos 3: открытая омнимодальная фундаментальная модель для физического AI
NVIDIA
research
-
GLM-5V-Turbo: нативная foundation-модель для мультимодальных агентов
Z.ai
research
-
SenseNova-U1: open-source унифицированное мультимодальное понимание и генерация через NEO-unify
SenseTime
research
-
Recursive Multi-Agent Systems: общение агентов в latent space
Stanford University
research
-
Eywa: фреймворк гетерогенного взаимодействия между LLM-агентами и научными foundation-моделями
University of Illinois at Urbana-Champaign
research
-
Exploration Hacking: LLM можно дообучить для стратегического противодействия RL-обучению
research
-
OpenAI раскрывает, как сигнал вознаграждения для 2,5% пользователей вызвал гоблинскую одержимость GPT на протяжении нескольких поколений моделей
OpenAI
research
-
MiniCPM-o 4.5: полнодуплексное омнимодальное AI в реальном времени на граничных устройствах
OpenBMB / Tsinghua University
research
-
AI2 публикует в открытый доступ MolmoAct2: роботизированная VLA, превосходящая GPT-5 в воплощённом рассуждении
AI2
research
-
UniVidX: единый диффузионный бэкбон для генерации RGB, карт внутренних признаков и RGBA-видео
research
-
Разбор инцидента OpenAI: как RLHF reward hacking встроил гоблинские метафоры в GPT-5.x
OpenAI
research
-
RubricEM: мета-RL с декомпозицией политики под руководством рубрик за пределами верифицируемых наград
Google
research
-
Asymmetric Flow Models: SOTA FID 1,57 на ImageNet через ранг-асимметричную параметризацию скоростей
Stanford University
research
-
Humanoid-GPT: Scaling to 2B Motion Frames Enables Zero-Shot Generalization in Humanoid Control
research
-
MLEvolve: самоэволюционирующий мультиагентный LLM-фреймворк для автоматического поиска алгоритмов машинного обучения
research
-
MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества
MiniMax
research
-
MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике
MiniMax
research
-
Learning while Deploying: флитовое обучение с подкреплением превращает развёртывание роботов в непрерывный тренинг
AGIBot
research
-
Ctx2Skill: фреймворк самосовершенствования для автономного обнаружения навыков из контекста в LLM
research
-
RLDX-1: Multi-Stream Action Transformer достигает 86,8% на гуманоидных задачах ALLEX
RLWRLD
research
-
AI Co-Mathematician: Google DeepMind достигает 48% на FrontierMath Tier 4
Google DeepMind
research
-
OpenSearch-VL: открытый рецепт обучения мультимодальных агентов поиска
Tencent Hunyuan
research
-
ARIS: автономные ML-исследования с помощью состязательного взаимодействия мульти-агентов
Shanghai Jiao Tong University
research
-
Crafter: мультиагентный фреймворк для генерации редактируемых научных иллюстраций — +16 пунктов над базовыми моделями (103 апвоута на HF)
Tsinghua University
research
-
GrepSeek: обучение поисковых агентов для прямого взаимодействия с корпусом через команды оболочки (93 апвоута на HF)
University of Massachusetts Amherst
research
-
Echo-Infinity: генерация бесконечного видео в реальном времени через обучаемый Memory Query
research
-
ThoughtFold: интроспективное обучение предпочтениям сокращает токены рассуждения на 56% без потери точности
research
-
Детерминированный горизонт: теоретико-информационное доказательство ограничений расширенного CoT и необходимости использования инструментов
research
-
Иллюзия самокоррекции: LLM исправляют чужие ошибки, но не свои — причина в ролевых метках
research
-
Audio Interaction Model: унифицированный стриминговый фреймворк, объединяющий офлайн и реальновременную обработку аудио по инструкциям
research
-
Агентные трансформеры доказуемо обучаются поиску в глубину через обучение с подкреплением
Carnegie Mellon University / Ohio State University
research
-
EvoArena: LLM-агенты набирают лишь 40% в динамически изменяющихся средах
MIT / NUS / Salesforce
research
-
WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений
Microsoft Research
research
-
InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений
CUHK Multimedia Lab
research
-
DreamX-World 1.0: интерактивная модель мира общего назначения с управлением камерой 6DoF
AMAP-ML (Alibaba Maps AI Lab)
research
-
FastContext: специализированный субагент-исследователь сокращает использование токенов агентами по коду на 60%
Microsoft / Shanghai Jiao Tong University
research
-
Вмешательства SAE ненадёжны: подавленное поведение восстанавливается после интервенции
Hong Kong Polytechnic University
research
-
TIDE: кросс-архитектурная дистилляция для диффузионных LLM
Peking University
research
-
Programming with Data: test-driven data engineering для самоулучшающихся LLM
OpenDataLab
research
-
ESamp: LLM исследуют через latent distilling для семплирования по семантической новизне
ShanghaiTech University
research
-
CoPD: co-evolving policy distillation для унифицированных мультиспособных моделей
research
-
Odysseus: обучение VLM для интерактивного принятия решений на 100+ ходов с помощью RL
Princeton University
research
-
Meta публикует отчёт о готовности Code World Model перед выпуском в открытый доступ
Meta
research
-
World Action Models: первый систематический обзор воплощённых фундаментальных моделей, объединяющих моделирование мира и действия
OpenMOSS
research
-
AnyFlow: видеодиффузия с произвольным числом шагов через on-policy дистилляцию flow map
MIT / NVIDIA
research
-
TrOPD: Trust-Region On-Policy Distillation Stabilizes LLM Training When Teacher-Student Gap Is Large
Samsung Research
research
-
Do Language Models Need Sleep? Offline Recurrence as Memory Consolidation for Improved Inference
Google / CMU
research
-
InterleaveThinker: RL-фреймворк для агентной генерации чередующегося текста и изображений
research
-
EvoArena: LLM-агенты набирают лишь 39,6% на бенчмарке динамически меняющихся сред
MIT
research
-
FORT-Searcher: фреймворк обучающих данных, устойчивых к «срезанию углов», для агентов глубокого поиска
research
-
Astra: VLM с RL-обучением запрашивает симулятор мира для пространственных рассуждений
research
-
Intern-Atlas: граф эволюции методологий из 1 млн статей как исследовательская инфраструктура для AI-учёных
research
-
HeavySkill: интернализация «тяжёлого мышления» как обучаемого агентного навыка через RL
research
-
LongSeeker: эластичная оркестрация контекста для агентов долгосрочного поиска
Shanghai Jiao Tong University
research
-
Исполняемые мировые модели для ARC-AGI-3: подход агента программирования без игровой специфики
research
-
Структурное происхождение attention sink: расхождение дисперсий, суперн ейроны и исправление
research
-
Direct Corpus Interaction: переосмысление поиска для агентных систем
TIGER-Lab
research
-
Cola DLM: непрерывная латентная диффузионная языковая модель с конкурентным масштабированием
research
-
Learning, Fast and Slow: двойная весовая архитектура для непрерывной адаптации LLM
research
-
QUBRIC: Co-Designing Queries and Rubrics Extends RLVR to Open-Ended Reasoning Domains
research
-
Quantifying Faithful Confidence Expression in Large Reasoning Models
Yale NLP
research
-
SubtleMemory: бенчмарк выявляет систематические провалы агентов в тонком реляционном запоминании
research
-
Code2LoRA: гиперсеть генерирует репозиторно-специфичные адаптеры для code LM без накладных расходов на инференс
University of Waterloo
research
-
VideoKR: обучающий корпус из 315K примеров для знание- и рассуждение-интенсивного понимания видео
Yale University
research
-
Память реконструируется, а не извлекается: графовая память улучшает запоминание у LLM-агентов на 23%
National University of Singapore
research
-
Diffusion-Proof: формальное доказательство теорем с помощью диффузионных языковых моделей
research
-
DreamReasoner-8B: блоковый размерный curriculum для диффузионных reasoning-моделей
research
-
StylisticBias: 15 визуальных атрибутов объясняют 80% социальных предубеждений в мультимодальных LLM
research
-
Коллапс предпочтений мультимодального оценщика: кросс-модальное заражение в циклах самоэволюции агентов
research
-
Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond
HKUST/NUS/Oxford/NTU
research
-
World-R1: Reinforcing 3D Constraints for Text-to-Video Generation
Microsoft Research
research
-
LLM Safety From Within (SIREN)
University of Toronto CSSLab / McGill / LMU Munich
research