AI
AI Digest
EN RU
Главная Архив О проекте RSS

#rlvr

2 пункта

  • 17 июн VibeThinker-3B достигает показателей frontier-уровня на бенчмарках рассуждений через curriculum RL WeiboAI research
  • 10 июн DRPO: переосмысление дивергентной регуляризации в обучении с подкреплением для LLM Tencent Hunyuan research

ai-digest.kerby.pro

© 2026 Алексей Лукин · CC BY 4.0

RSS · JSON Feed · О проекте