AI
AI Digest
EN RU
Главная Архив О проекте RSS

#post-training

2 пункта

  • 10 июн DRPO: переосмысление дивергентной регуляризации в обучении с подкреплением для LLM Tencent Hunyuan research
  • 11 июн Анатомия пост-обучения: использование интерпретируемости для аудита и исправления данных предпочтений research

ai-digest.kerby.pro

© 2026 Алексей Лукин · CC BY 4.0

RSS · JSON Feed · О проекте