World-R1: Reinforcing 3D Constraints for Text-to-Video Generation
Microsoft Research
RL-fine-tuning text-to-video с reward-сигналом по 3D-геометрической согласованности; 3D-aware reward резко улучшает temporal coherence без потери визуального качества.
Importance: 2/5
Backfilled from MD; not retroactively scored.