MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике
MiniMax
MiniMax опубликовала MaxProof — фреймворк для обучения и масштабирования при инференсе математических доказательств с использованием серии моделей MiniMax M3. Обучаются три возможности: генерация доказательств, верификация и исправление с учётом критики, — с использованием генеративного верификатора, оптимизированного на низкую долю ложноположительных результатов. При инференсе модель одновременно выступает генератором, верификатором, улучшателем и ранжировщиком, выбирая итоговое доказательство посредством турнирного ранжирования. MaxProof достигает 35/42 на IMO 2025 и 36/42 на USAMO 2026, превышая порог золотой медали на обоих соревнованиях. Опубликована на arXiv (2606.13473) с 75 апвоутами на HuggingFace Daily Papers.
Почему это важно
Результат уровня золотой медали на IMO и USAMO одновременно от единой унифицированной открытой модели — а не ансамбля специализированных систем — означает значимый прогресс в формальных математических рассуждениях. 75 апвоутов на HF Daily Papers.
Важность: 4/5
Первая открытая модель, одновременно преодолевшая порог золота IMO и USAMO; создана лабораторией, выпускающей открытые веса M3 на этой же неделе.