MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике

MiniMax

исследования официальный 2 ист. ~1 мин

MiniMax опубликовала MaxProof — фреймворк для обучения и масштабирования при инференсе математических доказательств с использованием серии моделей MiniMax M3. Обучаются три возможности: генерация доказательств, верификация и исправление с учётом критики, — с использованием генеративного верификатора, оптимизированного на низкую долю ложноположительных результатов. При инференсе модель одновременно выступает генератором, верификатором, улучшателем и ранжировщиком, выбирая итоговое доказательство посредством турнирного ранжирования. MaxProof достигает 35/42 на IMO 2025 и 36/42 на USAMO 2026, превышая порог золотой медали на обоих соревнованиях. Опубликована на arXiv (2606.13473) с 75 апвоутами на HuggingFace Daily Papers.

Почему это важно

Результат уровня золотой медали на IMO и USAMO одновременно от единой унифицированной открытой модели — а не ансамбля специализированных систем — означает значимый прогресс в формальных математических рассуждениях. 75 апвоутов на HF Daily Papers.

Важность: 4/5

Первая открытая модель, одновременно преодолевшая порог золота IMO и USAMO; создана лабораторией, выпускающей открытые веса M3 на этой же неделе.

Источники

официальный MaxProof — arXiv
официальный MaxProof — HuggingFace Papers