AI Co-Mathematician: Google DeepMind достигает 48% на FrontierMath Tier 4

Google DeepMind

исследования официальный 1 ист. ~1 мин

Google DeepMind представляет интерактивный AI-воркбенч для совместных математических исследований (arXiv:2605.06651, 18 авторов), охватывающий генерацию идей, поиск литературы, вычислительное исследование, доказательство теорем и построение теорий в виде асинхронного рабочего пространства, отслеживающего неопределённость и историю исследования. Система достигает 48% на FrontierMath Tier 4 — рекордный показатель на момент подачи — и демонстрирует практическую полезность при решении открытых задач и открытии новых исследовательских направлений.

Почему это важно

В отличие от предыдущих математических AI, сфокусированных исключительно на поиске доказательств, это полноценный исследовательский ко-пилот, покрывающий весь математический рабочий процесс. FrontierMath Tier 4 относится к числу наиболее сложных публично доступных математических бенчмарков.

Важность: 3/5

Google DeepMind; рекордные 48% на FrontierMath Tier 4 с полноцикловым помощником для математических исследований — первая система, охватывающая полный цикл математических исследований.

Источники