AI Co-Mathematician от Google DeepMind достигает 48% на FrontierMath Tier 4
Google DeepMind
Google DeepMind представляет интерактивный агентический стенд, поддерживающий полный цикл математических исследований: генерацию идей, поиск литературы, вычислительное исследование, разработку формальных доказательств и построение теорий. Система поддерживает stateful асинхронное рабочее пространство, отслеживающее неопределённость, фиксирующее неудавшиеся гипотезы и сигнализирующее о тупиках в рассуждениях. На FrontierMath Tier 4 (сложные нерешённые задачи) она достигает 48% — новый SOTA среди всех оценённых AI-систем. В ходе ранних реальных испытаний система помогала исследователям решать открытые задачи и находить упущенные из виду ссылки.
Почему это важно
48% на FrontierMath Tier 4 — конкретный SOTA-рубеж, демонстрирующий, что агентическое scaffolding — а не только сырые возможности модели — существенно продвигает математические открытия.
Важность: 3/5
Новый SOTA — 48% на FrontierMath Tier 4; stateful агентический математический стенд применён к реальным исследовательским задачам; фронтирная лаборатория Google DeepMind.