Mistral выпускает OCR 4: SOTA-модель для работы с документами с возможностью локального развёртывания

Mistral AI

модели/LLM офиц. + СМИ 3 ист. ~1 мин

Mistral выпустила OCR 4 — модель для интеллектуальной обработки документов с поддержкой 170 языков, возвращающую структурированный вывод с ограничивающими рамками, классификацией блоков по типам (заголовки, таблицы, формулы, подписи) и инлайн-оценками уверенности. Модель занимает первое место на OlmOCRBench с результатом 85.20 и 72% среднего процента побед в пользовательских исследованиях, развёртывается как единый контейнер для on-premises-использования. Стоимость — $4 за 1000 страниц через API; доступна на Mistral API, Amazon SageMaker и Microsoft Foundry.

Почему это важно

Сочетание лучшего в классе качества извлечения данных с возможностью самостоятельного хостинга в едином контейнере устраняет ключевой барьер для корпоративных клиентов — необходимость передавать конфиденциальные документы в сторонние облачные API, — укрепляя позиции Mistral на рынке корпоративной обработки документов.

Важность: 3/5

SOTA-модель для работы с документами с on-premises-опцией; закрывает очевидную нишу для предприятий, которую не могут занять облачные конкуренты

Источники