Mistral выпускает OCR 4: SOTA-модель для работы с документами с возможностью локального развёртывания
Mistral AI
Mistral выпустила OCR 4 — модель для интеллектуальной обработки документов с поддержкой 170 языков, возвращающую структурированный вывод с ограничивающими рамками, классификацией блоков по типам (заголовки, таблицы, формулы, подписи) и инлайн-оценками уверенности. Модель занимает первое место на OlmOCRBench с результатом 85.20 и 72% среднего процента побед в пользовательских исследованиях, развёртывается как единый контейнер для on-premises-использования. Стоимость — $4 за 1000 страниц через API; доступна на Mistral API, Amazon SageMaker и Microsoft Foundry.
Почему это важно
Сочетание лучшего в классе качества извлечения данных с возможностью самостоятельного хостинга в едином контейнере устраняет ключевой барьер для корпоративных клиентов — необходимость передавать конфиденциальные документы в сторонние облачные API, — укрепляя позиции Mistral на рынке корпоративной обработки документов.
Важность: 3/5
SOTA-модель для работы с документами с on-premises-опцией; закрывает очевидную нишу для предприятий, которую не могут занять облачные конкуренты