Mistral выпускает OCR 4 с bounding box'ами, классификацией блоков и поддержкой 170 языков

Mistral

инструменты офиц. + СМИ 4 ист. ~1 мин

Mistral опубликовала OCR 4 23 июня 2026 года. Новые возможности: bounding box'ы на уровне слов, типизированная классификация блоков (заголовки, таблицы, формулы, подписи) и оценки уверенности на уровне слов — что обеспечивает привязанные к источнику цитаты и пространственную индексацию. Модель поддерживает 170 языков в 10 языковых группах, обрабатывает форматы PDF, DOC, PPT и OpenDocument и запускается в режиме self-hosted в одном контейнере. На OlmOCRBench — 85,20 баллов (лучший общий результат), на OmniDocBench — 93,07. Цена: $4 за 1 000 страниц через API, $2 — через Batch API.

Почему это важно

Bounding box'ы и оценки уверенности — наиболее востребованные возможности для document AI пайплайнов, позволяющие выделять фрагменты в контексте, извлекать данные из форм и выполнять пространственные рассуждения, недоступные при чисто текстовом извлечении. Поддержка self-hosting устраняет опасения по поводу утечки данных в регулируемых отраслях.

Важность: 3/5

SOTA-модель документальной разведки с bounding box'ами (новый класс возможностей) + вариант self-hosted-развёртывания для регулируемых отраслей

Источники