23 июня 2026 года Mistral AI выпустила Mistral OCR 4 — модель для распознавания текста. Она не только извлекает текст, но и возвращает ограничивающие рамки, классифицирует блоки (заголовки, таблицы, уравнения, подписи и др.), а также выдаёт встроенные показатели достоверности. Модель поддерживает 170 языков из 10 языковых групп, работает в едином контейнере для автономных развёртываний и может служить компонентом для корпоративного поиска, RAG и поисковых конвейеров для конкретных доменов.
Независимые комментаторы предпочитают OCR 4 ведущим системам распознавания текста и создания документов с ИИ — средний процент выигрышей составляет 72%, а общий балл на OlmOCRBench достигает 85,20. Модель интегрирована с Mistral Search Toolkit — компонуемой поисковой платформой Mistral с открытым исходным кодом. Её структурированные выходные данные дают готовые к цитированию данные для обработки, извлечения и оценки инструментария для RAG и корпоративного поиска.
OCR 4 подходит для развёртывания на собственной инфраструктуре: модель компактна, позволяет хранить данные документов в среде организации и обеспечивает экономичную пакетную обработку с высокой производительностью. Корпоративным клиентам доступно автономное развёртывание. Разработчики могут интегрировать модель через API, а команды — использовать Document AI в Mistral Studio для доступа к движку на уровне приложения без кода.
Стоимость распознавания текста через API — 4 доллара за 1000 страниц, при пакетном использовании предоставляется скидка 50% (стоимость снижается до 2 долларов за 1000 страниц). Стоимость Document AI составляет 5 долларов за 1000 страниц.
В ходе тестирования Mistral OCR 4 сравнивали с ведущими анализаторами документов, моделями общего назначения, корпоративными службами документооборота и Mistral OCR 3. Для оценки собрали более 600 документов на более чем 12 языках от сторонних поставщиков. Независимые комментаторы вслепую сопоставляли результаты работы конкурентов с результатами OCR 4 — модель предпочитали в большинстве случаев. Кроме того, OCR 4 показал высокую скорость распознавания текста: примерно в 4 раза быстрее, чем у действующего поставщика, по словам Ивана Михайлова, инженера по ИИ из Anaqua.
При этом в тестах (OlmOCRBench, OmniDocBench) есть ограничения: некоторые несоответствия в оценках связаны не с ошибками модели, а с особенностями методик сравнения результатов. Например, проблемы возникают при работе с математическими и научными документами, многоколоночными текстами и при оценке атрибуции типа блока.