Mistral OCR 3 : Améliorez la précision et l'efficacité des documents
Mistral OCR 3 : Améliorez la précision et l'efficacité des documents
Mistral
17 déc. 2025


Not sure what to do next with AI?
Assess readiness, risk, and priorities in under an hour.
Not sure what to do next with AI?
Assess readiness, risk, and priorities in under an hour.
➔ Réservez une consultation
Pourquoi c'est important maintenant
Mistral OCR 3 est la dernière version de la suite Document AI de Mistral, conçue pour extraire du texte et des images intégrées de documents complexes avec une grande fidélité et rapidité—désormais disponible dans Studio et API. Il reconstruit la mise en page et les tableaux (sortie Markdown enrichie avec des tableaux HTML) et propose une tarification très compétitive pour des charges de travail à grande échelle.
Points clés / avantages
Extraction haute-fidélité de texte + images intégrées, avec rétention de structure (tableaux, mise en page) pour une utilisation en aval plus facile.
Rapide et économique : tarifé à 2 $ pour 1 000 pages (API Batch 1 $ pour 1 000 pages), avec une option de pages annotées.
Conçu pour l'échelle sur les factures, formulaires, numérisations et documents de qualité mixte; disponible via Mistral Studio et API.
Comment ça fonctionne
Mistral OCR 3 améliore la version précédente (voir changelog de déc. 2025) avec une compréhension améliorée de la mise en page et la reconstruction de tableaux HTML dans les sorties Markdown—permettant aux systèmes d'ingérer à la fois le contenu et la structure. Il est aussi positionné comme un modèle plus petit et plus rapide que les OCR d’entreprise typiques, permettant une faible latence et un coût par page réduit à grande échelle.
Revendications notables au lancement : Mistral souligne une “précision de pointe” et de solides réussites sur les formulaires, numérisations, tableaux complexes et écritures manuscrites (selon les chaînes officielles). Considérez les revendications de référence comme provenant du fournisseur jusqu’à ce que des évaluations tierces soient disponibles.
Étapes pratiques / exemples
Conversion massive d’archives : passez des PDF archivés par OCR 3 en utilisant l'API Batch pour minimiser le coût par page, puis envoyez du Markdown/HTML structuré dans votre ECM ou lac de données.
Capture de factures & formulaires : utilisez la reconstruction de tableaux pour mapper les lignes d'articles directement dans les schémas en aval (AP, logistique, CRM) avec moins de règles regex post-OCR.
Flux de travail de connaissances : extrayez le texte et les images entrelacés des articles de recherche ou contrats, puis orientez-les vers les pipelines RAG tout en préservant les titres de section et les tableaux.
QA humain dans la boucle : pour les équipes réglementées, échantillonnez des pages annotées pour vérifier l'exactitude avant de promouvoir les pipelines en production.
Mistral OCR 3 est un service AI de document haute-fidélité qui extrait du texte et des images intégrées tout en préservant la structure (y compris les tableaux reconstruits en HTML). Il est conçu pour la vitesse et l'échelle, avec des tarifs à partir de 2 $ pour 1 000 pages et des réductions API Batch pour le traitement en masse.
FAQs
Q1 : Qu'est-ce qui rend Mistral OCR 3 unique ?
Il combine extraction de contenu + structure (Markdown avec tableaux HTML) dans un modèle plus petit et plus rapide, permettant des coûts et une latence réduits à grande échelle. mistral.ai
Q2 : Gère-t-il plusieurs langues et les mises en page complexes ?
Mistral positionne OCR 3 pour des documents divers—formulaires, numérisations, tableaux complexes et écritures manuscrites—et il fait partie d'une pile de compréhension de documents utilisée à travers du contenu multilingue. Vérifiez la couverture linguistique pour votre corpus pendant le pilote. mistral.ai+1
Q3 : Comment est-il tarifé ?
Prix catalogue 2 $ / 1 000 pages; API Batch réduit le prix effectif à 1 $ / 1 000 pages. Une option de pages annotées est disponible dans les documents. Vérifiez votre région et votre niveau d’utilisation. mistral.ai+1
Q4 : Comment y accédons-nous ?
Disponible dès maintenant via Mistral Studio et API (famille d'ID de modèle : mistral-ocr-*, par exemple, mistral-ocr-2512). Voir “Models” et “Changelog” pour les détails des versions. docs.mistral.ai+1
Pourquoi c'est important maintenant
Mistral OCR 3 est la dernière version de la suite Document AI de Mistral, conçue pour extraire du texte et des images intégrées de documents complexes avec une grande fidélité et rapidité—désormais disponible dans Studio et API. Il reconstruit la mise en page et les tableaux (sortie Markdown enrichie avec des tableaux HTML) et propose une tarification très compétitive pour des charges de travail à grande échelle.
Points clés / avantages
Extraction haute-fidélité de texte + images intégrées, avec rétention de structure (tableaux, mise en page) pour une utilisation en aval plus facile.
Rapide et économique : tarifé à 2 $ pour 1 000 pages (API Batch 1 $ pour 1 000 pages), avec une option de pages annotées.
Conçu pour l'échelle sur les factures, formulaires, numérisations et documents de qualité mixte; disponible via Mistral Studio et API.
Comment ça fonctionne
Mistral OCR 3 améliore la version précédente (voir changelog de déc. 2025) avec une compréhension améliorée de la mise en page et la reconstruction de tableaux HTML dans les sorties Markdown—permettant aux systèmes d'ingérer à la fois le contenu et la structure. Il est aussi positionné comme un modèle plus petit et plus rapide que les OCR d’entreprise typiques, permettant une faible latence et un coût par page réduit à grande échelle.
Revendications notables au lancement : Mistral souligne une “précision de pointe” et de solides réussites sur les formulaires, numérisations, tableaux complexes et écritures manuscrites (selon les chaînes officielles). Considérez les revendications de référence comme provenant du fournisseur jusqu’à ce que des évaluations tierces soient disponibles.
Étapes pratiques / exemples
Conversion massive d’archives : passez des PDF archivés par OCR 3 en utilisant l'API Batch pour minimiser le coût par page, puis envoyez du Markdown/HTML structuré dans votre ECM ou lac de données.
Capture de factures & formulaires : utilisez la reconstruction de tableaux pour mapper les lignes d'articles directement dans les schémas en aval (AP, logistique, CRM) avec moins de règles regex post-OCR.
Flux de travail de connaissances : extrayez le texte et les images entrelacés des articles de recherche ou contrats, puis orientez-les vers les pipelines RAG tout en préservant les titres de section et les tableaux.
QA humain dans la boucle : pour les équipes réglementées, échantillonnez des pages annotées pour vérifier l'exactitude avant de promouvoir les pipelines en production.
Mistral OCR 3 est un service AI de document haute-fidélité qui extrait du texte et des images intégrées tout en préservant la structure (y compris les tableaux reconstruits en HTML). Il est conçu pour la vitesse et l'échelle, avec des tarifs à partir de 2 $ pour 1 000 pages et des réductions API Batch pour le traitement en masse.
FAQs
Q1 : Qu'est-ce qui rend Mistral OCR 3 unique ?
Il combine extraction de contenu + structure (Markdown avec tableaux HTML) dans un modèle plus petit et plus rapide, permettant des coûts et une latence réduits à grande échelle. mistral.ai
Q2 : Gère-t-il plusieurs langues et les mises en page complexes ?
Mistral positionne OCR 3 pour des documents divers—formulaires, numérisations, tableaux complexes et écritures manuscrites—et il fait partie d'une pile de compréhension de documents utilisée à travers du contenu multilingue. Vérifiez la couverture linguistique pour votre corpus pendant le pilote. mistral.ai+1
Q3 : Comment est-il tarifé ?
Prix catalogue 2 $ / 1 000 pages; API Batch réduit le prix effectif à 1 $ / 1 000 pages. Une option de pages annotées est disponible dans les documents. Vérifiez votre région et votre niveau d’utilisation. mistral.ai+1
Q4 : Comment y accédons-nous ?
Disponible dès maintenant via Mistral Studio et API (famille d'ID de modèle : mistral-ocr-*, par exemple, mistral-ocr-2512). Voir “Models” et “Changelog” pour les détails des versions. docs.mistral.ai+1
Recevez des conseils pratiques directement dans votre boîte de réception
En vous abonnant, vous consentez à ce que Génération Numérique stocke et traite vos informations conformément à notre politique de confidentialité. Vous pouvez lire la politique complète sur gend.co/privacy.
Génération
Numérique

Bureau au Royaume-Uni
33 rue Queen,
Londres
EC4R 1AP
Royaume-Uni
Bureau au Canada
1 University Ave,
Toronto,
ON M5J 1T1,
Canada
Bureau NAMER
77 Sands St,
Brooklyn,
NY 11201,
États-Unis
Bureau EMEA
Rue Charlemont, Saint Kevin's, Dublin,
D02 VN88,
Irlande
Bureau du Moyen-Orient
6994 Alsharq 3890,
An Narjis,
Riyad 13343,
Arabie Saoudite
Numéro d'entreprise : 256 9431 77 | Droits d'auteur 2026 | Conditions générales | Politique de confidentialité
Génération
Numérique

Bureau au Royaume-Uni
33 rue Queen,
Londres
EC4R 1AP
Royaume-Uni
Bureau au Canada
1 University Ave,
Toronto,
ON M5J 1T1,
Canada
Bureau NAMER
77 Sands St,
Brooklyn,
NY 11201,
États-Unis
Bureau EMEA
Rue Charlemont, Saint Kevin's, Dublin,
D02 VN88,
Irlande
Bureau du Moyen-Orient
6994 Alsharq 3890,
An Narjis,
Riyad 13343,
Arabie Saoudite
Numéro d'entreprise : 256 9431 77
Conditions générales
Politique de confidentialité
Droit d'auteur 2026










