Reconnaissance optique de caractères (OCR) et autres technologies de reconnaissance

Reconnaissance optique de caractères (OCR)

Technologie OCR : la reconnaissance de texte imprimé est disponible pour 211 langues, notamment :
- Langues européennes (alphabets latin, cyrillique, arménien et grec)
- Chinois (simplifié et traditionnel), japonais et coréen (CJK)
- Arabe, thaï, vietnamien, hébreu et farsi
- Birman — version en préversion technique
- FineReader XIX — un module OCR spécialement conçu pour la numérisation et l’archivage de documents anciens, de livres et de journaux publiés du XVIIe au XXe siècle, dont beaucoup sont rares et uniques. Conservés dans les archives historiques des bibliothèques et des organismes publics, ils constituent un patrimoine national qui doit être préservé. FineReader XIX offre une capacité unique de reconnaissance des textes publiés entre 1600 et 1937 en anglais, français, allemand, italien et espagnol. Il prend en charge la reconnaissance d’anciennes polices telles que Fraktur, Schwabacher et la plupart des polices gothiques.

56 langues bénéficient de la prise en charge des dictionnaires et de la morphologie, ce qui améliore considérablement la précision de l’OCR.
La fonctionnalité de reconnaissance de documents multilingues permet de reconnaître plusieurs langues dans un même document, par exemple l’allemand et le chinois, ou l’anglais, le russe et le coréen.
Reconnaissance de documents à impression matricielle — ABBYY FineReader Engine reconnaît des textes imprimés en mode matriciel de nombreux types. Il a été entraîné à l’aide de plusieurs milliers d’échantillons issus de différents types d’imprimantes, notamment matricielles, à marguerite, à chaîne et à bande, ainsi qu’avec les modes d’impression brouillon et Near Letter Quality (NLQ).
Reconnaissance de documents dactylographiés.
Reconnaissance des polices OCR-A, OCR-B, MICR (E13B) et CMC7.

Voir la liste complète des langues prises en charge et les types de texte.

Reconnaissance intelligente de caractères (ICR)

Technologie ICR — reconnaissance de caractères manuscrits en lettres détachées pour plus de 126 langues.
39 langues (avec alphabet latin, grec et cyrillique) avec prise en charge de la morphologie et des dictionnaires.
ICR pour les chiffres indiens utilisés dans les pays arabes.
30 styles régionaux d’écriture en lettres détachées utilisés dans différents pays et régions du monde (pour les langues ICR prises en charge).
Reconnaissance de caractères manuscrits en lettres détachées dans les champs et les cadres — champs soulignés, cases, champs de type peigne, etc.
ICR multilingue. L’un des principaux avantages de la technologie ICR d’ABBYY est qu’elle offre pratiquement le même niveau élevé de précision pour la reconnaissance des chiffres et des chiffres combinés à des lettres d’une ou de plusieurs langues, même lorsque les champs contiennent à la fois des lettres majuscules et minuscules.

Reconnaissance optique de marques (OMR)

La technologie OMR d’ABBYY reconnaît différentes variantes de coches, notamment les coches simples, les coches groupées, les coches de modèle et les coches avec des « corrections » apportées à la main :

coches dans un cadre carré
coches sur fond vierge
types de coches non standard (les coches spéciales nécessitent un apprentissage avant de pouvoir être reconnues)

L’OMR offre un taux de précision de 99,995 %

Reconnaissance optique de Barcode (OBR)

Types de Barcode 1D et 2D. ABBYY OCR SDK prend en charge la reconnaissance des types courants de Barcode 1D et 2D. Voir la liste des types de Barcode pris en charge.
Extraction rapide de Barcode. Cette fonctionnalité permet de détecter et de reconnaître automatiquement les Barcode, quelle que soit leur orientation dans un document. Elle fonctionne à la fois pour les Barcode 1D et 2D

Modes de reconnaissance

Grâce aux modes de traitement prédéfinis de l’Engine, les développeurs peuvent rapidement configurer et ajuster la vitesse et la précision du traitement de la manière la plus adaptée à leurs besoins. Outre le mode de traitement par défaut, la Reconnaissance optique de caractères (OCR) et la reconnaissance ICR peuvent être effectuées selon les modes de reconnaissance normal, rapide et précis :

Mode de reconnaissance précis Il s’agit du mode le plus précis pour obtenir la meilleure qualité de reconnaissance. Ce mode est fortement recommandé si vous prévoyez de réutiliser le contenu reconnu, ainsi que pour d’autres tâches où la précision est un critère essentiel.
Mode de reconnaissance rapide Il est conçu pour le traitement de gros volumes de documents et pour les cas où la vitesse est prioritaire. Ce mode augmente la vitesse de traitement de 200 à 250 %, ce qui rend la technologie idéale pour une utilisation dans les systèmes de gestion de contenu (CMS), de gestion documentaire (DMS) et d’archivage.
Mode de reconnaissance normal Il définit des valeurs intermédiaires de précision et de vitesse de reconnaissance entre les modes Précis et Rapide. En général, il offre une vitesse plus élevée pour un niveau de précision presque équivalent à celui du mode Précis.

Reconnaissance de texte intégral et reconnaissance par champ

Il existe deux types de reconnaissance qui peuvent être distingués : la reconnaissance de texte intégral et la reconnaissance par champ. La principale différence est que la reconnaissance de texte intégral inclut généralement la Reconnaissance optique de caractères (OCR) et est utilisée pour la conversion de documents. La reconnaissance par champ inclut l’OCR, l’ICR et d’autres technologies utilisées sur des zones localisées pour reconnaître et extraire des données spécifiques. Le tableau suivant présente les spécifications de ces types de reconnaissance :

Spécification	Reconnaissance de texte intégral	Reconnaissance par champ
Domaine d’utilisation	Conversion de documents, archivage de livres	Capture de données
Analyse du document	Analyse générale de documents, analyse de documents pour les factures, analyse de documents pour l’indexation plein texte	Spécification manuelle des blocs pour la reconnaissance par champ
Reconnaissance	OCR avec une précision générale d’environ 96 à 99 %	OCR, ICR, OMR, reconnaissance de Barcodes avec des types de données et des plages de valeurs prédéfinis. La précision est d’environ 100 %
Vérification	Recommandée pour la réutilisation du contenu	Obligatoire dans la plupart des cas
Synthèse	Utilisée pour la restitution de documents	Non utilisée
Export des résultats de reconnaissance	Fichiers de document (RTF, DOCX, PDF, etc.)	Export vers un fichier XML ou une base de données

Reconnaissance de texte intégral La reconnaissance de texte intégral est un type de reconnaissance de base pour différentes tâches, telles que :

Archivage de documents
Conversion de documents pour la réutilisation du contenu
Extraction du texte brut pour la détection des champs et la classification des documents

Toutes nécessitent la reconnaissance (OCR) de l’intégralité du texte du document (page). Avant la reconnaissance, l’analyse du document prend généralement en charge le découpage et la correction de l’orientation des pages, ainsi que la détection des blocs de texte, des images et d’autres objets. Ensuite, après l’OCR, la synthèse du document reconstruit la structure et la mise en page du document (pour la réutilisation du contenu) ou restitue simplement l’ordre correct du texte pour les documents complexes comportant plusieurs colonnes de texte et des images (pour le scénario d’archivage). Le texte obtenu est exporté selon la tâche, soit sous forme de texte brut, soit sous forme de document dans un format pris en charge. Le texte peut être vérifié manuellement afin d’en améliorer la précision, notamment en vue d’une réutilisation ultérieure. Reconnaissance par champ ABBYY FineReader Engine 12 offre des capacités complètes de reconnaissance par champ pour prendre en charge des processus métier clés tels que le traitement des formulaires, la classification par mots-clés et l’indexation par mots-clés. De puissantes fonctions de traitement d’image renforcent sa capacité à détecter intelligemment de petites zones, quelle que soit leur qualité, avec tout type de particularités graphiques susceptibles d’affecter la précision de la reconnaissance (par ex., texte souligné, parasites de numérisation, espaces dans le texte, etc.) Les principales fonctionnalités de la reconnaissance par champ, ou reconnaissance zonale, incluent l’OCR et l’ICR multilingues, l’OMR, la reconnaissance de Barcodes, ainsi qu’un ensemble de fonctions spécifiques, telles que :

Extraction de données à partir de champs avec diverses bordures et cadres, y compris les listes déroulantes, les champs soulignés, les cases, et même les champs où les données ne tiennent pas à l’intérieur de la bordure du champ
Définition du contenu du champ en configurant des alphabets, des dictionnaires, des expressions régulières, des types de segmentation, des styles d’écriture manuscrite (Windows uniquement), etc.
Détection des espaces à l’intérieur des champs, avec une reconnaissance précise des champs où les espaces sont autorisés. ABBYY FineReader Engine 12 permet également d’utiliser des dictionnaires contenant des combinaisons de mots avec espaces
Traitement intelligent des blocs avec des parties et des lignes qui se croisent, permettant de reconnaître le texte (mots et symboles) situé entièrement à l’intérieur des bordures du bloc, ce qui fait gagner du temps en évitant la reconnaissance de blocs de texte non pertinents
Déparasitage des blocs de texte, avec la possibilité de spécifier la taille des « parasites » blancs ou noirs

La reconnaissance par champ est prise en charge par les outils spéciaux de l’Engine destinés aux développeurs, tels que Voting API et le réglage de la reconnaissance “On-the-Fly”. Pour plus de détails, veuillez consulter outils de développement avancés.

Langues utilisateur

ABBYY FineReader Engine fournit une API permettant de créer et de modifier des langues de reconnaissance, de créer des copies de langues de reconnaissance prédéfinies et de les ajuster, ainsi que d’ajouter de nouveaux mots aux langues utilisateur. Par exemple, si un document contient des « structures » telles que des codes de produit, des numéros de téléphone, des numéros de passeport, etc., des erreurs de reconnaissance peuvent se produire. Cela s’explique par le fait que le programme lit ces structures lettre par lettre. Pour améliorer la reconnaissance des codes de produit et d’autres éléments similaires, vous pouvez créer une nouvelle langue de reconnaissance qui aidera le programme à lire correctement des types de données spécifiques. Vous trouverez ci-dessous deux exemples illustrant comment les langues utilisateur peuvent vous aider à améliorer la qualité de la reconnaissance :

Dans les documents remplis à la main, les valeurs des champs de formulaire appartiennent généralement à un ensemble spécifique, comme des noms de villes, des pays, des codes postaux, des codes de produit, des montants, etc. Pour améliorer la qualité de la reconnaissance ICR, vous pouvez utiliser des langues utilisateur pour décrire les informations susceptibles d’être saisies dans chaque champ.
Si un document contient des « structures » telles que des codes de produit, des numéros de téléphone, des numéros de passeport, etc., des erreurs de reconnaissance peuvent se produire. Cela s’explique par le fait que le programme lit ces structures lettre par lettre. Pour améliorer la reconnaissance des codes de produit et d’autres éléments similaires, vous pouvez créer une nouvelle langue de reconnaissance qui aidera le programme à lire correctement des types de données spécifiques.

Entraînement des motifs

Dans la très grande majorité des cas, ABBYY FineReader Engine peut lire les textes correctement sans entraînement préalable. Toutefois, pour la reconnaissance de polices décoratives ou détourées, ou pour le traitement en masse de documents de faible qualité d’impression, un entraînement des motifs préalable peut s’avérer utile. Le SDK de Reconnaissance optique de caractères (OCR) vous permet de créer et d’utiliser directement des motifs utilisateur via l’API. Vous pouvez entraîner des motifs en chargeant des images et en les associant aux caractères correspondants.

Voir aussi

Fonctionnalités clés Visite guidée : entraînement des motifs utilisateurs - Windows uniquement Outils de développement avancés