Prétraitement d’image - ABBYY Documentation

Pourquoi améliorer les images ?

L’amélioration de la qualité des images répond à un double objectif. D’une part, nous devons améliorer la qualité des images afin de les rendre mieux adaptées à la Reconnaissance optique de caractères (OCR).

D’autre part, nous devons améliorer leur apparence, ce qui est nécessaire, par exemple, lors de l’archivage d’images de documents.

Les technologies ABBYY étant axées sur l’analyse et la reconnaissance de documents, le système inclut un ensemble puissant de technologies de prétraitement d’images : binarisation adaptative, correction des déformations, redressement des lignes de texte, séparation des doubles pages, etc. Aucun outil tiers n’est nécessaire pour obtenir des résultats OCR précis. ABBYY offre un ensemble complet de technologies de prétraitement conçues pour l’OCR.

Prétraitement des images

À la réception des images, ABBYY FineReader Engine effectue une série de fonctions de prétraitement d’image afin d’améliorer la qualité des images de documents en vue d’une reconnaissance ou d’un archivage ultérieur :


	Cette fonctionnalité d’imagerie documentaire est particulièrement importante pour l’importation en masse d’images lorsque le sens de numérisation des pages du document est inconnu et peut varier. Le système détecte automatiquement l’orientation de chaque page et la corrige si nécessaire.
	Cette fonctionnalité est utilisée pour la numérisation de livres en doubles pages — aussi bien pour les pages de gauche que de droite. La qualité de la reconnaissance est meilleure lorsque la page est divisée en deux, chaque partie correspondant à une seule page du livre. La reconnaissance et l’analyse de la mise en page sont alors effectuées séparément pour chaque page, avec correction de l’inclinaison si nécessaire.
	Il s’agit d’une fonction d’imagerie documentaire essentielle, appliquée aux documents numérisés nécessitant une compensation de l’inclinaison de l’image. Elle ne requiert ni bordures ni lignes de référence. Le nouvel ABBYY FineReader Engine 12 propose plusieurs méthodes de correction de l’inclinaison des images : par paires de carrés noirs, par lignes ou par lignes de texte.
	Lors de la capture de texte à partir de livres numérisés ou photographiés, les lignes de texte peuvent être irrégulières et difficiles à traiter par reconnaissance optique de caractères (OCR). Les technologies ABBYY intègrent des algorithmes spéciaux qui corrigent l’inclinaison et redressent les lignes de texte afin d’assurer une reconnaissance précise du texte.
	Lors de la numérisation de documents de qualité médiocre à moyenne, les images obtenues peuvent être très bruitées, parsemées de points ou de taches. Ces taches, lorsqu’elles apparaissent à proximité des lettres ou des chiffres, peuvent nuire à la qualité de l’OCR. Cette fonctionnalité supprime ce type de bruit. La taille des taches à supprimer peut être définie par l’utilisateur. Elle peut être appliquée à une image entière ou à n’importe quel bloc (ou zone) individuel de l’image.
	Cette technologie identifie automatiquement les photos numériques et corrige les distorsions généralement introduites par les appareils photo numériques. Le système prend en charge les défauts typiques des images numériques, tels que les lignes de texte déformées, les distorsions 3D trapézoïdales, le flou, les bavures, les zones assombries sur les pages en vis-à-vis dans les livres épais, les reflets, le bruit ISO, etc. Ces défauts sont corrigés automatiquement, sans que l’utilisateur ait besoin de recourir à des applications tierces pour retoucher les photos.
	La technologie de filtrage de texture permet d’éliminer le « bruit » de fond lié à la couleur et à la texture, améliorant ainsi la précision de traitement des documents difficiles à lire, tels que le papier journal, les documents en couleur, les télécopies et les photocopies.


	Il s’agit du processus de conversion des images en noir et blanc, de suppression du bruit, de l’arrière-plan et des textures, ainsi que d’obtention d’un texte net. Ce processus garantit la meilleure qualité de Reconnaissance optique de caractères (OCR). Les paramètres requis sont déterminés séparément pour chaque fragment. Dans le cas de journaux fins, le texte imprimé au verso peut être visible sur les numérisations. La binarisation adaptative supprime ce texte. La technologie innovante de binarisation adaptative ajuste dynamiquement le seuil de luminosité pour chaque fragment d’image lors de la reconnaissance. En appliquant des paramètres de reconnaissance individuels, elle produit des résultats de reconnaissance précis pour les documents présentant un arrière-plan et des textures à contraste variable, en niveaux de gris ou en couleur.
	Il s’agit de la binarisation des images en niveaux de gris à l’aide de très petits points. Cette technique améliore l’apparence du document, qui semble ainsi présenter davantage de nuances.

Il s’agit du processus de conversion des images en noir et blanc, de suppression du bruit, de l’arrière-plan et des textures, ainsi que d’obtention d’un texte net. Ce processus garantit la meilleure qualité de Reconnaissance optique de caractères (OCR). Les paramètres requis sont déterminés séparément pour chaque fragment. Dans le cas de journaux fins, le texte imprimé au verso peut être visible sur les numérisations. La binarisation adaptative supprime ce texte.

La technologie innovante de binarisation adaptative ajuste dynamiquement le seuil de luminosité pour chaque fragment d’image lors de la reconnaissance. En appliquant des paramètres de reconnaissance individuels, elle produit des résultats de reconnaissance précis pour les documents présentant un arrière-plan et des textures à contraste variable, en niveaux de gris ou en couleur.

Il s’agit de la binarisation des images en niveaux de gris à l’aide de très petits points. Cette technique améliore l’apparence du document, qui semble ainsi présenter davantage de nuances.

Filtres pour les images binaires
Mise à l’échelle de l’image	Pour les documents numérisés à basse résolution (moins de 120 dpi) et les documents dont la police est de petite taille (moins de 10 pt), les images peuvent être agrandies numériquement afin d’obtenir une meilleure qualité de Reconnaissance optique de caractères (OCR).

Voir aussi

Fonctionnalités principales

​Pourquoi améliorer les images ?

​Prétraitement des images

​Voir aussi

Pourquoi améliorer les images ?

Prétraitement des images

Voir aussi