| Le résultat de ce scénario est une version modifiable d’un document. Dans ce scénario, les images de documents sont reconnues en conservant intégralement la mise en forme d’origine, et les données sont enregistrées dans un format de fichier modifiable. Vous obtenez ainsi des versions modifiables de vos documents, faciles à vérifier et à corriger. VoirConversion de documentspour plus de détails. |
| Dans ce scénario de traitement, les documents papier sont convertis en copies numériques non modifiables contenant toutes les informations du document dans un format consultable. Grâce à ce traitement, les copies numériques des documents peuvent être facilement retrouvées dans une archive électronique par recherche plein texte, des segments de texte peuvent être copiés, et les documents peuvent être envoyés par e-mail ou imprimés. VoirArchivage de documentspour plus de détails. |
| Ce scénario permet d’extraire toutes les données possibles d’un document et de les stocker de manière structurée. Le résultat est un fichier JSON représentant la structure du document. Il contient tous les objets du document : texte imprimé et manuscrit, tableaux, codes-barres, cases à cocher et images, avec leur emplacement et leurs attributs. Ce format est optimal pour un traitement ultérieur, le stockage des données dans une base de données ou l’intégration avec une autre application. VoirExtraction de donnéespour plus de détails. |
| Ce scénario permet d’extraire le corps de texte d’un document ainsi que les textes figurant sur les logos, les cachets et tout autre élément distinct du corps de texte. L’ordre naturel du texte, « tel qu’un être humain le lirait », est préservé. Vous pouvez ensuite soumettre les documents à des moteurs de traitement du langage naturel (NLP) de votre côté, par exemple pour en générer rapidement un résumé, y rechercher des informations sensibles ou effectuer une analyse de sentiment. VoirExtraction de textepour plus de détails. |
| Dans le cas de la reconnaissance au niveau des champs, de courts fragments de texte sont reconnus afin de capturer les données de certains champs. La qualité de la reconnaissance est primordiale dans ce scénario. Ce scénario peut également s’inscrire dans des scénarios plus complexes où des données significatives doivent être extraites de documents (par exemple, pour saisir des données de documents papier dans des systèmes d’information et des bases de données, ou pour classer et indexer automatiquement des documents dans des systèmes de gestion documentaire). Dans ce scénario, le système reconnaît soit plusieurs lignes de texte dans certains champs uniquement, soit l’intégralité du texte sur une petite image. Il calcule un indice de confiance pour chaque caractère reconnu. Ces indices peuvent ensuite être utilisés lors de la vérification des résultats de reconnaissance. Par ailleurs, le système peut stocker plusieurs variantes de reconnaissance pour les mots et les caractères du texte, qui peuvent alors être exploitées dans des algorithmes de vote pour améliorer la qualité de la reconnaissance. VoirReconnaissance au niveau des champspour plus de détails. |
| Dans ce scénario, ABBYY FineReader Engine est utilisé pour lire des codes-barres. Cette lecture peut s’avérer nécessaire, par exemple, à des fins de séparation automatique de documents, pour le traitement de documents par un système de gestion documentaire, ou pour l’indexation et la classification de documents. Ce scénario peut s’intégrer à d’autres scénarios. Par exemple, des documents numérisés avec des scanners de production haute vitesse peuvent être séparés au moyen de codes-barres, ou des documents préparés pour un archivage à long terme peuvent être versés dans des systèmes de gestion documentaire d’archivage en fonction des valeurs de leurs codes-barres. Lors de l’extraction de codes-barres à partir de textes, le système peut détecter tous les codes-barres ou uniquement ceux d’un certain type avec une certaine valeur. Il peut obtenir la valeur d’un code-barres et calculer sa somme de contrôle. Les valeurs de codes-barres reconnues peuvent être enregistrées dans les formats les plus adaptés à un traitement ultérieur, par exemple au format TXT. VoirReconnaissance de codes-barrespour plus de détails. |
| Les cartes de visite contiennent des informations professionnelles sur une entreprise ou une personne. Elles peuvent inclure le nom de la personne, l’entreprise, les numéros de téléphone, le fax, l’e-mail, les adresses de sites web et des informations similaires. Il peut être nécessaire de capturer ces informations à partir de cartes de visite papier et de les enregistrer au format électronique, que ce soit dans un carnet d’adresses électronique d’un téléphone mobile, un client de messagerie ou tout autre système de stockage de données. Par exemple, les cartes de visite sont souvent transmises par e-mail ou par réseau au format vCard. VoirReconnaissance de cartes de visitepour plus de détails. |
| Les documents de voyage officiels ou les documents d’identité de nombreux pays contiennent une zone de lecture automatique (MRZ) qui garantit un traitement plus précis des données du document. Ce scénario permet d’extraire des données depuis une zone de lecture automatique sur des documents d’identité lors des processus d’intégration ou de vérification des clients. Le système reconnaît la MRZ sur l’image du document et en extrait les données. Les données extraites contiennent plusieurs champs avec les informations personnelles relatives au document et à son titulaire (type de document et date d’expiration, prénom et nom du titulaire, etc.). Vous pouvez parcourir les champs, vérifier les données et les enregistrer dans un fichier externe pour un traitement ultérieur. SeeMachine-Readable Zone Capturepour plus de détails. |
| Windows uniquement. Dans ce scénario, ABBYY FineReader Engine est utilisé sur un “ordinateur de numérisation” qui numérise des images et les enregistre sous forme de fichiers. Ce scénario peut s’intégrer à d’autres scénarios lors de la phase préliminaire du traitement des documents, c’est-à-dire pour obtenir des versions électroniques de documents en vue d’un traitement ultérieur. Parmi les exemples d’utilisation figurent la numérisation de documents à des fins d’archivage, l’obtention de versions modifiables de documents et l’extraction de données pertinentes à partir de documents. Les documents papier sont numérisés et les images sont enregistrées dans un format électronique, ce qui produit des versions électroniques de haute qualité de vos documents imprimés. SeeScanningpour plus de détails. |
| La classification des documents consiste à affecter un document à l’une des catégories définies par l’utilisateur. Vous pouvez être amené à traiter un flux de documents composé de plusieurs types, par exemple des contrats, des factures ou des reçus. Vous devez identifier le type de chaque document. Par exemple, vous souhaitez trier les documents dans différents dossiers ou les renommer selon leur type. Cette opération peut être effectuée automatiquement à l’aide d’un système préentraîné. Ce scénario suppose que vous connaissez à l’avance les types de documents à traiter. ABBYY FineReader Engine peut classer les documents selon leur apparence ou selon leur contenu. SeeDocument Classificationpour plus de détails. |
| Lorsque vous travaillez avec des documents papier, vous devez identifier et corriger les erreurs ou les modifications apportées intentionnellement. Ce scénario permet de comparer des documents d’une importance particulière, tels que des contrats et des documents bancaires, avec leurs copies. Le résultat de la comparaison contient des informations sur les différences relatives au type de contenu (texte uniquement), au type de modification (suppression, insertion ou modification) et à leur emplacement dans l’original et la copie. Vous pouvez obtenir la liste des différences détectées ou la zone de toute modification et enregistrer le résultat de la comparaison dans un fichier externe pour un traitement ultérieur ou un stockage à long terme. SeeDocument Comparisonpour plus de détails. |











