Pré-reconnaissance

La pré-reconnaissance est la première étape du traitement d’un document semi-structuré. Contrairement aux documents à structure fixe, conçus pour être traités par ordinateur, les documents non structurés présentent une structure variable, et leurs champs de données peuvent se trouver à différents endroits de la page. C’est pourquoi la pré-reconnaissance sert à détecter dans le document des objets susceptibles d’indiquer l’emplacement des champs de données. Comme elle peut prendre un temps considérable, FlexiLayout Studio vous permet de l’exécuter une seule fois, indépendamment de la mise en correspondance de FlexiLayout, afin que vous puissiez vous concentrer entièrement sur la création et les tests de votre FlexiLayout.

Évaluer la qualité des résultats de la pré-reconnaissance

Évaluez la qualité des résultats de la pré-reconnaissance avant de commencer à créer votre FlexiLayout. La qualité de la pré-reconnaissance dépend de celle des images de test du lot. La qualité des images de test dépend, à son tour, des paramètres de numérisation tels que la luminosité, le contraste et la résolution. Si vous n’êtes pas satisfait de la qualité des résultats de la pré-reconnaissance, vous devrez peut-être modifier les options de numérisation et numériser à nouveau vos documents de test. Notez également que FlexiLayout Studio vous permet d’ajouter des images numérisées à différentes résolutions, afin d’expérimenter avec la pré-reconnaissance et la mise en correspondance de FlexiLayout, puis de sélectionner les options de numérisation optimales.

Modes de pré-reconnaissance

La pré-reconnaissance peut être exécutée en mode rapide ou en mode complet. Pour plus d’informations, voir Paramètres de pré-reconnaissance. Lors du développement d’un FlexiLayout, la pré-reconnaissance n’a pas besoin d’être parfaite. Il existe toujours un moyen de trouver pratiquement n’importe quel champ de données, même si plusieurs erreurs de reconnaissance ont été commises. En effet, il arrive parfois que la vitesse de la pré-reconnaissance soit plus importante que la qualité. La qualité de la reconnaissance pourra être améliorée ultérieurement dans une application de capture de données, où vous pourrez spécifier des types de données pour chaque champ, ce qui améliorera considérablement la qualité de la reconnaissance.

Objets de base détectés pendant la pré-reconnaissance

Pendant la pré-reconnaissance, FlexiLayout Studio analyse l’emplacement de points de différentes couleurs, détecte les objets de base et fusionne les fragments de texte en mots et en lignes. Les types d’objet de base suivants sont détectés :

Texte
Image
Signe de ponctuation
Texte inversé
Separator
Barcode
Coche

Une fois les objets de base détectés, les objets texte sont reconnus. Le texte reconnu peut être consulté sous les deux types suivants :

Mots reconnus
Recognized Lines

Prise en charge des documents multipage dans ABBYY FlexiLayout Studio

Paramètres de préreconnaissance

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Évaluer la qualité des résultats de la pré-reconnaissance

Modes de pré-reconnaissance

Objets de base détectés pendant la pré-reconnaissance

​Évaluer la qualité des résultats de la pré-reconnaissance

​Modes de pré-reconnaissance

​Objets de base détectés pendant la pré-reconnaissance

​Rubriques connexes

Évaluer la qualité des résultats de la pré-reconnaissance

Modes de pré-reconnaissance

Objets de base détectés pendant la pré-reconnaissance

Rubriques connexes