Passer au contenu principal
La pré-reconnaissance est la première étape du traitement d’un document semi-structuré. Contrairement aux documents à structure fixe, conçus pour être traités par ordinateur, les documents non structurés présentent des structures différentes et leurs champs de données se trouvent à différents endroits de la page. C’est pourquoi la pré-reconnaissance sert à détecter dans le document des objets susceptibles d’indiquer l’emplacement des champs de données. La pré-reconnaissance est la première étape de l’analyse de documents. Comme elle peut prendre un temps considérable, FlexiLayout Studio vous permet de l’exécuter une seule fois, indépendamment de la mise en correspondance de FlexiLayout, afin que vous puissiez vous concentrer entièrement sur la création et les tests de votre FlexiLayout. Toutefois, vous devez évaluer la qualité des résultats de la pré-reconnaissance avant de commencer à créer votre FlexiLayout. La qualité de la pré-reconnaissance dépend de celle des images de test du lot. La qualité des images de test dépend, à son tour, des paramètres de numérisation tels que la luminosité, le contraste et la résolution. Si vous n’êtes pas satisfait de la qualité des résultats de la pré-reconnaissance, vous devrez peut-être modifier les options de numérisation et numériser à nouveau vos documents de test. Notez également que FlexiLayout Studio vous permet d’ajouter des images numérisées à différentes résolutions, afin d’expérimenter avec la pré-reconnaissance et la mise en correspondance de FlexiLayout, puis de sélectionner les options de numérisation optimales. La pré-reconnaissance peut être exécutée en mode rapide ou en mode complet (voir Paramètres de pré-reconnaissance pour plus de détails). Lors du développement d’un FlexiLayout, la pré-reconnaissance n’a pas besoin d’être parfaite. Il existe toujours un moyen de trouver pratiquement n’importe quel champ de données, même si plusieurs erreurs de reconnaissance ont été commises. En effet, il arrive parfois que la vitesse de la pré-reconnaissance soit plus importante que la qualité : la qualité de la reconnaissance pourra être améliorée ultérieurement dans une application de capture de données, où vous pourrez spécifier des types de données pour chaque champ, ce qui améliorera considérablement la qualité de la reconnaissance. Pendant la pré-reconnaissance, le programme analyse l’emplacement de points de différentes couleurs, détecte les objets de base et fusionne les fragments de texte en mots et en lignes. Le programme détecte les types d’objet de base suivants :
  • Texte
  • Image
  • Signe de ponctuation
  • Texte inversé
  • Separator
  • Barcode
  • Coche
Une fois les objets de base détectés, le programme commence à reconnaître les objets texte. Le texte reconnu peut être consulté sous les deux types suivants :
  • Mots reconnus
  • Recognized Lines

Pour en savoir plus :

Paramètres de pré-reconnaissance Exécuter la pré-reconnaissance et consulter les résultats Analyser les images