Paramètres de préreconnaissance

Les FlexiLayouts et les classificateurs disposent de divers paramètres définis par l’utilisateur, notamment des paramètres de préreconnaissance tels que les langues de reconnaissance, le type de texte, les modes de préreconnaissance et les zones. Le choix des paramètres de préreconnaissance appropriés vous aidera à créer des FlexiLayouts et des classificateurs bien adaptés au traitement de vos documents. Vous pouvez modifier les paramètres de préreconnaissance dans la boîte de dialogue Propriétés de préreconnaissance. Pour ouvrir cette boîte de dialogue, utilisez l’une des méthodes suivantes :

Cliquez sur Propriétés… dans le menu FlexiLayout ou Classifier, ou dans le menu contextuel du FlexiLayout ou du classifier.
Cliquez sur le bouton Propriétés avancées de préreconnaissance… dans l’onglet Général de la boîte de dialogue des propriétés du FlexiLayout ou du classifier.

Les options suivantes sont disponibles dans la boîte de dialogue Propriétés de préreconnaissance.

onglet Général

Name – Méthode utilisée pour imprimer le texte sur les documents. Déterminez le type de texte et évaluez sa qualité, puis sélectionnez l’une des options suivantes :

Typographique
Imprimante matricielle
Machine à écrire

Mode de préreconnaissance – Mode utilisé pour pré-reconnaître les documents.

Mode	Description
Fast	Les images en couleur et en demi-teintes sont binarisées avant la reconnaissance (converties en noir et blanc). La reconnaissance Fast prend moins de temps et fournit des résultats globalement satisfaisants.
Balanced	Les couleurs de l’image sont également prises en compte. La reconnaissance est donc plus lente, mais de meilleure qualité. Aucune autre modification n’est prévue pour les algorithmes du mode Balanced, car le meilleur compromis possible entre vitesse et qualité a déjà été atteint.
Normal	Le mode par défaut. Il est également recommandé lorsque la pré-reconnaissance en mode Fast ou Balanced produit de nombreuses erreurs.
Accurate	Destiné à l’extraction de données à partir d’images numériques à peine lisibles ou de documents de mauvaise qualité. Ce mode est le plus long ; utilisez-le donc uniquement pour les images ou documents problématiques.

Onglet Langues

Langues du texte – Les langues utilisées dans les documents. Vous pouvez sélectionner une ou plusieurs langues dans la liste déroulante. Pour obtenir la liste complète des langues disponibles, consultez Langues OCR prises en charge par ABBYY FlexiLayout™ Studio. Dictionnaires utilisateur – Ce groupe d’options vous permet d’ajouter des dictionnaires utilisateur. Les dictionnaires utilisateur améliorent la qualité de la reconnaissance en complétant les dictionnaires intégrés par du vocabulaire spécialisé, des abréviations, des noms d’entreprise, etc.

Onglet Avancé

Codes-barres

Option	Description
Désactiver l’extraction des codes-barres	Sélectionnez cette option si les codes-barres ne doivent pas être recherchés dans vos images. Cela accélère considérablement la reconnaissance des documents.
Extraire les codes-barres 2D : Data Matrix, Aztec, QR Code	Sélectionnez cette option si les images que vous traitez contiennent des codes-barres Data Matrix, Aztec et QR Code. Si cette option n’est pas activée, ces codes-barres ne sont pas détectés dans les images et ne sont pas disponibles dans les propriétés de l’élément Barcode.
Extraire les codes-barres postaux	Sélectionnez cette option si vos images contiennent des codes-barres postaux, par exemple ceux d’Australia Post. Si cette option n’est pas sélectionnée, les codes-barres postaux ne sont pas détectés dans les images et ne sont pas disponibles dans les propriétés de l’élément Barcode. L’extraction des codes-barres postaux ralentit la reconnaissance.

CJK

Contient des options de traitement pour les langues CJK (chinois, japonais et coréen). Mode furigana séparé – Sélectionnez cette option pour améliorer la qualité de la reconnaissance lors du traitement de texte japonais avec furigana (aides à la prononciation).

Reconnaissance NER

Extraire les entités nommées – Sélectionnez cette option pour extraire des informations pertinentes d’un champ ou d’un groupe de champs à l’aide de méthodes NLP.

Cette option n’est disponible que pour les licences qui incluent un module NLP.

Extraction de texte vertical

Option	Description
Extraire pour toutes les langues	Détecte le texte orienté verticalement rédigé dans n’importe quelle langue prise en charge.
Ne pas extraire	Empêche la détection du texte orienté verticalement.
Extraire pour les langues CJK	Détecte le texte vertical rédigé en chinois, en japonais ou en coréen.

Zone de préreconnaissance

Zone à pré-reconnaître. Vous pouvez spécifier la position de la zone de préreconnaissance par rapport aux bords de la page.

Motif utilisateur

Ajoute un motif utilisateur au format PTN ou FBT. Utilisez un motif utilisateur si vos documents contiennent des polices et des caractères non standard.

Pré-reconnaissance

Exécuter la préreconnaissance et afficher les résultats

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Paramètres de préreconnaissance

onglet Général

Onglet Langues

Onglet Avancé

Codes-barres

CJK

Reconnaissance NER

Extraction de texte vertical

Zone de préreconnaissance

Motif utilisateur

​onglet Général

​Onglet Langues

​Onglet Avancé

​Codes-barres

​CJK

​Reconnaissance NER

​Extraction de texte vertical

​Zone de préreconnaissance

​Motif utilisateur

onglet Général

Onglet Langues

Onglet Avancé

Codes-barres

CJK

Reconnaissance NER

Extraction de texte vertical

Zone de préreconnaissance

Motif utilisateur