Passer au contenu principal
Les FlexiLayouts et les classificateurs disposent de divers paramètres définis par l’utilisateur, notamment des paramètres de préreconnaissance tels que les langues de reconnaissance, le type de texte, les modes de préreconnaissance et les zones. Le choix des paramètres de préreconnaissance appropriés vous aidera à créer des FlexiLayouts et des classificateurs bien adaptés au traitement de vos documents. Vous pouvez modifier les paramètres de préreconnaissance dans la boîte de dialogue Propriétés de préreconnaissance. Pour ouvrir cette boîte de dialogue :
  • Cliquez sur Propriétés… dans le menu FlexiLayout ou Classifier, ou dans le menu contextuel du FlexiLayout ou du Classifier.
  • Cliquez sur le bouton Propriétés avancées de préreconnaissance… dans l’onglet Général de la boîte de dialogue Propriétés de %Name%.
La boîte de dialogue Propriétés de préreconnaissance s’ouvre. Les options disponibles dans cette boîte de dialogue sont répertoriées ci-dessous.

Onglet Général

Name

Le mode d’impression utilisé pour le texte sur les documents :

  • Typographique,
  • Imprimante matricielle,
  • Machine à écrire.

Déterminez le type de texte et évaluez sa qualité avant de sélectionner ces options.

  • Mode rapide. Les images en couleur et en demi-teintes sont binarisées avant la reconnaissance (converties en noir et blanc). La reconnaissance rapide prend moins de temps et fournit des résultats généralement satisfaisants.
  • Mode équilibré. Le programme prend également en compte les couleurs de l’image ; la reconnaissance est plus lente, mais de meilleure qualité.
    Remarque. Aucune autre modification n’est prévue pour les algorithmes sous-jacents au mode de reconnaissance équilibré, car les meilleurs niveaux possibles de vitesse et de qualité ont été atteints
  • Le mode normal est celui utilisé par défaut. Il est également recommandé lorsque la pré-reconnaissance en mode rapide / équilibré entraîne de nombreuses erreurs.
  • Le mode précis est destiné à l’extraction de données à partir d’images numériques à peine lisibles ou de documents de mauvaise qualité
    Remarque. Le mode précis est le plus long ; il est donc recommandé de l’utiliser uniquement sur des images/documents problématiques.

Langues du texte

Les langues utilisées dans les documents. Vous pouvez sélectionner une ou plusieurs langues dans la liste déroulante. Pour obtenir la liste complète des langues disponibles, consultez Langues OCR prises en charge par ABBYY FlexiLayout™ Studio.

Ce groupe d’options vous permet d’ajouter des dictionnaires utilisateur. Les dictionnaires utilisateur servent à améliorer la qualité de la reconnaissance en complétant les dictionnaires intégrés par du vocabulaire spécialisé, des abréviations, des noms d’entreprise, etc.

Ce groupe contient deux options de traitement des codes-barres :

  • Désactiver l’extraction des codes-barres – Sélectionnez cette option si aucun code-barres ne doit être détecté dans vos images. Cela accélérera considérablement la reconnaissance des documents.
  • Extraire les codes-barres 2D : Data Matrix, Aztec, QR Code – Sélectionnez cette option si les images à traiter contiennent des codes-barres Data Matrix, Aztec et QR Code. Si cette option n’est pas activée, ces codes-barres ne seront pas détectés par le programme dans les images et ne seront pas disponibles dans les propriétés de l’élément Barcode.
  • Extraire les codes-barres postaux - Sélectionnez cette option si vos images contiennent des codes-barres postaux, par ex. Australia Post. Si cette option n’est pas sélectionnée, les codes-barres postaux ne seront pas détectés dans les images et ne seront pas disponibles dans les propriétés de l’élément Barcode.
    Important ! L’extraction des codes-barres postaux ralentit la reconnaissance.

CJK

Contient des options pour le traitement des langues CJK (chinois, japonais et coréen).

  • Mode furigana séparé – Sélectionnez cette option pour améliorer la qualité de reconnaissance lors du traitement de texte japonais comportant des furigana (indications de prononciation).

Extraire les entités nommées – Sélectionnez cette option pour extraire des informations utiles d’un champ ou d’un groupe de champs à l’aide de méthodes NLP.

Remarque. Cette option est disponible uniquement pour les licences qui incluent un module NLP.

Extraction de texte vertical

Paramètres d’extraction du texte vertical :

  • Extraire pour toutes les langues – Détecte le texte vertical dans toutes les langues prises en charge.
  • Ne pas extraire – Empêche la détection du texte vertical.
  • Extraire pour les langues CJK – Détecte le texte vertical en chinois, en japonais ou en coréen.

Zone à soumettre à la pré-reconnaissance. Vous pouvez spécifier la position de la zone de pré-reconnaissance par rapport aux bords de la page.

Cette option permet d’ajouter un motif utilisateur au format PTN ou FBT. Nous vous recommandons d’utiliser ces motifs utilisateur si vos documents contiennent des polices ou des caractères non standard.