Propriétés de définition de document

Les propriétés de base de la définition de document, telles que son nom, sa langue et son style d’écriture, sont configurées à l’aide du Document Definition Wizard. Les autres propriétés sont définies par défaut. Vous pouvez afficher et modifier les propriétés d’une définition de document dans la boîte de dialogue des propriétés qui s’ouvre lorsque vous sélectionnez l’élément de menu Document Definition → Document Definition Properties… dans la fenêtre de l’éditeur définition de document. La boîte de dialogue comporte les onglets suivants :

General

Dans cet onglet, vous pouvez renommer la définition de document et saisir ou modifier sa description. L’option Enabled inclut ou exclut la définition de document du traitement des documents.

Recognition

Le programme utilise une reconnaissance rapide appelée reconnaissance de tout le texte pour la classification, la mise en correspondance d’un FlexiLayout et la mise en surbrillance du texte sur les images. Cet onglet permet de définir les paramètres de la reconnaissance de tout le texte. Veuillez noter que les paramètres de reconnaissance des champs sont définis dans les propriétés du champ.

Prefer settings from batch type**.** Sélectionnez cette option si vous souhaitez synchroniser les paramètres de reconnaissance de tout le texte. Remarque : La désactivation de la synchronisation peut ralentir la mise en correspondance de la définition de document.
Languages**.** Il est nécessaire de définir la langue correcte pour que la reconnaissance s’effectue sans erreur. Cette propriété définit à la fois la langue elle-même et d’autres paramètres tels que le format de date, la devise, etc.
Sélectionnez un mode de reconnaissance dans la liste :
- Fast mode. Les images en couleur et en demi-teintes sont binarisées avant la reconnaissance (c’est-à-dire converties en noir et blanc). La reconnaissance rapide prend moins de temps et fournit généralement des résultats satisfaisants.
- Balanced mode. Le programme prend également en compte les couleurs de l’image. La reconnaissance dans ce mode est plus lente, mais offre une meilleure qualité. Remarque : Aucune autre modification n’est prévue pour les algorithmes du mode de reconnaissance Balanced, car les meilleurs niveaux possibles de vitesse et de qualité ont déjà été atteints.
- Normal mode est le mode par défaut. Il est également recommandé lorsque la pré-reconnaissance en mode Fast / Balanced entraîne de nombreuses erreurs.
- Accurate mode est destiné à l’extraction de données à partir d’images numériques à peine lisibles ou de documents de mauvaise qualité. Remarque : Accurate mode est le plus lent et n’est donc recommandé que pour les images/documents problématiques.
Advanced recognition settings…
- Vous pouvez sélectionner une ou plusieurs options dans Correct page orientation, if page group for a page to rotate 180°, 90° clockwise or 90° counter-clockwise when its orientation is selected automatically.
- Si nécessaire, indiquez le mode d’impression d’un formulaire vierge (Typographic, Matrix printer, Typewriter) dans la section Text type et sélectionnez l’option Use pattern pour ajouter un exemple de motif.
- Barcodes**.** Paramètres du traitement des Barcode :
  - Disable barcode extraction. Sélectionnez cette option si les code-barres ne doivent pas être détectés sur les images. Cela accélérera considérablement la reconnaissance des documents.
  - Extract 2D barcodes: Data Matrix, Aztec, QR Code**.** Sélectionnez cette option si vos images contiennent des code-barres des types indiqués. Si l’option n’est pas sélectionnée, les code-barres Data Matrix, Aztec et QR Code ne seront pas détectés sur les images.
Extract post barcodes. Sélectionnez cette option si vos images contiennent des code-barres postaux. Si cette option n’est pas sélectionnée, les code-barres postaux ne seront pas détectés sur les images. Important ! L’extraction des code-barres ralentit la reconnaissance.
CJK pre-recognition
- Separated furigana mode**.** Sélectionnez cette option pour améliorer la reconnaissance des indications phonétiques (furigana) en japonais.
Reconnaissance des entités nommées : extraction des entités nommées à l’aide de méthodes NLP. Remarque : Nécessite un module NLP et un type de licence spécifique.
Extraction de texte vertical – Paramètres d’extraction du texte vertical :
- Extract for all languages – Détecte le texte orienté verticalement dans n’importe laquelle des langues prises en charge.
- Do not extract – Empêche la détection du texte orienté verticalement.
- Extract for CJK languages – Détecte le texte vertical en chinois, japonais ou coréen.
Cliquez sur le bouton Advanced… pour configurer la correction des distorsions linéaires et non linéaires des images, spécifier le sens du chargeur automatique du scanner, etc. Remarque : Sélectionnez l’option Correct linear distortion pour spécifier les paramètres d’étirement/compression de l’image en hauteur et en largeur. Les images sont mises à l’échelle à l’aide des ancres existantes (carré noir, croix ou coin) ainsi que des Separator horizontaux et verticaux.
Montant – Combinaison d’un montant numérique et d’un code ou symbole de devise. Afin d’éviter toute erreur de reconnaissance pour des caractères visuellement similaires comme 1, I et i, ou s et $, une expression régulière est utilisée, n’autorisant les lettres que dans certaines combinaisons représentant des codes de devise, placés soit avant, soit immédiatement après le montant numérique. Les principaux codes de devise sont répertoriés dans Currencies.

Vous pouvez modifier la liste des codes et symboles de devise possibles si nécessaire. Par exemple, si vous savez quels codes et symboles de devise peuvent figurer dans vos documents, la suppression des devises superflues de la liste améliorera la qualité de la reconnaissance. Vous pouvez également ajouter des codes et symboles de devise personnalisés à la liste. Pour modifier la liste, cliquez sur le bouton […] à droite. Dans la boîte de dialogue Currency Symbols, vous pouvez ajouter ou supprimer des codes ou symboles de devise. Vous pouvez aussi ouvrir la boîte de dialogue des propriétés du champ, cliquer sur l’onglet Data et effectuer les modifications nécessaires. Pour plus d’informations, voir Data types of the text entry field. Remarque : Une définition de document ne peut avoir qu’une seule liste de codes et symboles de devise possibles. Cette liste s’applique à tous les champs Amount of Money.

The Assembly

Cet onglet est destiné à configurer les règles d’assemblage des documents multipages. Dans le scénario le plus simple, la définition de document comprend une seule section qui apparaît une seule fois. Si une définition de document se compose de plusieurs sections, cet onglet affiche la liste de leurs noms. Vous pouvez spécifier le nombre d’occurrences de chaque section en modifiant les nombres dans les colonnes Min number et Max number.

Use key fields equality assembling rule - activez cette option si vous souhaitez vérifier l’assemblage du document sur la base de l’égalité des champs principaux. Sélectionnez ensuite un champ principal pour chaque section dans la colonne Key Field. Lors de l’entrée des documents, seuls les documents dont les valeurs des champs principaux correspondent dans chaque section seront considérés comme correctement assemblés. Si leurs valeurs ne correspondent pas, un message d’erreur d’assemblage s’affichera.
Use standard assembly rules - activez cette option si vous souhaitez vérifier l’assemblage du document à l’aide des règles standard suivantes :
- Disable sections order check - activez cette option si vous souhaitez désactiver la vérification de l’ordre des sections dans le document (par exemple, si l’ordre des sections n’a pas d’incidence sur l’assemblage du document). Le programme vérifiera toujours que toutes les sections sont présentes dans le document, mais leur ordre sera ignoré.
- Enable annex pages - activez cette option si vous souhaitez traiter des documents avec annexes. Si le traitement des documents avec annexes est activé, vous pouvez également sélectionner l’option Detect annexes using preset document structure, without analyzing (fast) pour permettre une détection plus rapide des annexes sur la base de la structure actuelle du document.

Remarque : l’option Detect annexes using preset document structure, without analyzing (fast) n’est efficace que pour les documents créés par séparation lors de l’étape d’importation ou par l’application d’un indicateur spécial dans l’API. Ces documents sont exclus de l’assemblage.

Use custom assembly rules - activez cette option si vous souhaitez vérifier l’assemblage du document à l’aide d’un script d’assemblage de documents. Un script d’assemblage personnalisé peut être exécuté séparément ou conjointement avec les règles d’assemblage standard. Pour commencer à modifier le script, cliquez sur le bouton Edit Assembly Script… La fenêtre Script Editor s’ouvrira.

Pour plus de détails, consultez Création de définitions de document pour les documents multipages, Assemblage des pages en documents et Création de définitions de document pour les documents avec annexes.

Les règles

Cet onglet sert à gérer les règles de la définition de document. Vous pouvez supprimer, modifier ou créer de nouvelles règles. Pour plus de détails, consultez Validation des règles.

Les destinations d’exportation

Cet onglet affiche les paramètres d’exportation actuels de la définition de document. Pour modifier les paramètres d’exportation, cliquez sur le bouton Edit…

Le formulaire de données

Dans cet onglet, vous pouvez modifier le contour et la taille de la police utilisée pour afficher les données reconnues.

Le groupe Data Text Settings contient les paramètres de police pour l’affichage des valeurs reconnues.
Le groupe Label Text Settings contient les paramètres d’affichage du texte explicatif (noms des champs).

Pour plus de détails, consultez Configuration de la présentation des données dans la fenêtre du document.

Les Jeux de données

Dans cet onglet, vous pouvez créer et modifier des jeux de données personnalisés. Pour plus de détails, consultez Utilisation des bases de données des fournisseurs et des unités commerciales.

Les gestionnaires d’événements

Dans cet onglet, vous pouvez spécifier des gestionnaires d’événements pour les documents du type actuel. Pour plus de détails, consultez Gestionnaires d’événements.

Les références .NET

Dans cet onglet, vous pouvez ajouter des assembly externes à utiliser dans les scripts et les modules globaux. Les assembly standard et les assembly utilisateur compilées peuvent toutes deux être utilisées. Pour ajouter une assembly, cliquez sur Add… Dans la boîte de dialogue qui s’ouvre, sélectionnez le type : Standard assembly name ou Attached file. Selon le type sélectionné, saisissez le nom de l’assembly standard ou recherchez un fichier d’assembly. Pour plus de détails, consultez assembly externes.