Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Un champ Text extrait une valeur de type string d’un document — par exemple, un nom, une adresse, un identifiant ou un autre texte. Le type de données du champ (Text, Date, Number ou Money) détermine la façon dont Vantage reconnaît et valide la valeur.

Ajouter un champ Text

Vous pouvez ajouter un champ Text de deux manières.

Délimitez une zone sur l’image du document

Cliquez sur une valeur (mise en surbrillance en vert au survol) ou tracez un rectangle autour de la valeur. Le nouveau champ apparaît dans le formulaire de données.

Ajoutez un champ vide, puis délimitez sa région

Cliquez sur Ajouter un champ dans la barre d’outils, puis faites glisser un rectangle autour de la valeur sur l’image. Les données contenues dans cette région deviennent la valeur du champ.
Pour renommer un champ, double-cliquez sur son nom dans le formulaire de données, ou cliquez sur son nom dans les propriétés du champ. Cliquez trois fois pour sélectionner le nom complet. Pour ouvrir les propriétés du champ, cliquez sur Options du champ.

Ajouter plusieurs régions à un champ

Certaines valeurs s’étendent sur plusieurs lignes ou plusieurs pages. Un même champ peut donc nécessiter plusieurs régions. Pour ajouter plusieurs régions à un nouveau champ :
1

Ajouter le champ

Utilisez l’une des méthodes ci-dessus.
2

Sélectionner des régions supplémentaires

Maintenez Maj enfoncée, puis cliquez ou faites glisser pour sélectionner d’autres régions pour le même champ.
Pour ajouter des régions à un champ existant, sélectionnez le champ dans le formulaire de données, puis cliquez sur son emplacement dans l’image ou faites glisser pour le sélectionner. Si la valeur s’étend sur plusieurs mots, sélectionnez-les tous comme une seule région. Les régions peuvent s’étendre sur plusieurs pages ou se trouver à l’intérieur d’une autre région. Une région imbriquée est mise en évidence dans une couleur plus foncée ; lorsqu’elle a le focus, elle est mise en évidence en jaune.

Propriétés générales

PropriétéDescription
Nom du champUnique dans la compétence. Ne peut pas contenir : . , / : * ? " < > |. Longueur maximale : 90 caractères.
Type de donnéesLe type de données contenu dans le champ. Affecte la précision de la reconnaissance. Voir Types de données pour connaître les options.
Autoriser plusieurs élémentsIndique si le champ se répète (par exemple, plusieurs noms d’enfants ou numéros de compte).
Champ obligatoireSi cette option est activée et que le champ est vide après l’extraction, le document est envoyé en relecture manuelle avec une erreur.
Champ cléIndique que la valeur peut être utilisée pour rechercher des documents.
Champ de dimensionExpose la valeur comme dimension de rapport dans Skill Monitor. Remarque : la valeur est tronquée à 100 caractères dans la base de données de reporting (mais reste telle quelle dans le document).

Types de données

Type de donnéesDescription
TextPeut contenir des lettres latines et cyrilliques, des chiffres, des idéogrammes et des caractères spéciaux.
DateUne date et une heure dans n’importe quel format. Séparateurs acceptés : point (.), espace, trait d’union (-), antislash (\) et barre oblique (/).
NumberPeut contenir des chiffres, des séparateurs décimaux et le caractère de pourcentage (%). Séparateurs décimaux acceptés : point (.), virgule (,), trait d’union (-), signe égal (=), espace. Séparateurs de milliers acceptés : point (.), virgule (,), apostrophe ('), espace.
MoneyUne valeur numérique avec un symbole de devise. Le symbole peut apparaître avant ou après le montant.
La lettre minuscule « l » (L), la lettre majuscule « I » (i) et le chiffre « 1 » peuvent avoir une apparence similaire. Dans les champs Number ou Money, un caractère ambigu est reconnu comme « 1 », car les lettres ne sont pas autorisées.

Paramètres d’apparence

Ces propriétés décrivent l’apparence des caractères attendus dans le champ.
  • Origine du texte — Indique si le champ contient uniquement des caractères imprimés, uniquement des caractères manuscrits ou les deux. Si vous ajoutez le champ en traçant un rectangle, Vantage déduit cette valeur des caractères qu’il détecte. Si vous ajoutez le champ avec Ajouter un champ, la valeur par défaut est Imprimé. Consultez les langues prises en charge pour la reconnaissance de l’écriture manuscrite.
  • Éliminer l’arrière-plan du champ — Améliore la reconnaissance lorsque le champ comporte un cadre, des cases pour chaque caractère ou un texte indicatif. Si vous activez cette option, téléversez le formulaire vierge servant de modèle d’arrière-plan et étiquetez le champ correspondant sur ce formulaire. Le formulaire vierge apparaît dans le Document Set, signalé par une icône.
  • Polices spéciales — Améliore la précision de la reconnaissance lorsque le champ utilise une police particulière. Vous pouvez sélectionner plusieurs polices.
La reconnaissance de l’écriture manuscrite est activée par défaut pour les nouvelles Compétences de document. Pour l’activer ou la désactiver, cliquez sur l’icône des paramètres de la compétence à droite du nom de la compétence, ouvrez l’onglet Langues, puis cochez ou décochez Manuscrit (écriture manuscrite) dans la section Apparence du texte.

Polices prises en charge

FontDescriptionFont sample
FaxUne police généralement utilisée par les télécopieurs.Exemple de police Fax
GothiqueTextes imprimés en caractères gothiques.Exemple de police gothique
IndexUn jeu spécial de caractères comprenant uniquement des chiffres écrits dans le style des codes postaux.Exemple de police Index
Imprimante matricielleTextes imprimés sur une imprimante matricielle.Exemple de police d’imprimante matricielle
MICR CMC-7Une police Barcode MICR spéciale (CMC-7).Exemple de police MICR CMC-7
MICR E-13BCaractères numériques imprimés à l’encre magnétique. Les caractères MICR (reconnaissance de caractères à l’encre magnétique) figurent sur divers documents, notamment les chèques personnels.Exemple de police MICR E-13B
OCR-AUne police à chasse fixe conçue pour la Reconnaissance optique de caractères (OCR). Largement utilisée par les banques, les sociétés de cartes de crédit et les entreprises similaires.Exemple de police OCR-A
OCR-BUne police conçue pour la reconnaissance optique de caractères.Exemple de police OCR-B
ReçuPour les textes de faible qualité, généralement en police à chasse fixe ou en police standard utilisées sur les reçus.Exemple de police de reçu
Machine à écrireTextes dactylographiés.Exemple de police de machine à écrire

Propriétés par type de données

Les propriétés supplémentaires dépendent du type de données.

Text

Paramètres de Value :
  • Longueur maximale — Nombre maximal de caractères autorisés. Si la valeur extraite dépasse cette longueur, Vantage affiche une erreur. Si le processus comprend une étape de relecture manuelle, le document passe en relecture manuelle.
  • Expression régulière — Modèle qui restreint l’ensemble des caractères valides pour le champ, ce qui peut améliorer la précision de l’extraction. Par exemple, vous pouvez forcer la reconnaissance de chaque caractère en tant que chiffre, imposer un format spécifique de numéro de téléphone ou vérifier qu’un champ contient un poids numérique avec une unité.
Exemple 1 — Numéros de téléphone comme 1-(234)-567-8900 ou 2 (987) 654 3211 :
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Exemple 2 — Des valeurs de poids telles que 50lb, 50lbs, 50Lb, 50Lbs, 50 lb ou 50 lbs :
/^[\d]*(\s)?(L|l)b(s)?$/
Les expressions régulières n’affectent pas la reconnaissance du texte dans les documents PDF.

Date

La valeur peut inclure les paramètres suivants :
  • Heure — Autorise une valeur d’heure. Si cette option est désactivée, l’heure n’est pas extraite.
  • Jour de la semaine — Autorise un jour de la semaine dans le champ. Si cette option est désactivée, le jour de la semaine n’est pas extrait.
  • Mois en toutes lettres — Autorise le mois à être écrit en toutes lettres.

Ordre acceptable des composants

Sélectionnez un ou plusieurs formats de date : Jour-Mois-Année, Mois-Jour-Année ou Année-Mois-Jour. Si le format détecté ne correspond à aucun des formats sélectionnés, le document passe en relecture manuelle.

Date acceptable

Spécifiez une plage de dates valide sous la forme d’un nombre de mois avant et après la date à laquelle le document a été traité. Utilisez des nombres entiers. Une règle vérifie si la date extraite se situe dans cette plage ; les dates hors plage passent en relecture manuelle.

Nombre

Les paramètres de Value indiquent le type de nombre de la valeur détectée (entier ou décimal) ainsi que les formats numériques acceptés dans le champ. Les valeurs qui ne respectent pas ces exigences envoient le document en relecture manuelle.
  • Entiers uniquement — La valeur doit être un entier. Tous les séparateurs du nombre détecté sont traités comme des séparateurs de milliers.
  • La partie fractionnaire peut contenir plus de deux chiffres — Activez cette option si la partie décimale doit contenir plus de deux chiffres. Séparateurs décimaux acceptés : point (.), virgule (,), tiret (-), signe égal (=), espace.
  • Peut avoir des valeurs négatives — Autorise les valeurs négatives, indiquées par un signe moins ou des parenthèses.
  • Peut inclure le symbole ’%’ — Autorise le symbole de pourcentage avant ou après la valeur.

Le nombre doit être compris dans un intervalle

Définissez une valeur minimale et une valeur maximale (entières ou décimales, positives ou négatives). Une règle vérifie si la valeur se situe dans cette plage ; les valeurs hors plage envoient le document en relecture manuelle.
Les champs Money utilisent les mêmes propriétés que Number, sauf que le symbole de pourcentage n’est pas autorisé.

Annotation des documents

Consignes pour l’annotation des documents structurés et semi-structurés lors de l’entraînement.

Langues de reconnaissance prises en charge

Liste complète des langues de Reconnaissance optique de caractères (OCR) prises en charge par les compétences Vantage.