Passer au contenu principal
Vous pouvez ajouter un champ texte de l’une des manières suivantes :
  • Définissez une zone de champ sur l’image du document en cliquant sur la valeur d’un champ (mise en surbrillance en vert au survol) ou en traçant un rectangle autour de la valeur du champ. Le nouveau champ apparaîtra alors dans le formulaire de données. Vous pouvez modifier le nom du champ en double-cliquant dessus dans le formulaire de données ou en cliquant dessus dans les propriétés du champ. Vous pouvez sélectionner le nom entier en triple-cliquant. Pour ouvrir les propriétés du champ, cliquez sur le bouton Field options.
  • Ajoutez un nouveau champ au formulaire de données en cliquant sur Add Field dans la barre d’outils, puis en traçant la zone du champ sur l’image. Les données détectées à l’intérieur de la zone sélectionnée seront alors définies comme valeur de ce champ dans le formulaire de données.
Vous pouvez également ajouter de nouvelles zones de champ texte à des champs existants dans le formulaire de données en sélectionnant le champ approprié dans le formulaire de données, puis en cliquant sur son emplacement sur l’image du document. Si un champ doit contenir plus d’un mot, sélectionnez plusieurs mots en délimitant l’ensemble de la zone du champ.

Ajout d’un champ de texte avec plusieurs régions

Certains champs de texte nécessitent plusieurs régions sur un même document pour les raisons suivantes :
  • Certaines valeurs de champ peuvent commencer sur une ligne de texte et se terminer sur une autre.
  • Certaines valeurs de champ peuvent commencer sur une page et se terminer sur une autre.
Pour ajouter un champ de texte avec plusieurs régions, procédez comme suit :
  • Ajoutez un champ en utilisant l’une des méthodes décrites ci-dessus.
  • Maintenez la touche Maj enfoncée et sélectionnez des régions supplémentaires pour le champ ajouté.
Les régions d’un champ de texte peuvent également être marquées :
  • Sur différentes pages
  • À l’intérieur d’une autre région d’un champ (dans ce cas, la région interne sera mise en évidence avec une couleur plus foncée et, si elle est au premier plan, elle sera mise en évidence en jaune).

Propriétés générales du champ de texte

  • Nom du champ. Le nom unique du champ dans une compétence donnée. Le nom du champ ne peut pas contenir de caractères spéciaux tels que des points, des virgules, des barres obliques, des deux-points, des astérisques, des points d’interrogation, des guillemets, les signes « inférieur à » et « supérieur à », ni des barres verticales. La longueur maximale autorisée pour un nom de champ est de 90 caractères.
  • Type de données. Le type de données contenu dans un champ. Il s’agit d’un paramètre crucial du champ de texte, car il influe sur la précision de la reconnaissance. Chaque type de données a son propre ensemble de contraintes pour la valeur du champ, ce qui réduit l’éventail de valeurs possibles pour un caractère et rend l’extraction des données plus précise.
Type de donnéesDescription
TextPeut contenir des lettres latines et cyrilliques, des chiffres, des idéogrammes et des caractères spéciaux.
DateLa date et l’heure dans n’importe quel format. Les caractères suivants peuvent être utilisés comme séparateurs : le point (.), l’espace ( ), le trait d’union (-), l’antislash () et la barre oblique (/).
NumberPeut contenir des chiffres, des séparateurs décimaux et le caractère de pourcentage (%). Les caractères suivants peuvent être utilisés comme séparateurs décimaux : le point (.), la virgule (,), le trait d’union (-), le signe égal (=) et l’espace ( ). Les caractères suivants peuvent être utilisés comme séparateurs de milliers : le point (.), la virgule (,), l’apostrophe (’), et l’espace ( ).
MoneyContient à la fois une valeur numérique et un symbole de devise. Le symbole de devise peut être placé avant ou après le montant.
Exemple : La lettre minuscule « l » (L), la lettre majuscule « I » (i) et le chiffre « 1 » peuvent avoir une apparence similaire. Si un caractère de ce type est détecté dans un champ Number ou Currency Amount, il sera reconnu comme « 1 », puisque les champs de ce type ne peuvent pas contenir de lettres.
  • Autoriser plusieurs éléments. Indique si le champ est répétable ou non. Les instances de champs répétables peuvent faire référence à plusieurs objets du même type. Par exemple, des noms d’enfants ou des numéros de compte.
  • Champ obligatoire. Indique que la valeur du champ ne peut pas être laissée vide. L’activation de cette propriété ajoute une règle de validation à la Page. Si le champ est vide après l’extraction, le document sera envoyé en relecture manuelle avec une erreur.
  • Champ clé. Indique si la valeur du champ est utilisée pour rechercher des documents.
  • Champ de dimension. Indique si la valeur du champ est utilisée pour obtenir des informations détaillées sur les transactions de la compétence dans Skill Monitor.

Apparence du texte

Ce groupe de propriétés concerne l’apparence des caractères attendus dans le champ.
  • Origine du texte. Indique si le champ peut contenir uniquement des caractères imprimés, uniquement des caractères manuscrits ou les deux. Si vous ajoutez un champ en marquant une zone rectangulaire sur le document, la valeur de cette propriété est définie en fonction des caractères trouvés dans cette zone. Si vous ajoutez un champ en cliquant sur Add Field, la valeur de cette propriété est définie par défaut sur Printed.
Vous trouverez la liste de toutes les langues pour lesquelles la reconnaissance de l’écriture manuscrite est prise en charge ici.
Remarque : La reconnaissance de l’écriture manuscrite est activée par défaut pour les nouvelles Compétences de document. Pour la désactiver ou la réactiver, cliquez sur l’icône des paramètres de la compétence à droite de son nom, puis allez à l’onglet Languages et sélectionnez l’option Handwritten dans la section Text Appearance.
  • Éliminer l’arrière-plan du champ. Cette option peut être utilisée pour améliorer la précision de la reconnaissance si le champ comporte un cadre, des cases pour des caractères individuels ou un texte indicatif. Si vous activez cette option, vous devez téléverser le formulaire vierge qui sera utilisé comme modèle pour la suppression de l’arrière-plan et annoter le champ correspondant sur le formulaire vierge. Le formulaire vierge apparaît dans l’ensemble de Documents et est marqué d’une icône.
  • Polices spéciales. Si le champ doit contenir du texte saisi dans une police spécifique, vous pouvez utiliser cette option pour sélectionner le type de police afin d’améliorer la précision de la reconnaissance. Plusieurs polices peuvent également être sélectionnées.

Polices prises en charge

PoliceDescriptionExemple de police
FaxUne police généralement utilisée par les télécopieurs.Fax Font
GothicTextes imprimés en caractères gothiques.Gothic Font
IndexUn jeu de caractères spécial qui ne comprend que des chiffres, au format de code postal.Index Font
Matrix printerTextes imprimés sur une imprimante matricielle.Matrix Font
MICR CMC-7Une police de code-barres MICR (CMC-7) spécifique.CMC-7 Font
MICR E-13BUn jeu de chiffres imprimés avec de l’encre magnétique. Les caractères MICR (Magnetic Ink Character Recognition) se trouvent sur divers documents, notamment les chèques.E-13B Font
OCR-AUne police à chasse fixe conçue pour la Reconnaissance optique de caractères (OCR). Largement utilisée par les banques, les émetteurs de cartes de paiement et des entreprises similaires.OCR-A Font
OCR-BUne police conçue pour la Reconnaissance optique de caractères (OCR).OCR-B Font
ReceiptLe moteur de reconnaissance attendra un texte de faible qualité, le plus souvent en police à chasse fixe ou standard, comme sur les tickets de caisse.Receipt Font
TypewriterTextes dactylographiés.Typewriter Font

Propriétés supplémentaires du champ texte

Les propriétés supplémentaires dépendent du type de données défini pour le champ.

Text

Le groupe de paramètres Value :
  • Longueur maximale. Nombre maximal de caractères autorisés dans le champ. Si le nombre de caractères de la valeur extraite dépasse cette longueur, un message d’erreur s’affiche. S’il y a une étape de relecture manuelle dans le processus, le document sera envoyé en relecture manuelle.
  • Expression régulière. Cette option permet d’ajouter une expression régulière (c.-à-d. une description formelle de la structure de la valeur du champ). Un champ configuré à l’aide d’une expression régulière peut contenir des lettres, des chiffres et d’autres caractères tels que définis dans le formulaire de données.
L’utilisation d’une expression régulière peut améliorer la précision de l’extraction, c’est‑à‑dire la recherche de motifs dans le texte, ce qui influera sur le résultat de l’extraction en restreignant l’ensemble de caractères valides. Par exemple, si un champ de texte ne contient que des chiffres, vous pouvez spécifier une expression régulière décrivant la structure du champ comme ne contenant que des chiffres. Dans ce cas, lors de la reconnaissance du champ, le programme tentera de reconnaître chaque caractère comme un chiffre. Vous pouvez également spécifier une expression régulière pour un format de numéro de téléphone spécifique (exemple 1), ou vérifier que le champ contient 2 mots dont l’un est un nombre, par exemple 50 lbs (exemple 2) : Exemple 1 (pour des numéros de téléphone du type 1-(234)-567-8900 ou 2 (987) 654 3211)
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Exemple 2 (pour des valeurs de poids 50lb/50lbs/50Lb/50Lbs/50 lb/50 lbs, etc.)
/^[\d]*(\s)?(L|l)b(s)?$/
Remarque : Les expressions régulières n’affectent pas la reconnaissance de texte d’un document PDF.

Date

Le groupe de paramètres La valeur peut inclure :
  • Heure. Sélectionnez cette option pour les champs Date susceptibles de contenir également l’heure. Si une valeur d’heure n’est pas autorisée, elle ne sera pas extraite lors de la reconnaissance.
  • Jour de la semaine. Cette option permet d’indiquer le jour de la semaine dans le champ Date. Si une valeur de jour de la semaine n’est pas autorisée, elle ne sera pas extraite lors de la reconnaissance.
  • Mois en toutes lettres. Cette option permet d’indiquer le mois sous forme de mot.
Le groupe de paramètres Ordre acceptable des composants vous permet de choisir un format de date parmi les options suivantes : Jour-Mois-Année, Mois-Jour-Année et Année-Mois-Jour. Vous pouvez également spécifier plusieurs formats à la fois. Si le format de date détecté ne correspond pas aux formats spécifiés, le document sera envoyé en relecture manuelle avec une erreur. Le groupe de paramètres Date acceptable vous permet de définir une plage de dates valides. Vous pouvez définir une plage en sélectionnant un nombre de mois avant et après le jour où le document a été traité. Le nombre de mois doit être un entier. Une règle vérifie si la date indiquée se situe dans la plage spécifiée. Dans le cas contraire, la règle affiche une erreur et le document est envoyé en relecture manuelle.

Nombre

Le groupe de paramètres Value vous permet d’indiquer le type de nombre de la valeur détectée (entier ou décimal), ainsi que les formats numériques autorisés pour ce champ. Si la valeur de ce champ ne répond pas aux exigences spécifiées, le document sera envoyé à la relecture manuelle.
  • Entiers uniquement indique que la valeur doit être un entier. Si un nombre avec un séparateur est détecté dans le champ alors que cette option est activée, celui-ci sera interprété comme un séparateur de milliers.
  • La partie fractionnaire peut contenir plus de deux chiffres. Activez cette option si la partie décimale de la valeur extraite doit comporter plus de deux chiffres. Les caractères suivants peuvent être utilisés comme séparateurs décimaux : point (.), virgule (,), trait d’union (-), signe égal (=) et espace ( ).
  • Peut avoir des valeurs négatives. Cette option autorise les valeurs négatives. Celles-ci peuvent être indiquées par un signe moins ou par des parenthèses.
  • Peut inclure le symbole « % ». Cette option permet à la valeur extraite d’inclure un pourcentage avant ou après la valeur.
Le groupe de paramètres Number must be within interval vous permet de définir un intervalle dans lequel la valeur doit se situer pour être valide. La plage de l’intervalle est définie en spécifiant une valeur minimale et une valeur maximale. Ces valeurs peuvent être des entiers ou des décimaux. Des valeurs négatives peuvent également être indiquées. Une règle vérifie ensuite si la valeur se trouve dans l’intervalle spécifié. Si ce n’est pas le cas, la règle affichera une erreur et le document sera envoyé à la relecture manuelle.

Money

Les propriétés de Money sont identiques à celles de Number, à la seule exception que le champ Money ne peut pas contenir le caractère de pourcentage.

Voir aussi