Un champ Text extrait une valeur de type string d’un document — par exemple, un nom, une adresse, un identifiant ou un autre texte. Le type de données du champ (Text, Date, Number ou Money) détermine la façon dont Vantage reconnaît et valide la valeur.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Ajouter un champ Text
Délimitez une zone sur l’image du document
Ajoutez un champ vide, puis délimitez sa région
Ajouter plusieurs régions à un champ
Pour ajouter des régions à un champ existant, sélectionnez le champ dans le formulaire de données, puis cliquez sur son emplacement dans l’image ou faites glisser pour le sélectionner. Si la valeur s’étend sur plusieurs mots, sélectionnez-les tous comme une seule région.
Les régions peuvent s’étendre sur plusieurs pages ou se trouver à l’intérieur d’une autre région. Une région imbriquée est mise en évidence dans une couleur plus foncée ; lorsqu’elle a le focus, elle est mise en évidence en jaune.
Propriétés générales
| Propriété | Description |
|---|---|
| Nom du champ | Unique dans la compétence. Ne peut pas contenir : . , / : * ? " < > |. Longueur maximale : 90 caractères. |
| Type de données | Le type de données contenu dans le champ. Affecte la précision de la reconnaissance. Voir Types de données pour connaître les options. |
| Autoriser plusieurs éléments | Indique si le champ se répète (par exemple, plusieurs noms d’enfants ou numéros de compte). |
| Champ obligatoire | Si cette option est activée et que le champ est vide après l’extraction, le document est envoyé en relecture manuelle avec une erreur. |
| Champ clé | Indique que la valeur peut être utilisée pour rechercher des documents. |
| Champ de dimension | Expose la valeur comme dimension de rapport dans Skill Monitor. Remarque : la valeur est tronquée à 100 caractères dans la base de données de reporting (mais reste telle quelle dans le document). |
Types de données
| Type de données | Description |
|---|---|
| Text | Peut contenir des lettres latines et cyrilliques, des chiffres, des idéogrammes et des caractères spéciaux. |
| Date | Une date et une heure dans n’importe quel format. Séparateurs acceptés : point (.), espace, trait d’union (-), antislash (\) et barre oblique (/). |
| Number | Peut contenir des chiffres, des séparateurs décimaux et le caractère de pourcentage (%). Séparateurs décimaux acceptés : point (.), virgule (,), trait d’union (-), signe égal (=), espace. Séparateurs de milliers acceptés : point (.), virgule (,), apostrophe ('), espace. |
| Money | Une valeur numérique avec un symbole de devise. Le symbole peut apparaître avant ou après le montant. |
La lettre minuscule « l » (L), la lettre majuscule « I » (i) et le chiffre « 1 » peuvent avoir une apparence similaire. Dans les champs Number ou Money, un caractère ambigu est reconnu comme « 1 », car les lettres ne sont pas autorisées.
Paramètres d’apparence
- Origine du texte — Indique si le champ contient uniquement des caractères imprimés, uniquement des caractères manuscrits ou les deux. Si vous ajoutez le champ en traçant un rectangle, Vantage déduit cette valeur des caractères qu’il détecte. Si vous ajoutez le champ avec Ajouter un champ, la valeur par défaut est Imprimé. Consultez les langues prises en charge pour la reconnaissance de l’écriture manuscrite.
- Éliminer l’arrière-plan du champ — Améliore la reconnaissance lorsque le champ comporte un cadre, des cases pour chaque caractère ou un texte indicatif. Si vous activez cette option, téléversez le formulaire vierge servant de modèle d’arrière-plan et étiquetez le champ correspondant sur ce formulaire. Le formulaire vierge apparaît dans le Document Set, signalé par une icône.
- Polices spéciales — Améliore la précision de la reconnaissance lorsque le champ utilise une police particulière. Vous pouvez sélectionner plusieurs polices.
Polices prises en charge
| Font | Description | Font sample |
|---|---|---|
| Fax | Une police généralement utilisée par les télécopieurs. | ![]() |
| Gothique | Textes imprimés en caractères gothiques. | ![]() |
| Index | Un jeu spécial de caractères comprenant uniquement des chiffres écrits dans le style des codes postaux. | ![]() |
| Imprimante matricielle | Textes imprimés sur une imprimante matricielle. | ![]() |
| MICR CMC-7 | Une police Barcode MICR spéciale (CMC-7). | ![]() |
| MICR E-13B | Caractères numériques imprimés à l’encre magnétique. Les caractères MICR (reconnaissance de caractères à l’encre magnétique) figurent sur divers documents, notamment les chèques personnels. | ![]() |
| OCR-A | Une police à chasse fixe conçue pour la Reconnaissance optique de caractères (OCR). Largement utilisée par les banques, les sociétés de cartes de crédit et les entreprises similaires. | ![]() |
| OCR-B | Une police conçue pour la reconnaissance optique de caractères. | ![]() |
| Reçu | Pour les textes de faible qualité, généralement en police à chasse fixe ou en police standard utilisées sur les reçus. | ![]() |
| Machine à écrire | Textes dactylographiés. | ![]() |
Propriétés par type de données
Text
- Longueur maximale — Nombre maximal de caractères autorisés. Si la valeur extraite dépasse cette longueur, Vantage affiche une erreur. Si le processus comprend une étape de relecture manuelle, le document passe en relecture manuelle.
- Expression régulière — Modèle qui restreint l’ensemble des caractères valides pour le champ, ce qui peut améliorer la précision de l’extraction. Par exemple, vous pouvez forcer la reconnaissance de chaque caractère en tant que chiffre, imposer un format spécifique de numéro de téléphone ou vérifier qu’un champ contient un poids numérique avec une unité.
1-(234)-567-8900 ou 2 (987) 654 3211 :
50lb, 50lbs, 50Lb, 50Lbs, 50 lb ou 50 lbs :
Les expressions régulières n’affectent pas la reconnaissance du texte dans les documents PDF.
Date
- Heure — Autorise une valeur d’heure. Si cette option est désactivée, l’heure n’est pas extraite.
- Jour de la semaine — Autorise un jour de la semaine dans le champ. Si cette option est désactivée, le jour de la semaine n’est pas extrait.
- Mois en toutes lettres — Autorise le mois à être écrit en toutes lettres.
Ordre acceptable des composants
Date acceptable
Nombre
- Entiers uniquement — La valeur doit être un entier. Tous les séparateurs du nombre détecté sont traités comme des séparateurs de milliers.
- La partie fractionnaire peut contenir plus de deux chiffres — Activez cette option si la partie décimale doit contenir plus de deux chiffres. Séparateurs décimaux acceptés : point (
.), virgule (,), tiret (-), signe égal (=), espace. - Peut avoir des valeurs négatives — Autorise les valeurs négatives, indiquées par un signe moins ou des parenthèses.
- Peut inclure le symbole ’%’ — Autorise le symbole de pourcentage avant ou après la valeur.
Le nombre doit être compris dans un intervalle
Les champs Money utilisent les mêmes propriétés que Number, sauf que le symbole de pourcentage n’est pas autorisé.
Annotation des documents
Consignes pour l’annotation des documents structurés et semi-structurés lors de l’entraînement.
Langues de reconnaissance prises en charge
Liste complète des langues de Reconnaissance optique de caractères (OCR) prises en charge par les compétences Vantage.










