Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Annotez un ensemble représentatif de documents afin d’entraîner et de tester une Compétence de document. Les consignes ci‑dessous couvrent les documents structurés et semi-structurés.
Pour les documents non structurés, voir annotation de documents non structurés.

Documents structurés

Les documents structurés contiennent toujours exactement le même type d’informations aux mêmes emplacements. Un exemple de document structuré est le formulaire préformaté. Vous devez seulement annoter quelques documents d’exemple pour l’entraînement, car la mise en page ne varie pas. Utilisez les consignes suivantes lors de l’annotation de documents structurés:
  • Spécifiez avec précision la Region de chaque champ — les valeurs de champ seules ne suffisent pas pour l’entraînement.
  • Pour délimiter la Region d’un champ, ne cliquez pas sur sa valeur ; marquez plutôt l’intégralité de l’espace réservé.
  • Si un champ ne contient aucune valeur, marquez l’espace réservé vide.
  • Si un champ est composé de plusieurs parties, maintenez la touche Maj enfoncée pour ajouter les parties. Toutes les parties doivent se trouver sur la même Page.
  • Si un formulaire fixe contient un tableau, marquez toutes les lignes, y compris celles qui sont vides.
  • Si vous ajoutez un champ après le début de l’annotation, annotez le nouveau champ sur chaque document du jeu d’entraînement où il apparaît.

Documents semi-structurés

Les documents semi-structurés contiennent généralement les mêmes types d’informations, ou des types d’informations similaires, mais l’emplacement, la taille et le nombre de champs peuvent varier d’un document à l’autre. Exemples : les factures, les ordres de paiement et les quittances. Utilisez les consignes suivantes lors de l’annotation de documents semi-structurés :
  • Spécifiez avec précision la région de chaque champ — la seule valeur du champ ne suffit pas pour l’entraînement.
  • Pour délimiter la région d’un champ, cliquez sur sa valeur — le ou les mots qu’elle contient — et la région est créée automatiquement.
  • Si un champ ne contient aucune valeur, ne créez pas de région pour ce champ.
  • Ne délimitez pas des parties de mots — Vantage ne peut apprendre qu’à partir de mots entiers.
  • Si un champ se compose de plusieurs parties, maintenez la touche Maj enfoncée pour les ajouter. Toutes les parties doivent se trouver sur la même page.
  • Pour les données répétées, analysez d’abord vos documents et choisissez la structure appropriée :
    Si vos données répétées ressemblent à…Utilisez
    Un tableau avec un en-tête commun et des valeurs qui n’ont pas de mots-clés adjacentsUn champ Table
    Des données moins structurées dont les valeurs ont des mots-clés à côtéUn Group avec Allow multiple items activé
    Des mises en page différentes selon les documentsChoisissez l’option qui convient à la majorité de vos documents
  • Pour annoter un tableau, délimitez les cellules de la première ligne une par une — Vantage crée automatiquement les colonnes. Cliquez ensuite sur Continue table from this row, puis vérifiez que l’ensemble du tableau est correctement annoté.
  • Ne placez pas la région d’un champ à l’intérieur de celle d’un autre champ — que l’élément parent soit un champ individuel (comme une adresse) ou une cellule de tableau. Pour extraire des données d’un long fragment de texte, utilisez Advanced Designer.
  • Si vous ajoutez un champ alors que l’annotation a déjà commencé, passez en revue tous les documents et annotez le nouveau champ dans chaque document où il apparaît.
Si les tableaux sont grands et que les pages du document se ressemblent, vous pouvez supprimer les pages similaires et annoter uniquement la première page, la dernière page et quelques pages intermédiaires.

Ajout de champs

Marquez les champs dans l’onglet Editor et configurez leurs propriétés selon leur type.

Annotation de documents non structurés

Guide Advanced Designer pour l’annotation de documents non structurés.

Configurer une compétence de document

Créez, entraînez et publiez une compétence de document, avec prise en charge des formulaires structurés et d’Online Learning.

Entraînement et test d’une compétence de document

Guide Advanced Designer pour entraîner, tester et évaluer la qualité d’une compétence de document.