Passer au contenu principal
Pour la plupart des éléments de recherche de l’activité Extraction Rules, le volet Propriétés comporte deux sections : Quoi rechercher et Où rechercher. Les exceptions sont :
  • Les éléments Group et Repeating Group, qui n’ont pas de propriétés propres.
  • Les éléments de champ d’entrée, qui sont récupérés depuis d’autres activités précédant l’activité Extraction Rules et ne proposent que l’option Get region from pour passer d’un champ d’entrée à un autre.

Que rechercher

La section Que rechercher contient des propriétés propres à chaque élément.

Personne, Organisation, Adresse, Lieu, Date, Durée, Montant

Pour tous les éléments de recherche qui ciblent des entités nommées, vous pouvez spécifier les propriétés suivantes :
  • Entités : type d’entité. Si vous modifiez le type, l’icon associé à l’élément de recherche sera mis à jour automatiquement.
  • Occurrences : nombre d’occurrences. Vous pouvez extraire soit la première occurrence, soit l’ensemble des occurrences trouvées.

Valeur issue d’un dictionnaire

Pour une expression de dictionnaire, spécifiez :
  • Source du texte : un fichier TXT contenant une liste de mots ou d’expressions à rechercher, une variante par ligne.
  • Utiliser la morphologie : activez cette option pour rechercher toutes les formes de mots.
  • Occurrences : le nombre d’occurrences. Vous pouvez extraire soit la première, soit toutes les occurrences détectées.

Valeur issue d’une expression régulière

Pour une expression régulière, spécifiez :
  • Expression régulière : une expression régulière qui définit la recherche. Le programme utilise la syntaxe des expressions régulières PCRE2.
  • Rechercher des parties de mots : activez cette option pour trouver les correspondances même lorsqu’elles ne sont pas séparées par des espaces du reste du texte.
  • Occurrences : le nombre d’occurrences. Vous pouvez extraire soit la première occurrence détectée, soit toutes les occurrences détectées.

Text

Pour un élément de recherche de texte, cliquez sur l’icône de modification et saisissez une liste de mots ou d’expressions à rechercher, ou cliquez sur l’image du document pour ajouter des mots reconnus depuis le document. Contrairement à l’élément de recherche Value from Dictionary, les mots-clés sont saisis directement plutôt que dans un fichier TXT, et vous pouvez également autoriser certaines erreurs de reconnaissance.
  • Source du texte : une liste de mots ou d’expressions à rechercher, une variante par ligne.
  • Utiliser la morphologie : activez cette option pour rechercher toutes les formes d’un mot.
  • Erreurs autorisées : le pourcentage ou le nombre de caractères différents qui permettra tout de même de trouver le texte. Utile en cas d’erreurs de reconnaissance.
Remarque : Cette option n’est pas disponible si vous activez l’option Utiliser la morphologie.
  • Occurrences : le nombre d’occurrences. Vous pouvez extraire soit la première, soit toutes les occurrences détectées.
La section Où chercher est identique pour tous les éléments. Dans cette section, vous pouvez restreindre la zone dans laquelle le programme recherchera l’élément. Dans les paramètres suivants, vous pouvez utiliser les éléments de recherche placés au-dessus de l’élément actuel dans la liste :
  • Rechercher dans : l’élément de recherche se trouve soit dans le Document entier, soit à l’intérieur d’un autre élément de recherche.
Exemple : Recherchez le nom de l’organisation dans le préambule du document.
  • Après : l’élément de recherche se trouve après un autre élément de recherche dans le texte reconnu.
    • Rechercher dans la même phrase : activez cette option pour trouver l’élément dans la même phrase.
Exemple : Recherchez le rôle de l’organisation après son nom dans la même phrase.
  • Avant : l’élément de recherche se trouve avant un autre élément de recherche dans le texte reconnu.
    • Rechercher dans la même phrase : activez cette option pour trouver l’élément dans la même phrase.
Par exemple, si vous recherchez la date de naissance de quelqu’un, vous pouvez d’abord créer un élément de recherche auxiliaire avec le mot-clé « born », puis préciser que l’entité Date se trouve quelque part après ce mot-clé dans la même phrase. Vous pouvez ajouter plusieurs éléments Après et Avant pour affiner encore votre recherche.