Passer au contenu principal
Un élément de recherche vous permet de définir des conditions concernant le type et les propriétés d’un objet à extraire. Comme les activités NLP traitent du texte non structuré, les conditions de recherche indiquent la position des objets par rapport au reste du texte, plutôt que leur relation géométrique. Vous pouvez également utiliser des éléments de recherche auxiliaires pour affiner la recherche, en précisant que l’objet recherché peut se trouver à l’intérieur, avant ou après ces éléments auxiliaires.

Création d’un élément de recherche

  • Vous pouvez créer rapidement un élément de recherche en cliquant sur l’un des objets surlignés dans l’image. Le nouvel élément de recherche sera du même type que l’objet sur lequel vous cliquez. Utilisez le bouton Show Image Objects dans la barre d’outils pour sélectionner les objets à surligner.

Mise en surbrillance des objets

Les types d’objets suivants peuvent être mis en surbrillance :
  • Personne
  • Organisation
  • Adresse
  • Lieu
  • Date
  • Durée
  • Montant
  • Mots reconnus
Remarque : Tous ces objets sont mis en surbrillance par défaut, à l’exception des mots reconnus.
  • Vous pouvez également créer un nouvel élément de recherche à l’aide du menu :
  1. Accédez à l’onglet Search Elements à droite de la fenêtre du document.
  2. Cliquez sur Create Element.
  3. Sélectionnez le type d’élément souhaité dans la liste qui s’ouvre.
Une fois l’élément créé, vous devez configurer ses propriétés dans le volet Properties (voir Propriétés de l’élément pour plus d’informations).
Remarque : Les propriétés indiquées peuvent également être consultées et modifiées sous forme de code (voir Syntaxe du code pour l’activité Extraction Rules pour le NLP pour plus d’informations).

Types d’éléments de recherche

Lors de la création d’un élément de recherche, vous devez en préciser le type, qui dépend de l’objet que vous souhaitez trouver. Les types d’éléments de recherche disponibles sont brièvement présentés ci‑dessous.

Personne

Noms de personnes, par exemple : John Doe, Jane Smith.

Organisation

Noms d’organisations, par exemple : ABBYY, Acme Corp.

Adresse

Adresses, par exemple : 123 Main St., Anytown AB 45678.

Lieu

Noms de lieux, par exemple : Anytown, Corporate Place.

Date

Dates dans différents formats, par exemple : 14 novembre 2009, 11/14/2009.

Durée

Périodes, par exemple : douze (12) mois, 4 jours.

Argent

Montants d’argent, par exemple : 2 670,00 $, 199 dollars et 99 cents. Remarque : Les éléments Person, Organization, Address, Location, Date, Duration et Money correspondent aux entités nommées que vous pouvez configurer dans l’activité Named Entities (NER) et sont extraits à l’aide de la même technologie.

Valeur depuis le dictionnaire

Un mot ou une expression provenant d’un dictionnaire. Le dictionnaire doit être un fichier TXT brut contenant une liste de variantes de texte de recherche, une variante par ligne.

Valeur issue d’une expression régulière

Une valeur qui correspond à une expression régulière que vous avez spécifiée.

Text

Un mot-clé ou une expression, avec la possibilité de rechercher toutes les formes d’un mot ou d’autoriser certaines erreurs de reconnaissance.

Groupe

Un ensemble d’éléments de recherche imbriqués. Les éléments constituant un groupe peuvent être des éléments simples ou des éléments de groupe. Un élément de groupe n’a pas de propriétés qui lui sont propres. Les données sont extraites en fonction des paramètres de ses éléments de recherche imbriqués. Les éléments de groupe peuvent être utilisés pour imposer une hiérarchie logique des éléments, afin de faciliter le débogage et la navigation. Par exemple, regrouper le nom, l’adresse et la date de naissance d’une personne permet d’extraire les données relatives à chaque personne de manière cohérente.

Groupe répétitif

Cet élément est conçu pour détecter des groupes répétitifs d’éléments. Les groupes répétitifs conviennent aux cas où une entité peut avoir plusieurs instances, chacune avec ses propres propriétés, sans que vous sachiez à l’avance combien il y en aura. Les propriétés de chaque instance sont définies dans les éléments imbriqués du groupe répétitif. Par exemple, si vous traitez des CV, vous pouvez créer un groupe répétitif « Education » avec les éléments imbriqués suivants : « School_name », « Degree », « Start_date » et « Graduation_date ». En revanche, si les données que vous recherchez se rapportent à différentes entités ayant des rôles distincts, un groupe répétitif ne sera pas le bon choix. Par exemple, si vous n’avez que deux parties à un contrat, à savoir l’acheteur et le vendeur, créez un groupe « Party1_Buyer » et un groupe « Party2_Seller » au lieu d’un seul groupe répétitif « Party ».

Champ de saisie

Cet élément vous permet d’utiliser un champ extrait par une autre activité comme bloc de construction pour les règles. Par exemple, si une activité Règles d’extraction est précédée d’une activité Segmentation, vous pouvez utiliser certains segments pour affiner la recherche.

Modification du type, du nom et de la position d’un élément dans la liste

Pour modifier le type d’un élément :
  • Cliquez avec le bouton droit sur un élément et sélectionnez Convertir l’élément en dans le menu contextuel.
  • Sélectionnez un élément dans la liste et cliquez sur un objet mis en surbrillance dans l’image. Vous pourrez ainsi convertir l’élément de recherche sélectionné en le type de l’objet surligné. Si vous cliquez sur un mot reconnu mis en surbrillance, vous pouvez convertir l’élément de recherche en Text et, simultanément, ajouter le mot sélectionné à la liste des mots‑clés de cet élément de recherche.
  • Pour les éléments de recherche correspondant à des entités nommées, utilisez la propriété Entités pour modifier le type de l’entité nommée.
Remarque : La modification du type d’un élément ne convertit pas les éléments non groupés en éléments de groupe et inversement.
Pour modifier le nom d’un élément :
  • Cliquez avec le bouton droit sur un élément, sélectionnez Renommer dans le menu contextuel, puis saisissez un nouveau nom.
  • Sélectionnez un élément, cliquez sur son nom (ou appuyez sur F2), puis saisissez un nouveau nom.
Le nom d’un élément peut contenir des lettres latines, des chiffres et des traits de soulignement. En revanche, il ne peut pas commencer par un chiffre. Les espaces, les symboles spéciaux (.,:- \ /) et les noms réservés ne sont pas autorisés. Pour déplacer des éléments dans la liste :
  • Faites glisser les éléments vers le haut ou vers le bas pour modifier leur position dans la liste.
  • Faites glisser les éléments sur un élément de groupe pour les placer à l’intérieur du groupe.
Remarque : Les éléments sont recherchés de haut en bas. Cela signifie que les éléments utilisés dans les conditions de recherche d’un autre élément doivent précéder cet élément dans la liste des éléments.