Remarque : Cette technologie est fournie en aperçu et sera améliorée dans les versions futures.
Configuration d’un conteneur de filtrage des hypothèses
- Cliquez sur le bloc qui contient l’activité Deep Learning et sélectionnez Filter Hypotheses. Un nouveau conteneur de filtrage des hypothèses sera créé et l’activité Deep Learning sélectionnée y sera placée.
- (Facultatif) Faites glisser d’autres activités Deep Learning dans le conteneur de filtrage des hypothèses. Cela vous permettra de combiner et comparer les résultats de deux activités Deep Learning ou plus. Deux activités peuvent être nécessaires, par exemple lorsque vous travaillez simultanément avec des champs de texte et des tableaux.
- Ajoutez une activité Extraction Rules au conteneur. Vous pouvez créer une nouvelle activité en cliquant sur l’espace réservé ou faire glisser une activité existante dans le conteneur.
- Configurez l’activité Extraction Rules. Pour chacune des valeurs trouvées par les activités Deep Learning, ajoutez un élément de recherche Deep Learning et définissez ses propriétés. Vous pouvez ajouter tous les champs de sortie d’une activité Deep Learning en une seule fois. Un élément de recherche Deep Learning prend en charge toutes les propriétés qui limitent la zone de recherche ainsi que les conditions de recherche de l’élément.
- Connectez l’entrée et la sortie du conteneur de filtrage des hypothèses aux autres blocs du flux de traitement de documents. Les champs de sortie du conteneur de filtrage des hypothèses seront identiques à ceux de l’activité Extraction Rules.
Remarque : Si vous décidez d’arrêter de contrôler la sortie de l’activité Deep Learning, cliquez n’importe où dans le conteneur et sélectionnez Don’t Filter Hypotheses. Le conteneur sera démonté, mais les activités elles-mêmes ne seront pas supprimées, et vous pourrez toujours les utiliser dans le flux de traitement de documents modifié.
Exemples
Workflow de Skill

- L’activité Deep Learning extrait des champs Text.
- L’activité Deep Learning 2 extrait un tableau.
- Le conteneur Hypothesis Filtering sélectionne et combine leurs résultats.
Structure des éléments de recherche dans l’activité Extraction Rules

Exemple 1 : Corriger une valeur trouvée par une activité de Deep Learning

- Pour corriger la valeur 95, un nouvel élément de recherche est créé. Cet élément de recherche, nommé DocNumber_Corrected, doit se situer dans la région de l’élément de recherche 95 et contenir un nombre limité de caractères.

- La zone de recherche du nouvel élément est restreinte pour correspondre à la région 95 en ajoutant la ligne suivante au code de l’élément :
- L’élément de recherche corrigé est associé au champ qui extrait le numéro de document :


Exemple 2 : Sélectionner une seule valeur parmi plusieurs valeurs répétées
Remarque : Nous recommandons d’enregistrer l’ensemble de documents annotés dans un dossier au préalable. Lorsque vous désactivez le paramètre Allow Multiple Items pour un champ, toutes les occurrences supplémentaires de ce champ seront supprimées de l’annotation. Le modèle entraîné dans l’activité de Deep Learning continuera de fonctionner, mais si vous souhaitez le modifier et le réentraîner, vous devrez charger l’ensemble de documents d’origine.
- Le paramètre Allow Multiple Items est désactivé pour le champ Document Number (ce paramètre est accessible en cliquant sur Manage Fields).

- L’élément de recherche 95 avec plusieurs occurrences ne peut pas être mappé au champ Document Number. Un nouvel élément de recherche Deep Learning est donc créé à partir de la sortie « document number » de l’activité de Deep Learning et mappé au champ Document Number.

- Les occurrences multiples du numéro de document trouvées par l’activité de Deep Learning sont utilisées pour construire un arbre d’hypothèses, dont une seule sera sélectionnée comme valeur de l’élément de recherche 95.

- Pour trouver une occurrence particulière, certaines conditions sont ajoutées pour l’élément de recherche 95 (dans ce cas, nous voulons trouver l’occurrence la plus haute du numéro de document).

Exemple 3 : combiner les résultats de deux activités de Deep Learning

