Passer au contenu principal
Avant de publier une compétence, vous devez vérifier la qualité de l’extraction des champs pour vous assurer que votre compétence est correctement configurée. Pour tester une compétence, cliquez sur Test Skill. Lors du test d’une compétence, le programme compare l’annotation de référence avec les résultats d’extraction. Dans l’onglet Results, vous pouvez consulter les statistiques des résultats d’extraction de documents pour une compétence. L’analyse de ces statistiques permet de comprendre comment améliorer la qualité des données extraites. Tous les champs extraits par la compétence sont affichés dans la colonne Fields. Les champs appartenant à des groupes de champs sont regroupés dans des listes déroulantes réduites portant le nom de leur groupe de champs. AD_Results

Statistiques d’extraction de Field

Les statistiques d’extraction de champs suivantes sont disponibles :
  1. La colonne Accuracy indique le pourcentage de champs dont les valeurs ont été correctement extraites (ligne ALL FIELDS), ainsi que le pourcentage de valeurs correctement extraites pour chaque champ.
    • Les valeurs d’Accuracy pour les champs individuels sont calculées comme **Accuracy** = **Correct** / (**Correct** + **Recognition Issues** + **Located Incorrectly** + **Not Detected**).
    • La valeur d’Accuracy pour ALL FIELDS est calculée selon la même formule, mais les nombres au dénominateur sont des agrégats sur l’ensemble des champs.
  2. La colonne Correct indique le nombre d’instances de champ dont la valeur extraite correspond à la valeur de référence.
  3. La colonne Recognition Issues indique le nombre d’instances de champ détectées dans le document mais mal reconnues.
  4. La colonne Located Incorrectly indique le nombre d’instances de champ dont les valeurs diffèrent des valeurs prévues parce que leurs régions ont été détectées à des emplacements différents de ceux définis lors de l’étiquetage.
  5. La colonne Not Detected indique le nombre d’instances de champ non détectées.
  6. La colonne Frequency in Documents indique le pourcentage de documents contenant le champ donné.
Remarque : Par défaut, ces statistiques sont affichées pour tous les champs. Vous pouvez masquer des champs individuels dans la liste et afficher les statistiques uniquement pour les champs souhaités. Pour ce faire, cliquez sur l’icon de filtre en haut de la colonne Fields et sélectionnez les champs souhaités.

Mode de comparaison

En cliquant sur les valeurs des colonnes 2 à 5, vous pouvez passer au mode de comparaison entre l’étiquetage de référence et l’étiquetage prédit. Ce mode vous permet d’analyser les différences entre l’étiquetage de référence et l’étiquetage prédit sur l’image du document. Il vous aidera à repérer d’éventuelles erreurs dans l’étiquetage de référence ainsi que des champs problématiques pouvant nécessiter une reconfiguration de l’activité.

Statistiques propres à l’activité

Des statistiques d’extraction de champs sont également disponibles pour chaque activité dans l’onglet Results de l’Activity Editor. Les statistiques d’activité ne contiennent des données que pour les champs extraits par l’activité concernée. L’analyse de ces statistiques par activité peut aider à évaluer la pertinence de la configuration de votre activité afin d’améliorer la qualité d’extraction des champs de la compétence.
Remarque : Les documents dont l’étiquetage n’est pas confirmé sont exclus des résultats de test. Un document a un étiquetage non confirmé si l’étiquetage de référence a été généré automatiquement à partir de l’étiquetage prédit, sauf si vous copiez l’étiquetage prédit vers l’étiquetage de référence à l’aide de l’option correspondante dans le menu contextuel du document. Vous pouvez vérifier l’état de l’étiquetage pour chaque document dans l’onglet Documents. Pour confirmer l’étiquetage d’un document, vous devez le valider dans l’onglet Fields.