Passer au contenu principal
Avant de publier une compétence, vous devez vérifier la qualité de l’extraction de champs afin de vous assurer que votre compétence est correctement configurée. Pour tester une compétence, cliquez sur Tester la compétence. Lors du test d’une compétence, le programme compare l’annotation de référence avec les résultats d’extraction. Dans l’onglet Résultats, vous pouvez consulter les statistiques des résultats d’extraction de documents pour une compétence. L’analyse de ces statistiques permet de déterminer comment améliorer la qualité des données extraites. Tous les champs extraits par la compétence sont affichés dans la colonne Champs. Les champs appartenant à des groupes de champs sont regroupés dans des listes déroulantes réduites portant le nom de leur groupe de champs. AD_Results

Statistiques d’extraction de Field

Les statistiques d’extraction de champ suivantes sont disponibles :
  1. La colonne Précision indique le pourcentage de champs dont les valeurs ont été correctement extraites (ligne TOUS LES CHAMPS), ainsi que le pourcentage de valeurs correctement extraites pour chaque champ.
    • Les valeurs de précision pour les champs individuels sont calculées comme **Accuracy** = **Correct** / (**Correct** + **Recognition Issues** + **Located Incorrectly** + **Not Detected**).
    • La valeur de précision TOUS LES CHAMPS est calculée selon la même formule, mais les nombres au dénominateur sont des agrégats sur l’ensemble des champs.
  2. La colonne Correct indique le nombre d’instances de champ dont la valeur extraite correspond à la valeur de référence.
  3. La colonne Recognition Issues indique le nombre d’instances de champ détectées dans le document mais non reconnues correctement.
  4. La colonne Located Incorrectly indique le nombre d’instances de champ dont les valeurs diffèrent des valeurs prédites parce que leurs régions ont été détectées à des emplacements différents de ceux spécifiés lors de l’étiquetage.
  5. La colonne Not Detected indique le nombre d’instances de champ non détectées.
  6. La colonne Fréquence dans les documents indique le pourcentage de documents contenant le champ donné.
Remarque : Par défaut, ces statistiques sont affichées pour tous les champs. Vous pouvez masquer des champs individuellement dans la liste et n’afficher les statistiques que pour les champs souhaités. Pour ce faire, cliquez sur l’icon de filtre en haut de la colonne Fields et sélectionnez les champs souhaités.

Mode de comparaison

En cliquant sur les valeurs des colonnes 2 à 5, vous pouvez passer au mode de comparaison entre l’étiquetage de référence et l’étiquetage prédit. Ce mode vous permet d’analyser les différences entre l’étiquetage de référence et l’étiquetage prédit sur l’image du document. Il vous aidera à repérer d’éventuelles erreurs dans l’étiquetage de référence ainsi que des champs problématiques pouvant nécessiter une reconfiguration de l’activité.

Statistiques propres à l’activité

Des statistiques d’extraction de champs sont également disponibles pour chaque activité dans l’onglet Results de l’Activity Editor. Les statistiques d’activité ne contiennent des données que pour les champs extraits par l’activité concernée. L’analyse de ces statistiques spécifiques à une activité peut aider à évaluer la pertinence de la configuration de votre activité afin d’améliorer la qualité d’extraction des champs de la compétence.
Remarque : Les documents dont l’étiquetage n’est pas confirmé sont exclus des résultats de test. Un document a un étiquetage non confirmé si l’étiquetage de référence a été généré automatiquement à partir de l’étiquetage prédit, sauf si vous copiez l’étiquetage prédit vers l’étiquetage de référence à l’aide de l’option correspondante dans le menu contextuel du document. Vous pouvez vérifier l’état de l’étiquetage pour chaque document dans l’onglet Documents. Pour confirmer l’étiquetage d’un document, vous devez le passer en revue dans l’onglet Fields.