Affichez les statistiques d’extraction des champs, les métriques de précision et les résultats par activité pour évaluer et améliorer la qualité de votre compétence de document.
L’onglet Results affiche les statistiques d’extraction des champs d’une compétence. L’analyse de ces statistiques vous aide à identifier les points à améliorer dans la qualité de l’extraction.Avant de publier une compétence, vérifiez la qualité d’extraction des champs pour vous assurer qu’elle est correctement configurée. Pour tester une compétence, cliquez sur Test Skill — Advanced Designer compare l’annotation de référence aux résultats d’extraction.La colonne fields répertorie tous les champs extraits par la compétence. Les champs appartenant à un groupe apparaissent dans une liste déroulante réduite portant le nom du groupe.
Les documents comportant une annotation non confirmée sont exclus des résultats de test. L’annotation de référence générée automatiquement à partir de l’annotation prédite reste non confirmée tant que vous n’avez pas copié l’annotation prédite vers la référence à l’aide de la commande Copy Predicted Labeling to Reference du menu contextuel. Vérifiez l’état de l’annotation dans l’onglet Documents ; confirmez l’annotation dans l’onglet fields.
Les statistiques suivantes sont disponibles pour chaque champ et agrégées dans la ligne ALL FIELDS :
Colonne
Description
Précision
Pourcentage de valeurs correctement extraites.
Correct
Nombre d’instances de champ dont la valeur extraite correspond à la valeur de référence.
Problème de reconnaissance
Nombre d’instances de champ détectées dans le document, mais mal reconnues.
Mauvaise localisation
Nombre d’instances de champ dont les régions ont été détectées à des emplacements différents de ceux spécifiés dans l’annotation.
Non détecté
Nombre d’instances de champ non détectées.
Fréquence dans les documents
Pourcentage de documents contenant le champ.
La précision est calculée comme suit :
Accuracy = Correct / (Correct + Recognition Issues + Located Incorrectly + Not Detected)
Pour la ligne ALL FIELDS, le dénominateur est calculé sur l’ensemble des champs.Par défaut, ces statistiques s’affichent pour tous les champs. Pour masquer certains champs et n’afficher les statistiques que pour un sous-ensemble, cliquez sur l’icône de filtre en haut de la colonne fields et sélectionnez les champs souhaités.
Cliquez sur une valeur quelconque dans les colonnes Correct, Problèmes de reconnaissance, Mauvaise localisation ou Non détecté pour passer en mode de comparaison, qui affiche côte à côte l’annotation de référence et l’annotation prédite sur l’image du document. Cela vous permet de repérer les erreurs dans l’annotation de référence et d’identifier les champs posant problème qui peuvent nécessiter une reconfiguration de l’activité.
Des statistiques d’extraction des champs sont également disponibles pour chaque activité dans l’onglet Results de l’Éditeur d’activité. Les statistiques d’activité ne couvrent que les champs extraits par cette activité. Utilisez-les pour évaluer si chaque activité est correctement configurée et améliorer la qualité globale de l’extraction.