Passer au contenu principal
Une fois l’entraînement terminé, les résultats de classification servent à établir un rapport statistique.
  • Si la classe attribuée à une page correspond à une classe de référence, cela est classé comme un vrai positif (TP) ;
  • Si aucune classe n’a été attribuée à une page sans classe de référence, cela est classé comme un vrai négatif (TN) ;
  • Si la classe attribuée à une page ne correspond pas à une classe de référence, cela est classé comme un faux positif (FP) ;
  • Si aucune classe n’a été attribuée à une page qui a une classe de référence, cela est classé comme un faux négatif (FN) ;
Ainsi, un décompte est établi pour chaque classe, indiquant le nombre de fois où elle a été :
  • correctement attribuée (TP) ;
  • correctement non attribuée (TN) ;
  • incorrectement attribuée (FP) ;
  • incorrectement non attribuée (FN).
Pour afficher les statistiques, sélectionnez Classificateur > Afficher les statistiques. Plus la précision, le rappel et la F-mesure sont élevés, meilleurs sont les résultats de classification. (Pour plus de détails sur le calcul de la F-mesure, voir le Glossaire). La F-mesure est une mesure équilibrée de la précision et du rappel, et permet une évaluation globale de la qualité de la classification à l’aide de ces paramètres. Pour plus d’informations sur l’amélioration de la F-mesure, consultez la section Conseils pour améliorer la qualité de la classification. À des fins d’évaluation de la qualité, d’autres statistiques sont également disponibles dans les onglets suivants :
  • Matrice de confusion. La matrice de confusion est une représentation visuelle des documents que le classificateur confond le plus souvent. Les cellules sur la diagonale de la matrice indiquent combien de documents ont été correctement classés. La colonne de droite et la dernière ligne contiennent des informations sur les documents auxquels aucune classe n’a été attribuée. Les autres cellules montrent les documents qui ont été mal classés ;
  • Classes confondues. Cet onglet contient une liste des classes que le classificateur a confondues. Cette statistique peut vous aider à déterminer quelles classes sont le plus souvent confondues entre elles ;
  • Statistiques par classe. Cet onglet affiche des statistiques détaillées pour chaque classe et vous permet d’identifier les classes pour lesquelles le classificateur commet le plus d’erreurs.