Passer au contenu principal
Si, pour une raison quelconque, un classificateur produit des résultats insatisfaisants pour un lot de documents, essayez ce qui suit :
  • Vérifiez que vous avez correctement réglé le curseur précision-rappel ;
  • Augmentez le nombre de documents. Plus votre sélection de documents est vaste, plus le classificateur reconnaîtra de documents différents appartenant à une même classe ;
  • Créez des règles supplémentaires pour mieux différencier les classes.
Pour améliorer la qualité de la classification, procédez comme suit :
  • Vérifiez que vous avez correctement défini les valeurs de précision et de rappel souhaitées ;
  • Ajoutez davantage de documents pertinents au jeu d’entraînement. Cela permettra de définir plus précisément les attributs des classes et d’optimiser l’algorithme de classification, ce qui améliorera la qualité du classificateur entraîné ;
  • Passez en revue les documents mal classés dans les cellules jaunes du tableau de l’onglet Matrice de confusion (clic droit pour les afficher). S’il est évident, au vu du sens du texte et des attributs sélectionnés, que la classe de référence a été attribuée de manière incorrecte, attribuez la bonne à la place. S’il n’est pas possible de déterminer avec précision la classe de référence du document, supprimez-le du lot d’entraînement ;
  • Il est possible que le lot d’entraînement contienne des classes thématiquement proches, difficiles à différencier même pour des experts humains. Regroupez les classes similaires en une seule ;
  • Créez des règles supplémentaires pour faciliter la différenciation entre les classes.