Passer au contenu principal
Pour entraîner un classifieur, vous aurez besoin d’un jeu d’apprentissage contenant des documents déjà attribués à une classe de référence.

Création d’un jeu d’entraînement

  1. Dans le Skill de classification, ouvrez l’onglet Documents.
  2. Créez les classes appropriées à l’aide de la commande Create Class dans le volet Actions ou en cliquant sur Create class au-dessus de la liste des classes dans la partie gauche de l’écran.
    Conseil : Pour renommer une classe existante, cliquez sur l’icône à côté de son nom et sélectionnez Rename class.
  3. Sélectionnez une classe dans la liste des classes à gauche de l’écran et importez des documents dans celle-ci en cliquant soit sur Upload documents au centre de l’écran Classification Skill, sur le bouton Upload dans la barre d’outils, soit sur Upload Documents dans le volet Actions. Pendant l’import des documents, un indicateur de progression s’affiche en haut du Skill Designer, à droite des signets. Son info-bulle indique le nombre de documents restant à importer et à traiter.
    Remarque : Les documents importés dans le groupe No class ne sont pas utilisés pour l’entraînement ni pour les tests du classificateur.
Pour chaque classe, le nombre de documents de cette classe est affiché. Si votre ensemble de documents comporte très peu de classes ou si les classes diffèrent nettement les unes des autres, vous pouvez avoir un petit nombre de documents par classe. En revanche, s’il y a trop de classes ou si leurs différences ne sont pas suffisamment marquées, nous recommandons d’importer entre 10 et 100 documents par classe, car un nombre inférieur peut entraîner des erreurs de classification dans ce cas. Dans tous les cas, nous déconseillons d’importer plus de 1 000 documents par classe. Pour maximiser la précision de la classification, incluez des exemples pour les variantes de documents les plus courantes de chaque classe (environ un document par variante). Par défaut, tous les documents importés s’affichent sous forme de liste. Cela facilite la navigation si les fichiers ont des noms explicites. Vous pouvez aussi passer à l’affichage en vignettes, préférable si vos documents diffèrent visuellement. Pour basculer entre ces deux modes d’affichage, utilisez les boutons suivants de la barre d’outils :
  • Affichage en liste
  • Affichage en vignettes
Si plus de 50 documents sont importés, ils s’affichent sur plusieurs pages. Dans les deux modes, vous pouvez ouvrir une fenêtre d’aperçu du document en cliquant sur le bouton situé à gauche du nom du document. La largeur par défaut de cette fenêtre est de 35 % de celle du navigateur. Si besoin, vous pouvez l’augmenter jusqu’à 80 % en faisant glisser la bordure gauche de la fenêtre d’aperçu. La largeur définie par l’utilisateur est conservée jusqu’à effacement du cache du navigateur. Si nécessaire, vous pouvez modifier manuellement l’orientation des pages de document dans chaque classe en cliquant sur Rotate dans la barre d’outils, ce qui fait pivoter les pages de 90° dans le sens antihoraire. Vous pouvez aussi choisir l’une des options suivantes dans la liste déroulante : Rotate Left, Rotate Right ou Rotate 180°. Vous pouvez également utiliser la fenêtre d’aperçu pour changer l’orientation de la Page d’un document spécifique en cliquant sur le bouton et en choisissant l’option de rotation appropriée. Si un fichier n’a pas pu être importé (par exemple, format non pris en charge), son nom s’affiche en rouge.

Modification de la classe attribuée à un document

Vous pouvez modifier la classe de référence attribuée à un document importé en procédant comme suit :
  1. Sélectionnez un ou plusieurs documents à affecter à une nouvelle classe en cochant la case à gauche de leur nom.
  2. Dans la liste qui s’affiche dans le volet Actions, sélectionnez la classe appropriée pour le ou les documents et cliquez sur le bouton Affecter. Si la classe correcte n’apparaît pas dans la liste, saisissez un nouveau nom dans le champ Rechercher une classe du volet Actions et cliquez sur Créer.

Suppression de documents d’un ensemble

Vous pouvez supprimer des documents d’un ensemble de l’une des manières suivantes :
  • Marquez un ou plusieurs documents à supprimer en cochant la case à gauche de leur nom. Vous pouvez marquer tous les documents d’une classe spécifique en cochant la case à gauche du nom de cette classe au-dessus de la liste des documents (si les documents de la classe sont affichés sur plusieurs pages, cela ne marquera que les documents affichés sur la page actuelle). Cliquez sur l’icône à côté de l’un des documents marqués, puis cliquez sur Delete. Confirmez votre choix dans la boîte de dialogue qui s’affiche. Les documents marqués seront supprimés.
    Conseil : Même si un document n’est pas marqué pour suppression, vous pouvez toujours le supprimer en cliquant sur l’icône à côté de son nom.
  • Cliquez sur l’icône à côté du nom d’une classe dans la liste des classes, puis cliquez sur Delete All Documents. Confirmez votre choix dans la boîte de dialogue qui s’affiche. Tous les documents de la classe sélectionnée seront supprimés. Vous pouvez également cliquer sur Delete Class with All Documents, ce qui supprimera la classe elle-même ainsi que tous les documents qu’elle contient.

Entraîner un classificateur

Pour entraîner un classificateur à l’aide d’un jeu d’entraînement spécialement préparé, cliquez sur le bouton Train dans le volet Actions. Le bouton Train n’est actif que si le jeu d’entraînement contient au moins deux classes différentes non vides. Une fois l’entraînement terminé, l’icône Completed s’affiche à côté du bouton Train. L’affichage de la liste des classes dans l’onglet Documents est également modifié. Outre le nombre de documents importés pour chaque classe, le nombre de documents dont la classe prédite diffère de la classe de référence est également affiché. Classification Skill Training Documents Amount Vous pouvez arrêter l’entraînement du classificateur en cliquant sur Cancel sous le bouton Train dans le volet Actions.

Voir également

Analyse des résultats de classification