Passer au contenu principal
L’apprentissage en ligne s’effectue à l’exécution. À mesure que davantage de documents sont traités, certains sont collectés par le programme et ajoutés à l’ensemble d’entraînement et à l’ensemble de test de la compétence. La compétence s’améliore ensuite sur ces ensembles en temps réel. L’apprentissage en ligne est disponible pour les Compétences de document et les Skill de classification.
Remarque : L’apprentissage en ligne est désactivé par défaut. Pour savoir comment activer cette fonctionnalité, consultez Activation de l’apprentissage en ligne.

Fonctionnement de l’Online learning

Remarque : Cette section suppose que votre Compétence de processus inclut une étape de relecture manuelle et que la fonctionnalité Online learning est activée.
Le processus Online learning se déroule comme suit :
  1. De nouveaux documents sont collectés et placés soit dans l’ensemble d’apprentissage, soit dans l’ensemble de test.
  2. Une session d’apprentissage est lancée à partir de l’ensemble d’apprentissage.
  3. La compétence est testée.

Étape 1. Collecte des documents

Les documents sont collectés comme suit :
  1. Online Learning commence à collecter des documents dès réception du premier document corrigé par un opérateur de relecture manuelle.
    • Pour une Compétence de document, il s’agit du premier document pour lequel la zone d’au moins un champ a été corrigée.
    • Pour un Skill de classification, il s’agit du premier document dont le type a été modifié.
  2. Après l’obtention du premier document, les documents suivants sont collectés :
    • Tous les documents passés par la relecture manuelle.
    • Certains documents qui n’ont pas été soumis à la relecture manuelle (leur part ne dépassera pas 33 % de l’ensemble des documents des jeux d’entraînement et de test combinés).
  3. À mesure que de nouveaux documents sont collectés, ils sont placés soit dans le jeu d’entraînement, soit dans le jeu de test.
    • Le nombre maximal de documents dans le jeu d’entraînement est de 10 000. Le nombre maximal de documents dans le jeu de test est de 1 000.
Remarque : Ces limites peuvent être dépassées si le jeu d’entraînement contient déjà plus de 10 000 documents au moment où Online Learning commence à collecter de nouveaux documents. Dans ce cas, chaque nouveau document ajouté à un ensemble surchargé remplacera le document le plus ancien de cet ensemble.
  • Les documents sont placés uniquement dans le jeu d’entraînement jusqu’à ce que celui-ci atteigne 30 documents. Une fois ce seuil atteint, les documents sont placés soit dans le jeu d’entraînement, soit dans le jeu de test.
  • Tant que les deux ensembles ne sont pas pleins, chaque nouveau document a 80 % de chances d’être versé dans le jeu d’entraînement et 20 % de chances d’être versé dans le jeu de test.
  • Lorsque l’un des ensembles est plein, les nouveaux documents sont placés dans l’autre ensemble jusqu’à ce qu’il soit également plein.
  • Lorsque les deux ensembles sont pleins, de nouveaux documents peuvent toujours être placés dans l’un ou l’autre ensemble, en remplaçant les documents les plus anciens.
  • Lorsque les deux ensembles sont pleins, chaque nouveau document a 20 % de chances d’être placé dans l’un des ensembles et 80 % de chances d’être écarté.
  • Lorsque les deux ensembles sont pleins, chaque nouveau document qui n’a pas été écarté a 80 % de chances d’être versé dans le jeu d’entraînement et 20 % de chances d’être versé dans le jeu de test, en remplaçant le document le plus ancien de l’ensemble concerné.
Schéma du processus Online Learning

Étape 2. Démarrage d’une session d’apprentissage

  • S’il s’agit de la première session d’apprentissage après la publication de la version du Skill, elle démarrera lorsque l’ensemble de documents aura reçu 10 % de nouveaux documents. Par exemple, s’il y a au total 95 documents dans l’ensemble, une nouvelle session d’apprentissage commencera après l’ajout de 10 nouveaux documents.
  • Si la dernière session d’apprentissage a réussi et que le Skill a été mis à jour, une nouvelle session démarrera dans les mêmes conditions que pour la première.
  • Si la dernière session d’apprentissage a échoué et que le Skill n’a pas été mis à jour, une nouvelle session d’apprentissage démarrera lorsque l’ensemble de documents aura reçu 5 % de nouveaux documents. Par exemple, s’il y a au total 95 documents dans l’ensemble, une nouvelle session d’apprentissage commencera après l’ajout de 5 nouveaux documents.

Étape 3. Test de la compétence

La compétence sera mise à jour lorsque l’apprentissage en ligne entraîne une augmentation d’au moins 1 % de la précision. La précision de la compétence sera évaluée comme suit :
  • S’il y a au moins 20 documents dans l’ensemble de test, la compétence sera testée sur cet ensemble.
  • S’il y a moins de 20 documents dans l’ensemble de test :
    • Une Compétence de document sera testée à la fois sur l’ensemble d’entraînement et sur l’ensemble de test.
    • Pour une Skill de classification, s’il n’y a pas assez de documents dans l’ensemble (si chaque classe compte moins de cinq documents), la compétence sera testée à la fois sur l’ensemble d’entraînement et sur l’ensemble de test. S’il y a suffisamment de documents, une validation croisée sera utilisée pour évaluer la précision.
Ensuite, d’autres documents sont collectés et une nouvelle session d’apprentissage est lancée.
Remarque : L’apprentissage en ligne ne crée pas une nouvelle version de la compétence. Un changement de version n’intervient que lorsqu’une compétence est publiée. Voir Publication d’une compétence.