Passer au contenu principal
Remarque : vous pouvez utiliser un jeu de documents distinct pour entraîner votre activité Deep Learning. Pour ce faire, sélectionnez l’activité Deep Learning dans la liste déroulante située à côté du nom du Skill. Ensuite, dans la liste déroulante à gauche du bouton Upload, sélectionnez le jeu de documents souhaité ou cliquez sur Create Set… pour en créer un nouveau. Vous pouvez téléverser, supprimer et faire pivoter des documents dans cet onglet comme décrit dans la section Documents.

Étapes de configuration

Pour configurer une activité de Deep Learning :

Étape 1. Ajouter l’activité

Dans l’onglet Activities, ajoutez à votre flux de traitement de documents une activité de Deep Learning pour les documents semi-structurés.

Étape 2. Sélectionner les champs

Dans le volet Activity Properties, sélectionnez les champs à entraîner à l’aide de cette activité. Vous pouvez sélectionner l’une des options suivantes :
  • Jusqu’à 50 champs de type Text, quel que soit leur niveau d’imbrication.
  • Un tableau avec jusqu’à 32 colonnes.
Si vous devez entraîner davantage de champs, vous pouvez ajouter d’autres activités Deep Learning et les utiliser pour sélectionner des champs supplémentaires. Par exemple, si vous devez entraîner plusieurs champs de texte et un tableau, créez deux activités Deep Learning.
Remarque : Les champs suivants ne peuvent pas être entraînés :
  • Champs d’un type autre que Text
  • Groupes comportant plusieurs éléments, ainsi que les tableaux ou champs de texte comportant plusieurs éléments imbriqués dans un groupe comportant plusieurs éléments
  • Tableaux avec plus de 32 colonnes
Vous devrez configurer l’extraction de ces champs à l’aide d’autres activités, par exemple, une activité Extraction Rules.

Étape 3. Étiqueter les documents

Cliquez sur Activity Editor et accédez à l’onglet Fields pour étiqueter vos documents. Le processus d’étiquetage dans Activity Editor est identique au processus d’étiquetage de documents habituel. Les recommandations suivantes vous aideront à déterminer la taille de votre ensemble de documents :
  • Si l’ensemble d’entraînement contient uniquement le minimum de 10 documents, vous pouvez démarrer l’entraînement de deep learning, mais il est recommandé d’importer des documents supplémentaires pour améliorer la précision.
  • Si votre ensemble d’entraînement comprend uniquement 10 documents, vous pouvez tout de même commencer l’entraînement de votre modèle. Cependant, Advanced Designer affichera un avertissement recommandant d’ajouter plus de 500 documents étiquetés pour obtenir des résultats d’entraînement optimaux.
  • Si votre ensemble d’entraînement contient entre 500 et 10 000 documents, vous pouvez commencer immédiatement l’entraînement de votre activité. C’est le nombre recommandé de documents à avoir dans votre ensemble d’entraînement.
  • Si l’ensemble d’entraînement contient plus de 10 000 documents, Advanced Designer affichera un avertissement indiquant que la compétence risque de devenir instable.

Étape 4. Entraîner l’activité

Après avoir importé et étiqueté vos documents, cliquez sur Train Activity.

Étape 5. Suivre la progression de l’entraînement

Accédez à l’onglet Results pour évaluer la progression de l’entraînement. Si nécessaire, ajustez la durée de l’entraînement ou arrêtez l’entraînement. Pour plus d’informations, consultez Suivi et ajustement de l’entraînement d’activités.

Étapes après l’apprentissage

Une fois que l’activité a été entraînée, les tests de l’activité démarrent automatiquement. Si vous arrêtez l’apprentissage, il vous sera proposé de lancer les tests de l’activité manuellement. Lorsque les tests sont terminés, analysez les résultats d’extraction des champs dans la section Activity Test Results de l’onglet Results. Les statistiques pour cette activité sont identiques aux statistiques générales pour la compétence affichées dans l’onglet Results. Si vous n’êtes pas satisfait de la qualité de l’extraction des champs, vous disposez des options suivantes :
  • Ajouter d’autres documents à l’ensemble d’apprentissage et reprendre le processus d’apprentissage. Les résultats d’apprentissage obtenus jusqu’à présent seront conservés et le réseau de neurones sera de nouveau entraîné à l’aide de l’ensemble de documents mis à jour.
  • Ajuster l’annotation et relancer l’apprentissage. Les résultats d’apprentissage obtenus jusqu’à présent seront supprimés et le réseau de neurones sera entraîné à partir de zéro.
  • Créer un conteneur Hypothesis Filtering avec une activité Extraction Rules, ce qui vous permettra de définir des conditions pour la sortie de l’activité Deep Learning.
L’activité ne peut être entraînée et testée qu’à l’aide de documents dont l’annotation est confirmée. Les documents ont une annotation non confirmée si l’annotation de référence a été générée automatiquement à partir de l’annotation prédite, sauf si vous copiez l’annotation prédite vers l’annotation de référence à l’aide de l’option correspondante dans le menu contextuel du document. Vous pouvez vérifier l’état de l’annotation pour chaque document dans l’onglet Documents. Pour confirmer l’annotation d’un document, vous devez l’examiner dans l’onglet Fields.
Remarque : À partir d’Advanced Designer v. 2.3.1, les restrictions relatives aux champs pour l’activité Deep Learning ont changé. Si votre compétence utilise une activité Deep Learning entraînée qui extrait plus de 50 champs, vous pouvez continuer à traiter des documents avec cette compétence. Cependant, lorsque vous ouvrez une telle compétence pour la modifier, l’activité Deep Learning existante sera scindée en plusieurs activités Deep Learning, que vous devrez éventuellement réentraîner. Vous devrez également définir le routage des activités dans le flux de traitement des documents.