Configurer l’activité Deep Learning

Vous pouvez utiliser un ensemble de documents séparé pour entraîner votre activité Deep Learning. Pour ce faire, sélectionnez l’activité Deep Learning dans la liste déroulante située à côté du nom de la compétence. Ensuite, dans la liste déroulante à gauche du bouton Upload, sélectionnez l’ensemble de documents nécessaire ou cliquez sur Create Set… pour en créer un nouveau. Vous pouvez téléverser, supprimer et faire pivoter des documents dans cet onglet, comme expliqué dans Documents.

Ajouter l’activité

Dans l’onglet Activities, ajoutez une activité Deep Learning pour les documents semi-structurés à votre flux de traitement des documents.

Sélectionner des champs

Dans le volet Activity Properties, sélectionnez les champs à entraîner avec cette activité.Vous pouvez sélectionner l’un des éléments suivants :

Jusqu’à 50 champs de type Text, quel que soit leur niveau d’imbrication.
Un tableau comportant jusqu’à 32 colonnes.

Si vous devez entraîner davantage de champs, vous pouvez ajouter d’autres activités Deep Learning et les utiliser pour sélectionner des champs supplémentaires. Par exemple, si vous devez entraîner plusieurs champs Text et un tableau, créez deux activités Deep Learning.Les champs suivants ne peuvent pas être entraînés :

Les champs d’un type autre que Text
Les groupes avec plusieurs éléments, les tableaux ou les champs de texte à éléments multiples imbriqués dans un groupe avec plusieurs éléments
Les tableaux comportant plus de 32 colonnes

Vous devrez configurer l’extraction de ces champs à l’aide d’autres activités, par exemple une activité Extraction Rules.

Annoter des documents

Cliquez sur Activity Editor et accédez à l’onglet Fields pour annoter vos documents. Le processus d’annotation dans l’Activity Editor est identique au processus habituel d’annotation des documents.Utilisez les recommandations suivantes pour déterminer la taille de l’ensemble de documents :

Si le jeu d’entraînement contient uniquement le minimum de 10 documents, vous pouvez démarrer l’entraînement Deep Learning, mais il est recommandé de téléverser des documents supplémentaires pour obtenir une meilleure précision.
Si votre jeu d’entraînement comprend seulement 10 documents, vous pouvez tout de même commencer l’entraînement de votre modèle. Cependant, Advanced Designer affichera un avertissement recommandant d’ajouter plus de 500 documents annotés pour obtenir des résultats d’entraînement optimaux.
Si votre jeu d’entraînement contient entre 500 et 10 000 documents, vous pouvez commencer immédiatement l’entraînement de votre activité. Il s’agit du nombre recommandé de documents à avoir dans votre jeu d’entraînement.
Si le jeu d’entraînement contient plus de 10 000 documents, Advanced Designer affichera un avertissement indiquant que la compétence peut devenir instable.

Entraîner l’activité

Une fois vos documents téléversés et annotés, cliquez sur Train Activity.

Surveiller la progression de l’entraînement

Accédez à l’onglet Résultats pour évaluer la progression de l’entraînement. Si nécessaire, ajustez la durée de l’entraînement ou arrêtez-le.Pour plus d’informations, consultez Surveiller et ajuster l’entraînement d’une activité.

Étapes après l’entraînement

Une fois l’activité entraînée, son test démarre automatiquement. Si vous interrompez l’entraînement, vous serez invité à lancer manuellement le test de l’activité. Une fois le test terminé, analysez les résultats d’extraction des champs dans la section Résultats du test de l’activité de l’onglet Résultats. Les statistiques de cette activité sont identiques aux statistiques générales de la compétence affichées dans l’onglet Résultats. Si la qualité de l’extraction des champs ne vous satisfait pas, vous avez les possibilités suivantes :

Ajoutez davantage de documents au jeu d’entraînement et reprenez le processus d’entraînement. Les résultats d’entraînement obtenus jusqu’à présent seront conservés, et le réseau neuronal sera entraîné davantage à l’aide de l’ensemble de documents mis à jour.
Modifiez l’annotation et redémarrez l’entraînement. Les résultats d’entraînement obtenus jusqu’à présent seront supprimés et le réseau neuronal sera entraîné à partir de zéro.
Créez un conteneur Hypothesis Filtering avec une activité Extraction Rules, ce qui vous permettra de définir des conditions pour la sortie de l’activité Deep Learning.

L’activité ne peut être entraînée et testée qu’à l’aide de documents dont l’annotation est confirmée. Les documents ont une annotation non confirmée si l’annotation de référence a été générée automatiquement à partir de l’annotation prédite, sauf si vous copiez l’annotation prédite vers l’annotation de référence à l’aide de l’option correspondante dans le menu contextuel du document. Vous pouvez vérifier l’état de l’annotation de chaque document dans l’onglet Documents. Pour confirmer l’annotation d’un document, vous devez la vérifier dans l’onglet fields.

À partir d’Advanced Designer v. 2.3.1, les limitations concernant les champs pour l’activité Deep Learning ont changé. Si votre compétence utilise une activité Deep Learning entraînée qui extrait plus de 50 champs, vous pouvez continuer à traiter des documents avec cette compétence. Toutefois, lorsque vous ouvrez une telle compétence pour la modifier, l’activité Deep Learning existante sera scindée en plusieurs activités Deep Learning, qu’il pourra être nécessaire de réentraîner. Vous devrez également acheminer ces activités dans le workflow de traitement des documents.

​Étapes après l’entraînement

Étapes après l’entraînement