Variantes de type de document
- Pour des centaines de variantes, les compétences entraînées à l’aide de l’Apprentissage en ligne dans Vantage pourront extraire les données avec une quasi‑perfection.
- Pour des milliers de variantes, les compétences entraînées à l’aide de l’activité Deep Learning pourront extraire les données avec une précision d’environ 80 % à 90 %, selon la complexité des types de documents.
- Pour les variantes les plus importantes d’un type de document, les compétences entraînées à l’aide des activités Fast Learning et/ou Extraction Rules garantiront une extraction précise des données à partir de documents complexes.
- Pour les documents structurés, qui contiennent toujours les mêmes types d’informations exactement aux mêmes emplacements, nous recommandons d’utiliser jusqu’à 10 variantes. Si un formulaire fixe présente de nombreuses variantes, nous recommandons de les traiter toutes comme des types de documents différents. Pour plus d’informations, voir Processing structured documents.
Entraînement et test d’une Compétence de document
- Ensemble d’entraînement
- Ensemble de test
- Ensemble à l’aveugle (un ensemble de test supplémentaire contenant des documents d’exemple non inclus dans l’un des deux ensembles ci-dessus)
Exigences relatives à l’ensemble d’entraînement
- Deep Learning activity for semi-structured documents :
- Pour les documents à forte variabilité, au moins 200 à 300 documents d’exemple (2 à 3 par variante) sont nécessaires. De manière générale, nous recommandons d’avoir environ 1 000 documents dans l’ensemble.
- Pour les documents à faible variabilité, 100 documents d’exemple suffisent généralement.
- Segmentation activity :
- Pour les documents à forte variabilité, nous recommandons d’avoir au moins 100 documents d’exemple.
- Pour les documents à faible variabilité, nous recommandons d’avoir au moins 20 documents d’exemple.
- Deep Learning for NLP activity :
- Pour les documents à forte variabilité, nous recommandons d’avoir au moins 300 documents d’exemple (2 à 3 par variante).
- Pour les documents à faible variabilité, nous recommandons d’avoir au moins 50 documents d’exemple.
Remarque : Même si vous n’avez pas le nombre recommandé de documents d’exemple, disposer d’un document d’exemple par variante est préférable à rien du tout.
Exigences pour l’ensemble de test
Exigences relatives au jeu en aveugle
Remarque : Veillez à utiliser des documents différents pour l’entraînement et le test de votre Skill.
Configuration d’une Compétence de document
- Cliquez sur le bouton Paramètres à côté du nom de la compétence pour afficher et ajuster ses paramètres.
- Dans l’onglet Documents, importez quelques documents.
- Dans l’onglet Fields, annotez les champs de données dont les valeurs seront extraites, en précisant leurs emplacements.
- Dans l’onglet Activities, configurez le flux de traitement du document.
- Dans l’onglet Results, testez votre compétence pour évaluer ses performances sur des documents d’exemple.
- Dans l’onglet Publish, publiez votre compétence.
