Remarque : Cette activité ne peut pas extraire des structures complexes (par exemple, des tableaux imbriqués, qui sont des structures répétitives à l’intérieur d’autres tableaux) ni des champs d’un type autre que Text. Pour extraire de telles structures, utilisez l’activité Extraction Rules.
Cas d’utilisation
- Votre Skill sera utilisé pour traiter plusieurs variantes d’un type de document donné.
- Vous prévoyez de traiter des variantes de documents sur lesquelles votre Skill n’a pas encore été entraîné. Par exemple, vous pouvez disposer d’une Compétence de document avec une activité Fast Learning entraînée à extraire des champs à partir de contrats de prêt (avec différentes structures de champs) provenant de plusieurs banques. Si vous décidez d’utiliser ce Skill existant pour traiter des contrats de prêt d’une nouvelle banque encore inconnue de ce Skill, la qualité d’extraction risque d’être insuffisante. Pour améliorer la qualité de l’extraction, vous pouvez utiliser une activité Deep Learning au lieu d’une activité Fast Learning.
Fonctionnement
Exigences en matière d’entraînement
- Pour les documents à forte variabilité : au moins 200 à 300 documents d’exemple (2 à 3 documents d’exemple par variante) sont nécessaires.
- Pour les documents à faible variabilité : au moins 10 documents d’exemple sont nécessaires (2 à 3 documents d’exemple par variante).
