Passer au contenu principal
L’activité Fast Learning est utilisée pour extraire des champs à partir de documents structurés et semi-structurés. Elle permet également d’entraîner les champs sélectionnés comme champs de sortie pour cette activité pendant que les documents sont traités dans Vantage. Pour plus d’informations, consultez Vantage Runtime Guide, Online Learning. Vous pouvez désactiver explicitement l’entraînement des champs en décochant l’option correspondante dans le volet Activity Properties. Si vous n’ajoutez pas l’activité Fast Learning à votre flux de traitement de documents, il ne sera pas possible d’entraîner des champs une fois que vous aurez créé et publié votre compétence. Si vous modifiez une compétence créée dans Vantage, celle-ci peut contenir une activité Fast Learning préentraînée. Vous pouvez ajouter d’autres activités et les combiner avec celle préentraînée. Pour plus d’informations, consultez Modifier une compétence créée et entraînée dans Vantage.
Remarque : L’activité Fast Learning ne peut pas extraire des structures complexes (par exemple, des tableaux imbriqués, qui sont des structures répétitives à l’intérieur d’autres tableaux) ni des champs de type Image. Pour extraire de telles structures, utilisez l’activité Extraction Rules.

Cas d’utilisation

Ajoutez cette activité à votre flux de traitement de documents dans les cas suivants :
  • Lorsque l’ensemble de documents comprend plusieurs variantes de mise en page et que vous pouvez fournir des échantillons pour chaque variante lors de l’entraînement. Par exemple, si vous souhaitez entraîner l’extraction à partir de relevés bancaires issus de plusieurs banques différentes et que vous disposez d’échantillons pour chacune d’elles.
  • Lorsque vous prévoyez de traiter des variantes de documents sur lesquelles votre compétence n’a pas encore été entraînée et que vous souhaitez profiter de l’Apprentissage en ligne. Par exemple, pour le traitement des factures, chaque fournisseur a probablement sa propre mise en page et de nouveaux fournisseurs peuvent apparaître quotidiennement. Dans ce cas, vous utiliserez d’autres activités pour extraire les données des documents, mais vous pouvez aussi ajouter l’activité Fast Learning au flux de traitement ; elle sera entraînée à l’exécution à l’aide des retours d’Apprentissage en ligne issus de la boucle de relecture manuelle.
  • Lorsque vous souhaitez entraîner des champs pendant que les documents sont traités dans Vantage.

Fonctionnement

Fast Learning repose sur une technologie de regroupement en clusters qui rassemble des mises en page de documents similaires et entraîne en interne un modèle d’extraction de champs pour chaque cluster. L’activité Fast Learning peut apprendre des milliers de variantes de documents. Contrairement à l’activité Deep Learning, l’activité Fast Learning a tendance à mémoriser ce qu’elle a « vu » plutôt qu’à apprendre des motifs d’image. Fast Learning ne pourra pas généraliser à de nouvelles variantes de documents qu’elle n’a pas encore rencontrées. Lorsqu’une activité Fast Learning traite un nouveau document à l’exécution, elle identifie le cluster auquel le document ressemble le plus, puis applique le modèle interne correspondant. Cette activité ne nécessite pas un grand jeu d’entraînement — un seul document suffit pour démarrer l’entraînement. Si vous disposez de plusieurs variantes d’un même document (par exemple, des documents essentiellement identiques mais présentant quelques différences visuelles), nous recommandons d’inclure dans le jeu d’entraînement des documents représentant chaque variante. Pour en savoir plus, consultez Configuration d’une activité Fast Learning.