Passer au contenu principal
L’activité Fast Learning permet d’extraire des champs à partir de documents structurés et semi-structurés. Elle permet aussi d’entraîner les champs sélectionnés comme champs de sortie pour cette activité pendant que les documents sont traités dans Vantage. Pour plus d’informations, consultez Vantage Runtime Guide, Online Learning. Vous pouvez désactiver explicitement l’entraînement des champs en décochant l’option correspondante dans le volet Activity Properties. Si vous n’ajoutez pas l’activité Fast Learning à votre flux de traitement de documents, il ne sera pas possible d’entraîner des champs une fois votre compétence créée et publiée. Si vous modifiez une compétence créée dans Vantage, celle-ci peut contenir une activité Fast Learning préentraînée. Vous pouvez ajouter d’autres activités et les combiner avec l’activité préentraînée. Pour plus d’informations, voir Editing a skill created and trained in Vantage.
L’activité Fast Learning ne peut pas extraire des structures complexes (p. ex. des tableaux imbriqués, c’est‑à‑dire des structures répétitives à l’intérieur d’autres tableaux) ni des champs de type image. Pour extraire de telles structures, utilisez Extraction Rules activity.

Cas d’utilisation

Ajoutez cette activité à votre flux de traitement de documents dans les cas suivants :
  • Lorsque l’ensemble de documents comprend plusieurs variantes de mise en page et que vous pouvez fournir des échantillons pour chaque variante lors de l’entraînement. Par exemple, si vous souhaitez entraîner l’extraction à partir de relevés bancaires issus de plusieurs banques différentes et que vous disposez d’échantillons pour chacune d’elles.
  • Lorsque vous prévoyez de traiter des variantes de documents sur lesquelles votre compétence n’a pas encore été entraînée et que vous souhaitez profiter de l’Apprentissage en ligne. Par exemple, pour le traitement des factures, chaque fournisseur a probablement sa propre mise en page et de nouveaux fournisseurs peuvent apparaître quotidiennement. Dans ce cas, vous utiliserez d’autres activités pour extraire les données des documents, mais vous pouvez aussi ajouter l’activité Fast Learning au flux de traitement ; elle sera entraînée à l’exécution à l’aide des retours d’Apprentissage en ligne issus de la boucle de relecture manuelle.
  • Lorsque vous souhaitez entraîner des champs pendant que les documents sont traités dans Vantage.

Fonctionnement

Fast Learning repose sur une technologie de clustering qui regroupe des mises en page de documents similaires et entraîne en interne un modèle d’extraction de champs pour chaque cluster. L’activité Fast Learning peut apprendre des milliers de variantes de documents différentes. Contrairement à l’activité Deep Learning, l’activité Fast Learning a tendance à mémoriser ce qu’elle a « vu » plutôt qu’à apprendre des motifs d’images. Fast Learning ne sera pas capable de se généraliser à de nouvelles variantes de documents qu’il n’a pas encore rencontrées. Lorsqu’une activité Fast Learning est confrontée à un nouveau document à l’exécution, elle détermine à quel cluster le document ressemble le plus, puis applique le modèle interne correspondant. Cette activité ne nécessite pas un vaste jeu d’entraînement : un seul document suffit pour commencer l’entraînement. Si vous disposez de plusieurs variantes d’un même document (par exemple, des documents qui sont essentiellement identiques mais dont l’apparence diffère légèrement), nous vous recommandons d’inclure, dans le jeu d’entraînement, des documents représentant chaque variante. Pour plus d’informations, voir Configurer une activité Fast Learning.