Pular para o conteúdo principal
A atividade Fast Learning é usada para extrair campos de documentos estruturados e semiestruturados. Ela também permite treinar os campos selecionados como campos de saída desta atividade enquanto os documentos estão sendo processados no Vantage. Para mais informações, consulte Vantage Runtime Guide, Online Learning. Você pode desativar explicitamente o treinamento de campos desmarcando essa opção no painel Activity Properties. Se você não adicionar a atividade Fast Learning ao seu fluxo de processamento de documentos, não será possível treinar campos depois de criar e publicar sua skill. Se você estiver editando uma skill criada no Vantage, ela pode conter uma atividade Fast Learning pré-treinada. Você pode adicionar outras atividades e combiná-las com a pré-treinada. Para mais informações, consulte Edição de uma skill criada e treinada no Vantage.
Observação: A atividade Fast Learning não consegue extrair estruturas complexas (por exemplo, tabelas aninhadas, que são estruturas repetidas dentro de outras tabelas) nem campos do tipo Image. Para extrair essas estruturas, use a atividade Extraction Rules.

Casos de uso

Adicione esta atividade ao seu fluxo de processamento de documentos nos seguintes casos:
  • Quando o conjunto de documentos inclui várias variantes de layout e você consegue fornecer amostras de cada variante durante o treinamento. Por exemplo, se você deseja treinar a extração de extratos bancários de diferentes bancos e tem amostras de cada um à disposição.
  • Quando você planeja processar variantes de documentos para as quais seu skill ainda não foi treinado e deseja aproveitar o Aprendizado Online. Por exemplo, ao processar faturas, é provável que cada fornecedor tenha seu próprio layout; além disso, novos fornecedores podem surgir diariamente. Nesse caso, você usará outras atividades para extrair dados dos documentos, mas também pode adicionar a atividade Fast Learning ao fluxo de processamento, e ela será treinada em tempo de execução com feedback de Aprendizado Online proveniente do ciclo de revisão manual.
  • Quando você deseja treinar campos enquanto os documentos estão sendo processados no Vantage.

Como funciona

O Fast Learning é baseado em uma tecnologia de clusterização que agrupa layouts de documentos visualmente semelhantes e treina internamente um modelo de extração de campos para cada cluster. A atividade Fast Learning pode aprender milhares de variantes diferentes de documentos. Ao contrário da atividade Deep Learning, a atividade Fast Learning tende a memorizar o que já “viu” em vez de aprender padrões de imagem. O Fast Learning não consegue generalizar para novas variantes de documentos que ainda não tenha encontrado. Quando uma atividade Fast Learning se depara com um novo documento em tempo de execução, ela determina a qual cluster o documento é mais semelhante e então aplica o modelo interno correspondente. Essa atividade não requer um conjunto de treinamento grande — um documento é suficiente para iniciar o treinamento. Se você tiver várias variantes do mesmo documento (por exemplo, documentos que são essencialmente idênticos, mas têm aparência um pouco diferente), recomendamos incluir no conjunto de treinamento documentos que representem cada variante. Para mais informações, consulte Configurar uma atividade Fast Learning.