Pular para o conteúdo principal
A aprendizagem online ocorre em tempo de execução. À medida que mais documentos são processados, alguns serão coletados pelo sistema e incluídos nos conjuntos de treinamento e de teste da skill. A skill será então aprimorada com base nesses conjuntos em tempo real. A aprendizagem online está disponível para Skills de Documento e Skills de Classificação.
Observação: A aprendizagem online não está disponível para skills projetadas para processar documentos estruturados. Nesses casos, a opção Coletar documentos e aprender ficará desativada. Os documentos ainda serão coletados, mas nenhum aprendizado será realizado.

Como o Online learning funciona

Observação: Esta seção pressupõe que seu Skill de Processo inclui uma etapa de revisão manual e que o recurso Online learning foi habilitado.
O processo de Online learning pode ser descrito da seguinte forma:
  1. Novos documentos são coletados e colocados no conjunto de treinamento ou no conjunto de teste.
  2. Uma sessão de aprendizagem é iniciada usando o conjunto de treinamento.
  3. A skill é testada.

Etapa 1. Como os documentos são coletados

Os documentos serão coletados da seguinte forma:
  1. O Online Learning começará a coletar documentos assim que receber o primeiro documento corrigido por um operador de revisão manual.
    • Para uma Skill de Documento, este será o primeiro documento em que a região de pelo menos um campo tiver sido corrigida.
    • Para uma Skill de Classificação, este será o primeiro documento cujo tipo tiver sido alterado.
  2. Depois que o primeiro documento for obtido, os seguintes documentos serão coletados:
    • Todos os documentos que tiverem passado por revisão manual.
    • Alguns documentos que não tiverem passado por revisão manual (sua proporção não excederá 33% de todos os documentos nos conjuntos de treinamento e de teste combinados).
  3. À medida que novos documentos forem coletados, eles serão colocados no conjunto de treinamento ou no conjunto de teste.
    • O número máximo de documentos no conjunto de treinamento é 10.000. O número máximo de documentos no conjunto de teste é 1.000.
Observação: Esses limites podem ser excedidos se o conjunto de treinamento já contiver mais de 10.000 documentos no momento em que o Online Learning começar a coletar novos documentos. Se for esse o caso, cada novo documento adicionado a um conjunto com capacidade excedida substituirá o documento existente mais antigo nesse conjunto.
  • Os documentos serão colocados apenas no conjunto de treinamento até que o número de documentos nesse conjunto atinja 30. Quando esse número for atingido, os documentos serão colocados no conjunto de treinamento ou no conjunto de teste.
  • Até que ambos os conjuntos estejam cheios, cada novo documento terá 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste.
  • Quando um dos conjuntos estiver cheio, novos documentos serão colocados no outro conjunto até que ele também fique cheio.
  • Quando ambos os conjuntos estiverem cheios, novos documentos ainda poderão ser colocados em qualquer um dos conjuntos, substituindo os documentos existentes mais antigos.
  • Quando ambos os conjuntos estiverem cheios, cada novo documento terá 20% de chance de ir para um dos conjuntos e 80% de chance de ser descartado.
  • Quando ambos os conjuntos estiverem cheios, cada novo documento que não tiver sido descartado terá 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste, substituindo o documento existente mais antigo em qualquer um dos conjuntos.
Esquema do processo de Online Learning

Etapa 2. Quando uma sessão de aprendizado é iniciada

  • Se esta for a primeira sessão de aprendizado após a publicação da versão do Skill, ela começará quando o conjunto de documentos receber 10% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 10 novos documentos.
  • Se a última sessão de aprendizado foi bem-sucedida e o Skill foi atualizado, uma nova sessão começará nas mesmas condições da primeira.
  • Se a última sessão de aprendizado foi malsucedida e o Skill não foi atualizado, uma nova sessão de aprendizado começará quando o conjunto de documentos receber 5% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 5 novos documentos.

Etapa 3. Como a skill é testada

A skill será atualizada quando o aprendizado online resultar em pelo menos 1% de aumento na precisão. A precisão da skill será testada da seguinte forma:
  • Se houver pelo menos 20 documentos no conjunto de teste, a skill será testada nesse conjunto.
  • Se houver menos de 20 documentos no conjunto de teste:
    • Uma Skill de Documento será testada tanto no conjunto de treinamento quanto no de teste.
    • Para uma Skill de Classificação, se não houver documentos suficientes no conjunto (se cada classe tiver menos de cinco documentos), a skill será testada tanto no conjunto de treinamento quanto no de teste. Se houver documentos suficientes, será utilizada a validação cruzada para avaliar a precisão.
Depois disso, mais documentos são coletados e uma nova sessão de aprendizado é iniciada.
Observação: O aprendizado online não cria uma nova versão da skill. A alteração de versão só ocorre quando uma skill é publicada. Consulte Publicação de uma skill.