Pular para o conteúdo principal
Aprendizado online ocorre em tempo de execução. À medida que mais documentos são processados, alguns são coletados pelo programa e adicionados aos conjuntos de treinamento e de teste da skill. A skill então se aprimora nesses conjuntos em tempo real. O aprendizado online está disponível para Skill de Documento e Skill de Classificação.
Observação: O aprendizado online vem desativado por padrão. Para informações sobre como habilitar esse recurso, consulte Habilitar o aprendizado online.

Como o Online learning funciona

Observação: Esta seção pressupõe que seu Skill de Processo inclui uma etapa de revisão manual e que o recurso Online learning foi habilitado.
O processo de Online learning pode ser descrito da seguinte forma:
  1. Novos documentos são coletados e colocados no conjunto de treinamento ou no conjunto de teste.
  2. Uma sessão de aprendizagem é iniciada usando o conjunto de treinamento.
  3. A skill é testada.

Etapa 1. Como os documentos são coletados

Os documentos serão coletados da seguinte forma:
  1. O aprendizado online começará a coletar documentos assim que receber o primeiro documento corrigido por um operador de revisão manual.
    • Para uma Skill de Documento, será o primeiro documento em que a região de pelo menos um campo foi corrigida.
    • Para uma Skill de Classificação, será o primeiro documento cujo tipo foi alterado.
  2. Após a obtenção do primeiro documento, serão coletados:
    • Todos os documentos que passaram pela revisão manual.
    • Alguns documentos que não passaram pela revisão manual (sua proporção não excederá 33% do total de documentos nos conjuntos de treinamento e de teste combinados).
  3. À medida que novos documentos forem coletados, eles serão colocados no conjunto de treinamento ou no conjunto de teste.
    • O número máximo de documentos no conjunto de treinamento é 10.000. O número máximo de documentos no conjunto de teste é 1.000.
Observação: Esses limites podem ser excedidos se o conjunto de treinamento já contiver mais de 10.000 documentos no momento em que o aprendizado online começar a coletar novos documentos. Nesse caso, cada novo documento adicionado a um conjunto com capacidade excedida substituirá o documento mais antigo existente nesse conjunto.
  • Os documentos serão colocados apenas no conjunto de treinamento até que o número de documentos nesse conjunto atinja 30. Assim que esse número for atingido, os documentos serão colocados no conjunto de treinamento ou no conjunto de teste.
  • Até que ambos os conjuntos estejam completos, cada novo documento tem 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste.
  • Quando um dos conjuntos estiver completo, novos documentos serão colocados no outro conjunto até que ele também fique completo.
  • Quando ambos os conjuntos estiverem completos, novos documentos ainda poderão ser colocados em qualquer um dos conjuntos, substituindo os documentos mais antigos.
  • Quando ambos os conjuntos estiverem completos, cada novo documento tem 20% de chance de ir para um dos conjuntos e 80% de chance de ser descartado.
  • Quando ambos os conjuntos estiverem completos, cada novo documento que não for descartado tem 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste, substituindo o documento mais antigo em qualquer um dos conjuntos.
Esquema do Processo de Aprendizado Online

Etapa 2. Quando uma sessão de aprendizado é iniciada

  • Se esta for a primeira sessão de aprendizado após a publicação da versão do Skill, ela começará quando o conjunto de documentos receber 10% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 10 novos documentos.
  • Se a última sessão de aprendizado foi bem-sucedida e o Skill foi atualizado, uma nova sessão começará nas mesmas condições da primeira.
  • Se a última sessão de aprendizado foi malsucedida e o Skill não foi atualizado, uma nova sessão de aprendizado começará quando o conjunto de documentos receber 5% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 5 novos documentos.

Etapa 3. Como a skill é testada

A skill será atualizada quando o Online learning resultar em um aumento de pelo menos 1% na precisão. A precisão da skill será testada da seguinte forma:
  • Se houver pelo menos 20 documentos no conjunto de teste, a skill será testada nesse conjunto.
  • Se houver menos de 20 documentos no conjunto de teste:
    • Uma Skill de Documento será testada tanto no conjunto de treinamento quanto no conjunto de teste.
    • Para uma Skill de Classificação, se não houver documentos suficientes no conjunto de documentos (se cada classe tiver menos de cinco documentos), a skill será testada tanto no conjunto de treinamento quanto no conjunto de teste. Se houver documentos suficientes, será usada validação cruzada para avaliar a precisão.
Depois disso, mais documentos são coletados e uma nova sessão de aprendizado é iniciada.
Observação: O Online learning não cria uma nova versão da skill. A mudança de versão só ocorre quando uma skill é publicada. Consulte Publicar uma skill.