Pular para o conteúdo principalAprendizado online ocorre em tempo de execução. À medida que mais documentos são processados, alguns são coletados pelo programa e adicionados aos conjuntos de treinamento e de teste da skill. A skill então se aprimora nesses conjuntos em tempo real.
O aprendizado online está disponível para Skill de Documento e Skill de Classificação.
Observação: O aprendizado online vem desativado por padrão. Para informações sobre como habilitar esse recurso, consulte Habilitar o aprendizado online.
Como o Online learning funciona
Observação: Esta seção pressupõe que seu Skill de Processo inclui uma etapa de revisão manual e que o recurso Online learning foi habilitado.
O processo de Online learning pode ser descrito da seguinte forma:
- Novos documentos são coletados e colocados no conjunto de treinamento ou no conjunto de teste.
- Uma sessão de aprendizagem é iniciada usando o conjunto de treinamento.
- A skill é testada.
Etapa 1. Como os documentos são coletados
Os documentos serão coletados da seguinte forma:
- O aprendizado online começará a coletar documentos assim que receber o primeiro documento corrigido por um operador de revisão manual.
- Para uma Skill de Documento, será o primeiro documento em que a região de pelo menos um campo foi corrigida.
- Para uma Skill de Classificação, será o primeiro documento cujo tipo foi alterado.
- Após a obtenção do primeiro documento, serão coletados:
- Todos os documentos que passaram pela revisão manual.
- Alguns documentos que não passaram pela revisão manual (sua proporção não excederá 33% do total de documentos nos conjuntos de treinamento e de teste combinados).
- À medida que novos documentos forem coletados, eles serão colocados no conjunto de treinamento ou no conjunto de teste.
- O número máximo de documentos no conjunto de treinamento é 10.000. O número máximo de documentos no conjunto de teste é 1.000.
Observação: Esses limites podem ser excedidos se o conjunto de treinamento já contiver mais de 10.000 documentos no momento em que o aprendizado online começar a coletar novos documentos. Nesse caso, cada novo documento adicionado a um conjunto com capacidade excedida substituirá o documento mais antigo existente nesse conjunto.
- Os documentos serão colocados apenas no conjunto de treinamento até que o número de documentos nesse conjunto atinja 30. Assim que esse número for atingido, os documentos serão colocados no conjunto de treinamento ou no conjunto de teste.
- Até que ambos os conjuntos estejam completos, cada novo documento tem 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste.
- Quando um dos conjuntos estiver completo, novos documentos serão colocados no outro conjunto até que ele também fique completo.
- Quando ambos os conjuntos estiverem completos, novos documentos ainda poderão ser colocados em qualquer um dos conjuntos, substituindo os documentos mais antigos.
- Quando ambos os conjuntos estiverem completos, cada novo documento tem 20% de chance de ir para um dos conjuntos e 80% de chance de ser descartado.
- Quando ambos os conjuntos estiverem completos, cada novo documento que não for descartado tem 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste, substituindo o documento mais antigo em qualquer um dos conjuntos.
Etapa 2. Quando uma sessão de aprendizado é iniciada
- Se esta for a primeira sessão de aprendizado após a publicação da versão do Skill, ela começará quando o conjunto de documentos receber 10% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 10 novos documentos.
- Se a última sessão de aprendizado foi bem-sucedida e o Skill foi atualizado, uma nova sessão começará nas mesmas condições da primeira.
- Se a última sessão de aprendizado foi malsucedida e o Skill não foi atualizado, uma nova sessão de aprendizado começará quando o conjunto de documentos receber 5% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 5 novos documentos.
Etapa 3. Como a skill é testada
A skill será atualizada quando o Online learning resultar em um aumento de pelo menos 1% na precisão.
A precisão da skill será testada da seguinte forma:
- Se houver pelo menos 20 documentos no conjunto de teste, a skill será testada nesse conjunto.
- Se houver menos de 20 documentos no conjunto de teste:
- Uma Skill de Documento será testada tanto no conjunto de treinamento quanto no conjunto de teste.
- Para uma Skill de Classificação, se não houver documentos suficientes no conjunto de documentos (se cada classe tiver menos de cinco documentos), a skill será testada tanto no conjunto de treinamento quanto no conjunto de teste. Se houver documentos suficientes, será usada validação cruzada para avaliar a precisão.
Depois disso, mais documentos são coletados e uma nova sessão de aprendizado é iniciada.
Observação: O Online learning não cria uma nova versão da skill. A mudança de versão só ocorre quando uma skill é publicada. Consulte Publicar uma skill.