Pular para o conteúdo principalA aprendizagem online ocorre em tempo de execução. À medida que mais documentos são processados, alguns serão coletados pelo sistema e incluídos nos conjuntos de treinamento e de teste da skill. A skill será então aprimorada com base nesses conjuntos em tempo real.
A aprendizagem online está disponível para Skills de Documento e Skills de Classificação.
Observação: A aprendizagem online não está disponível para skills projetadas para processar documentos estruturados. Nesses casos, a opção Coletar documentos e aprender ficará desativada. Os documentos ainda serão coletados, mas nenhum aprendizado será realizado.
Como o Online learning funciona
Observação: Esta seção pressupõe que seu Skill de Processo inclui uma etapa de revisão manual e que o recurso Online learning foi habilitado.
O processo de Online learning pode ser descrito da seguinte forma:
- Novos documentos são coletados e colocados no conjunto de treinamento ou no conjunto de teste.
- Uma sessão de aprendizagem é iniciada usando o conjunto de treinamento.
- A skill é testada.
Etapa 1. Como os documentos são coletados
Os documentos serão coletados da seguinte forma:
- O Online Learning começará a coletar documentos assim que receber o primeiro documento corrigido por um operador de revisão manual.
- Para uma Skill de Documento, este será o primeiro documento em que a região de pelo menos um campo tiver sido corrigida.
- Para uma Skill de Classificação, este será o primeiro documento cujo tipo tiver sido alterado.
- Depois que o primeiro documento for obtido, os seguintes documentos serão coletados:
- Todos os documentos que tiverem passado por revisão manual.
- Alguns documentos que não tiverem passado por revisão manual (sua proporção não excederá 33% de todos os documentos nos conjuntos de treinamento e de teste combinados).
- À medida que novos documentos forem coletados, eles serão colocados no conjunto de treinamento ou no conjunto de teste.
- O número máximo de documentos no conjunto de treinamento é 10.000. O número máximo de documentos no conjunto de teste é 1.000.
Observação: Esses limites podem ser excedidos se o conjunto de treinamento já contiver mais de 10.000 documentos no momento em que o Online Learning começar a coletar novos documentos. Se for esse o caso, cada novo documento adicionado a um conjunto com capacidade excedida substituirá o documento existente mais antigo nesse conjunto.
- Os documentos serão colocados apenas no conjunto de treinamento até que o número de documentos nesse conjunto atinja 30. Quando esse número for atingido, os documentos serão colocados no conjunto de treinamento ou no conjunto de teste.
- Até que ambos os conjuntos estejam cheios, cada novo documento terá 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste.
- Quando um dos conjuntos estiver cheio, novos documentos serão colocados no outro conjunto até que ele também fique cheio.
- Quando ambos os conjuntos estiverem cheios, novos documentos ainda poderão ser colocados em qualquer um dos conjuntos, substituindo os documentos existentes mais antigos.
- Quando ambos os conjuntos estiverem cheios, cada novo documento terá 20% de chance de ir para um dos conjuntos e 80% de chance de ser descartado.
- Quando ambos os conjuntos estiverem cheios, cada novo documento que não tiver sido descartado terá 80% de chance de ir para o conjunto de treinamento e 20% de chance de ir para o conjunto de teste, substituindo o documento existente mais antigo em qualquer um dos conjuntos.
Etapa 2. Quando uma sessão de aprendizado é iniciada
- Se esta for a primeira sessão de aprendizado após a publicação da versão do Skill, ela começará quando o conjunto de documentos receber 10% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 10 novos documentos.
- Se a última sessão de aprendizado foi bem-sucedida e o Skill foi atualizado, uma nova sessão começará nas mesmas condições da primeira.
- Se a última sessão de aprendizado foi malsucedida e o Skill não foi atualizado, uma nova sessão de aprendizado começará quando o conjunto de documentos receber 5% de novos documentos. Por exemplo, se houver um total de 95 documentos no conjunto, uma nova sessão de aprendizado começará após a adição de 5 novos documentos.
Etapa 3. Como a skill é testada
A skill será atualizada quando o aprendizado online resultar em pelo menos 1% de aumento na precisão.
A precisão da skill será testada da seguinte forma:
- Se houver pelo menos 20 documentos no conjunto de teste, a skill será testada nesse conjunto.
- Se houver menos de 20 documentos no conjunto de teste:
- Uma Skill de Documento será testada tanto no conjunto de treinamento quanto no de teste.
- Para uma Skill de Classificação, se não houver documentos suficientes no conjunto (se cada classe tiver menos de cinco documentos), a skill será testada tanto no conjunto de treinamento quanto no de teste. Se houver documentos suficientes, será utilizada a validação cruzada para avaliar a precisão.
Depois disso, mais documentos são coletados e uma nova sessão de aprendizado é iniciada.
Observação: O aprendizado online não cria uma nova versão da skill. A alteração de versão só ocorre quando uma skill é publicada. Consulte Publicação de uma skill.