Configurando uma Atividade de Deep Learning

Você pode usar um conjunto de documentos independente para treinar sua atividade de Deep Learning. Para isso, selecione a atividade de Deep Learning na lista suspensa ao lado do nome da skill. Em seguida, na lista suspensa à esquerda do botão Upload, selecione o conjunto de documentos desejado ou clique em Create Set… para criar um novo. Você pode fazer upload, excluir e rotacionar documentos nesta guia, conforme descrito em Documents.

Etapa 1. Adicionar a Atividade

Na guia Activities, adicione uma atividade de Deep Learning para documentos semiestruturados ao fluxo de processamento de documentos.

Etapa 2. Selecionar campos

No painel Propriedades da Atividade, selecione os campos que serão treinados usando esta atividade. Você pode selecionar um dos seguintes:

Até 50 campos do tipo Text, independentemente do seu nível de aninhamento.
Uma tabela com até 32 colunas.

Se você precisar treinar mais campos, poderá adicionar mais atividades de Deep Learning e usá-las para selecionar campos adicionais. Por exemplo, se você precisar treinar vários campos Text e uma tabela, crie duas atividades de Deep Learning. Os seguintes campos não podem ser treinados:

Campos de tipo que não seja Text
Grupos com vários itens, tabelas ou campos Text com vários itens aninhados em um grupo com vários itens
Tabelas com mais de 32 colunas

Você precisará configurar a extração desses campos usando outras atividades, por exemplo, uma atividade Extraction Rules.

Etapa 3. Rotular documentos

Clique em Activity Editor e acesse a guia Campos para rotular seus documentos. O processo de rotulagem no Activity Editor é idêntico ao processo regular de rotulagem de documentos. Use as diretrizes a seguir para determinar o tamanho do conjunto de documentos:

Se o conjunto de treinamento contiver apenas o mínimo de 10 documentos, você poderá iniciar o treinamento de deep learning, mas é recomendável fazer upload de documentos adicionais para obter maior precisão.
Se o seu conjunto de treinamento incluir apenas 10 documentos, você ainda poderá começar a treinar seu modelo. No entanto, o Advanced Designer exibirá um aviso recomendando que você adicione mais de 500 documentos rotulados para obter resultados de treinamento ideais.
Se o seu conjunto de treinamento contiver entre 500 e 10.000 documentos, você poderá começar a treinar sua atividade imediatamente. Este é o número recomendado de documentos para ter em seu conjunto de treinamento.
Se o conjunto de treinamento contiver mais de 10.000 documentos, o Advanced Designer exibirá um aviso informando que a skill pode se tornar instável.

Etapa 4. Treinar a Atividade

Depois de enviar e rotular seus documentos, clique em Train Activity.

Etapa 5. Monitorar o Progresso do Treinamento

Acesse a guia Resultados para avaliar o progresso do treinamento. Se necessário, ajuste a duração do treinamento ou interrompa-o. Para mais informações, consulte Monitoramento e ajuste do treinamento de atividades.

Etapas pós-treinamento

Quando a atividade tiver sido treinada, o teste da atividade será iniciado automaticamente. Se você interromper o treinamento, será solicitado que inicie o teste da atividade manualmente. Quando o teste for concluído, analise os resultados de extração de campos na seção Activity Test Results da aba Results. As estatísticas dessa atividade são idênticas às estatísticas gerais da skill exibidas na aba Results. Se você não estiver satisfeito com a qualidade da extração de campos, você terá as seguintes opções:

Adicionar mais documentos ao conjunto de treinamento e retomar o processo de treinamento. Os resultados de treinamento obtidos até o momento serão preservados e a rede neural será treinada adicionalmente usando o conjunto de documentos atualizado.
Ajustar a rotulagem e reiniciar o treinamento. Os resultados de treinamento obtidos até o momento serão descartados e a rede neural será treinada do zero.
Criar um contêiner de Hypothesis Filtering com uma atividade de Extraction Rules, o que permitirá definir condições para a saída da atividade Deep Learning.

A atividade só pode ser treinada e testada usando documentos com rotulagem confirmada. Os documentos têm rotulagem não confirmada se a rotulagem de referência tiver sido gerada automaticamente com base na rotulagem prevista, a menos que você copie a rotulagem prevista para a referência usando a opção correspondente no menu de contexto do documento. Você pode verificar o status da rotulagem de cada documento na aba Documents. Para confirmar a rotulagem de um documento, você deve revisá-lo na aba Fields.

A partir do Advanced Designer v. 2.3.1, as limitações de campos para a atividade Deep Learning foram alteradas. Se sua skill usar uma atividade Deep Learning treinada que extraia mais de 50 campos, você poderá continuar processando documentos com essa skill. No entanto, quando você abrir essa skill para edição, a atividade Deep Learning existente será dividida em várias atividades Deep Learning, que talvez seja necessário treinar novamente. Você também terá que rotear as atividades no fluxo de trabalho de processamento de documentos.

Advanced Designer

​Etapa 1. Adicionar a Atividade

​Etapa 2. Selecionar campos

​Etapa 3. Rotular documentos

​Etapa 4. Treinar a Atividade

​Etapa 5. Monitorar o Progresso do Treinamento