Pular para o conteúdo principal
A atividade Deep Learning for NLP foi criada para treinar a skill a extrair campos de documentos não estruturados usando tecnologia de Processamento de Linguagem Natural (NLP). A atividade Deep Learning só pode ser configurada para um campo que tenha sido previamente extraído por outra atividade. Por exemplo, você pode extrair um parágrafo de texto usando uma atividade de Segmentation e então configurar uma atividade de Deep Learning para extrair campos desse parágrafo.
Observação: Esta atividade oferece suporte apenas a campos do tipo Text.

Requisitos de treinamento

Como as atividades de Deep Learning são treinadas usando rotulagem de referência, é importante que a localização dos campos seja indicada corretamente em todas as imagens de documento. Quanto maior o número de documentos rotulados no conjunto de treinamento, maior a qualidade da extração de campos. O número recomendado de documentos de exemplo é o seguinte:
  • Para documentos de alta variabilidade, são necessários pelo menos 150 documentos de exemplo (2–3 documentos de exemplo por variante).
  • Para documentos de baixa variabilidade, podemos começar o treinamento com 1 documento de exemplo, mas são necessários pelo menos 2–3 documentos de exemplo por variante.

Usando conjuntos de documentos separados

Você pode usar um conjunto de documentos separado para treinar sua atividade de Deep Learning. Para isso, selecione a atividade de Deep Learning na lista suspensa ao lado do nome da skill. Em seguida, na lista suspensa à esquerda do botão Upload, selecione o conjunto de documentos desejado ou clique em Create Set… para criar um novo. Você pode fazer upload, excluir e girar documentos nesta guia, conforme descrito na seção Documents.

Idiomas compatíveis

Idiomas compatíveis: inglês, francês, alemão, japonês, russo, espanhol, italiano, português (padrão) e holandês.

Configurando uma atividade de Deep Learning

Para configurar uma atividade de Deep Learning, faça o seguinte:
  1. Na guia Atividades, adicione uma atividade de Deep Learning ao fluxo de processamento de documentos. Observe que sua atividade de Deep Learning deve ser posicionada após a atividade que extrair o campo usado como origem por essa atividade de Deep Learning.
  2. Use a lista suspensa Campo no painel Propriedades da atividade para selecionar o campo de origem correspondente ao fragmento de texto não estruturado do qual os campos devem ser extraídos.
  3. Selecione os campos que devem ser extraídos do campo de origem. Você pode selecionar campos que estejam no mesmo nível de aninhamento que o campo de origem ou em um nível logo abaixo dele.
  4. Clique em Activity Editor e vá para a guia Campos para rotular seus documentos, especificando as regiões para os campos que devem ser extraídos do campo de origem. O processo de rotulagem no Activity Editor é idêntico ao processo de rotulagem de documentos comum, com uma exceção — os campos a serem extraídos pela atividade de Deep Learning devem estar localizados dentro da região do campo de origem.
Use as diretrizes a seguir para determinar o tamanho do conjunto de documentos:
  • A atividade de Deep Learning para NLP pode ser iniciada com 1 documento de amostra, mas são necessários pelo menos 2 a 3 documentos de amostra por variante.
  • Se o conjunto de treinamento contiver entre 1 e 150 documentos, você poderá iniciar o treinamento da sua atividade, mas o Advanced Designer exibirá um aviso dizendo “Recomendamos adicionar pelo menos 150 documentos”.
  • Se o conjunto de treinamento contiver entre 150 e 10.000 documentos, você poderá iniciar o treinamento da sua atividade imediatamente. Este é o número recomendado de documentos para ter no seu conjunto de treinamento.
  • Se o conjunto de treinamento contiver mais de 10.000 documentos, o Advanced Designer exibirá um aviso informando que a skill pode se tornar instável.
  1. Clique em Train Activity para treinar a atividade.
  2. Depois que a atividade tiver sido treinada, o teste da atividade será iniciado automaticamente. Após a conclusão do teste, vá até a guia Resultados e analise os resultados de extração de campos da sua atividade. As estatísticas exibidas na guia Resultados são idênticas às estatísticas gerais da skill exibidas na guia Results. Se necessário, faça as alterações desejadas na sua rotulagem e treine a atividade novamente.
A atividade só pode ser treinada e testada usando documentos com rotulagem confirmada. Os documentos têm rotulagem não confirmada se a rotulagem de referência tiver sido gerada automaticamente com base na rotulagem prevista, a menos que você copie a rotulagem prevista para a referência usando a opção correspondente no menu de contexto do documento. Você pode verificar o status de rotulagem de cada documento na guia Documentos. Para confirmar a rotulagem de um documento, você deve revisá-lo na guia Campos.