Pular para o conteúdo principal
Você pode usar um conjunto de documentos separado para treinar sua atividade de Segmentação. Para isso, selecione a atividade de Segmentação na lista suspensa ao lado do nome da skill. Em seguida, na lista suspensa à esquerda do botão Upload, selecione o conjunto de documentos necessário ou clique em Create Set… para criar um novo. Você pode enviar, excluir e girar documentos nesta guia, conforme descrito na seção Documents. Para configurar uma atividade de Segmentação:
  1. Na guia Activities, adicione uma atividade de Segmentação ao fluxo de processamento de documentos. Observe que sua atividade de Segmentação deve preceder a atividade que extrairá os campos dos segmentos de texto.
  2. No painel Activity Properties, selecione todos os campos que correspondem aos segmentos a serem extraídos.
Nota: Somente campos do tipo Text que têm o tipo de dados definido como Text são compatíveis.
  1. Clique em Activity Editor. Faça as modificações necessárias na rotulagem do documento na guia Fields, se preciso.
  2. Clique em Train Activity. O treinamento pode ser realizado nos modos Fast ou Thorough.
    • O modo Fast é selecionado por padrão. Esse modo funciona mesmo com conjuntos de documentos pequenos e a atividade será treinada rapidamente.
    • Se você não estiver satisfeito com os resultados obtidos no modo Fast, considere alternar para o modo Thorough, que treina um modelo de Deep Learning. Esse modo requer mais documentos no conjunto de treinamento e leva mais tempo para treinar, mas pode apresentar melhor desempenho em uma ampla variedade de documentos. O conjunto deve conter pelo menos 50 documentos rotulados, mas recomendamos ter pelo menos 150. Para alternar para o modo Thorough, use o menu suspenso ao lado do botão Train Activity.
    • Talvez você queira testar os dois modos e escolher o que funciona melhor para seus documentos.
Nota: O modo Thorough funciona apenas com documentos em inglês.
  1. Depois que a atividade for treinada, o teste começará automaticamente. Após a conclusão do teste, acesse a guia Results e analise os resultados de extração de campos da sua atividade. As estatísticas exibidas na guia Results são idênticas às estatísticas gerais da skill exibidas na guia Results. Se necessário, faça os ajustes na rotulagem e treine a atividade novamente.
Nota: A atividade só pode ser treinada e testada com documentos cuja rotulagem esteja confirmada. Os documentos têm rotulagem não confirmada se a rotulagem de referência tiver sido gerada automaticamente com base na rotulagem prevista, a menos que você copie a rotulagem prevista para a referência usando a opção correspondente no menu de contexto do documento. Você pode verificar o status da rotulagem de cada documento na guia Documents. Para confirmar a rotulagem de um documento, revise-o na guia Fields.
Idiomas compatíveis: inglês, russo, alemão, francês, espanhol, italiano, português (padrão), japonês e holandês.