Pular para o conteúdo principal
Você pode usar um conjunto de documentos separado para treinar sua atividade de Segmentação. Para isso, selecione a atividade de Segmentação na lista suspensa ao lado do nome da skill. Em seguida, na lista suspensa à esquerda do botão Upload, selecione o conjunto de documentos necessário ou clique em Create Set… para criar um novo. Você pode fazer upload, excluir e girar documentos nesta guia, conforme descrito na seção Documents. Para configurar uma atividade de Segmentação:
  1. Na guia Activities, adicione uma atividade de Segmentação ao fluxo de processamento de documentos. Observe que sua atividade de Segmentação deve preceder a atividade que extrairá os campos dos segmentos de texto.
  2. No painel Activity Properties, selecione todos os campos que correspondem aos segmentos a serem extraídos.
Nota: Somente campos do tipo Text com o tipo de dados definido como Text são suportados.
  1. Clique em Activity Editor. Faça outras modificações na rotulagem do documento na guia Fields, se necessário.
  2. Clique em Train Activity. O treinamento pode ser realizado nos modos Fast ou Thorough.
    • O modo Fast é selecionado por padrão. Esse modo funciona mesmo em conjuntos pequenos de documentos e a atividade será treinada rapidamente.
    • Se você não estiver satisfeito com os resultados obtidos no modo Fast, considere alternar para o modo Thorough, que treina um modelo de Deep Learning. Esse modo requer mais documentos no conjunto de treinamento e leva mais tempo para treinar, mas poderá apresentar melhor desempenho em uma grande variedade de documentos. O conjunto de documentos deve conter pelo menos 50 documentos rotulados, mas recomendamos ter pelo menos 150 documentos rotulados. Para alternar para o modo Thorough, use o menu suspenso ao lado do botão Train Activity.
    • Você pode testar ambos os modos e escolher aquele que funciona melhor para seus documentos.
Nota: O modo Thorough funcionará apenas com documentos em inglês.
  1. Após o treinamento da atividade, o teste será iniciado automaticamente. Quando o teste for concluído, acesse a guia Results e analise os resultados de extração de campos da sua atividade. As estatísticas exibidas na guia Results são idênticas às estatísticas gerais da skill exibidas na guia Results. Se necessário, faça as alterações necessárias na sua rotulagem e treine a atividade novamente.
Nota: A atividade só pode ser treinada e testada usando documentos com rotulagem confirmada. Os documentos têm rotulagem não confirmada se a rotulagem de referência foi gerada automaticamente com base na rotulagem prevista, a menos que você copie a rotulagem prevista para a de referência usando a opção correspondente no menu de contexto do documento. Você pode verificar o status de rotulagem de cada documento na guia Documents. Para confirmar a rotulagem de um documento, revise-o na guia Fields.
Idiomas compatíveis: inglês, russo, alemão, francês, espanhol, italiano, português (padrão), japonês e holandês.