Pular para o conteúdo principal
Para treinar e testar uma skill, você precisa de um conjunto de documentos rotulados, ou seja, documentos em que as localizações dos campos e seus tipos de dados estejam explicitamente indicados. A maneira mais direta de obter esse conjunto é rotular alguns documentos manualmente, mas isso pode ser demorado — especialmente se você pretende usar Deep Learning, que exige grandes conjuntos de documentos rotulados. Para economizar tempo e esforço, a ABBYY oferece várias maneiras de reutilizar documentos rotulados de outras skills ou de resultados de processamento revisados manualmente.

Rotulando documentos manualmente

Rotule cada documento enviado marcando as posições de todos os campos e especificando os tipos de dados que eles devem conter. Para garantir resultados de treinamento confiáveis, siga estas diretrizes.

Importando Documentos Rotulados de uma Pasta

Documentos rotulados também podem ser obtidos nas seguintes fontes: Em cada caso, será necessário exportar os documentos rotulados para uma pasta. Em seguida, você poderá importar os documentos com rotulagem dessa pasta e usá-los para treinar sua skill.

Conjuntos de Treinamento de Skill

Ao publicar uma skill para uso em produção, normalmente você removerá o conjunto de treinamento, deixando apenas alguns documentos de exemplo na versão publicada. Você também pode exportar o conjunto de treinamento para uma pasta caso pretenda usar o mesmo conjunto para treinar uma nova versão da sua skill. Para exportar os documentos e seus rótulos para uma pasta, clique no ícone de mais ao lado do nome do conjunto de documentos e selecione Exportar conjunto com rótulos. A pasta de destino conterá os seguintes arquivos e subpastas:
  • documentdefinition.json.
  • skillsettings.json.
  • Uma subpasta <Document name> contendo as imagens dos documentos, documentinfo.json e arquivos labeling.json de cada documento.

Resultados de processamento revisados manualmente

Quando os resultados do processamento são corrigidos por revisores humanos, é criado um conjunto de documentos rotulados. Para reutilizar esses documentos rotulados, configure a exportação dos dados de campo para JSON com a opção Valores, metadados e estrutura de campo para cada documento habilitada e a exportação das imagens do documento em qualquer formato de imagem. A pasta de destino conterá uma subpasta separada para cada transação. Cada subpasta <Transaction ID> conterá o seguinte:
  • O arquivo <Applied skill name>.json com os dados de campo.
  • Imagens exportadas, dependendo do formato escolhido: <Applied skill name>.pdf, <Applied skill name>.tiff ou a subpasta <Applied skill name>/Pages com arquivos page_*.jpg para cada página.

FlexiCapture

Você pode reutilizar documentos que foram previamente rotulados no FlexiCapture. Para mais detalhes, consulte Importando documentos rotulados do FlexiCapture.

Como importar

Para importar documentos rotulados da pasta criada durante a exportação, selecione o conjunto All Documents, clique no menu ao lado do botão Upload e, em seguida, escolha a opção Import Labeled Documents From Folder… na lista. Depois, selecione a pasta criada anteriormente. Observação: Não faça alterações na pasta criada durante a exportação. Se você modificar a estrutura de subpastas ou renomear algum arquivo, o procedimento de importação poderá falhar.

Como duplicatas são tratadas

Se algum dos documentos importados tiver o mesmo nome de um documento existente, o Advanced Designer perguntará se você deseja atualizar a rotulagem do documento existente ou importar a duplicata como um novo documento. Se você selecionar Atualizar rotulagem:
  • No caso de fields com nomes idênticos, sua localização e configurações no documento existente serão substituídas pelas do documento importado.
  • Quaisquer campos presentes no documento importado, mas ausentes no documento existente, serão adicionados ao documento existente.
Se você selecionar Importar como novos documentos, as duplicatas serão renomeadas e importadas mantendo sua rotulagem.