Pular para o conteúdo principal
Depois de criar uma Skill de Documento, siga estas etapas para configurar a skill:
  1. Faça upload dos documentos que você planeja usar para treinar e testar o classificador (cada arquivo deve conter apenas uma imagem de documento). Para fazer upload dos seus documentos, acesse a guia Documents no Skill Designer e clique no botão Upload documents localizado no centro do designer, na barra de ferramentas ou no painel Actions. Enquanto os documentos estão sendo carregados, um indicador de progresso é exibido na parte superior do Skill Designer, à direita dos favoritos. A dica de ferramenta do indicador informa quantos documentos ainda precisam ser carregados e processados. Você pode abrir uma janela de visualização do documento clicando no ícone à esquerda do nome do documento. A largura padrão dessa janela é 35% da largura da janela do navegador. Se necessário, você pode aumentar a largura da janela de visualização para até 80% da largura da janela do navegador, arrastando a borda esquerda da janela de visualização. As larguras definidas pelo usuário são preservadas até que o cache do navegador seja limpo.
  2. Nos seus documentos de treinamento, rotule todos os campos dos quais os dados devem ser extraídos, especificando sua localização na imagem. Você também pode adicionar regras de validação e parâmetros da skill, se necessário. Para rotular campos nos seus documentos de treinamento, acesse a guia Editor do Skill Designer. Você pode fazer isso clicando no nome da guia ou selecionando um ou mais documentos da lista e clicando em Label Fields and Create Business Rules no painel Actions.
  3. Treine sua skill e analise a precisão da extração. Corrija eventuais erros. Para iniciar o treinamento da sua skill, clique no botão Train no painel Actions. Quando o treinamento for concluído, será exibido ao lado do botão Train: Completed. Você pode interromper o treinamento da skill clicando em Cancel abaixo do botão Train no painel Actions.
  4. Repita as etapas de 1 a 3 até ficar satisfeito com os resultados.
  5. Publique sua skill de produção no Skill Catalog para disponibilizá-la para uso.
  6. Se necessário, você pode derivar outras skills a partir da sua skill. Essas skills herdam todas as regras e campos das suas skills base. Além disso, as skills derivadas podem ser atualizadas sem interrupções para a versão mais recente das skills base, preservando todas as alterações que você fez.

Configurando uma Skill de Documento para processar documentos estruturados

ABBYY Vantage oferece um modo de aprendizado de máquina para processar documentos estruturados, ou seja, documentos em que a posição dos campos é a mesma em cada instância. Exemplos incluem questionários, formulários de inscrição e declarações de imposto. Esse modo pode lidar até mesmo com documentos que têm várias variantes, como o Form 1040 do IRS para diferentes anos, em que o conjunto e a posição dos campos variam ligeiramente de um ano para outro. Cada uma dessas variantes representa um documento estruturado distinto, e você deve enviar um formulário em branco para cada uma. Para configurar uma skill para processar documentos estruturados, siga estas etapas:
  1. Crie uma nova Skill de Documento e ative a opção Documentos de formulário fixo para essa skill. Fixed Forms Toggle
  2. Envie um formulário em branco de amostra para cada variante do seu documento. Para isso, acesse a guia Formulário em branco no Skill Designer e clique no botão Carregar formulário em branco localizado no centro do designer, na barra de ferramentas ou no painel Ações. Se você não tiver um formulário em branco, pode enviar um formulário preenchido e marcá-lo como formulário em branco.
Observação: Uma skill pode lidar com até 10 variantes diferentes de um mesmo formulário (por exemplo, variantes do Form 1040 do IRS para anos diferentes).
  1. Rotule os campos dos quais os dados devem ser extraídos.
  2. Nas configurações do campo, habilite a opção Eliminar fundo do campo para campos em que o fundo possa afetar o reconhecimento.
  3. No painel Ações, clique em Treinar.
  4. Clique na guia Conjunto de teste e envie documentos de teste preenchidos. Verifique se todos os campos estão rotulados corretamente em cada documento. Se a posição de algum campo não corresponder à de nenhum dos formulários em branco enviados, adicione um formulário em branco de amostra para essa variante do documento.
  5. No painel Ações, teste sua skill. Quando a operação for concluída, revise os resultados. Se não ficar satisfeito com os resultados, ajuste a rotulagem e treine novamente.
  6. Publique sua skill no Skill Catalog para disponibilizá-la para uso.
Fixed Form Tabs Abas exibidas no Skill Designer para uma skill que processa documentos estruturados Durante o processamento dos seus documentos, você pode descobrir que eles devem ser tratados mais adequadamente como semiestruturados, e não como estruturados. Nesse caso:
  1. Clique no ícone à direita do nome da skill no Skill Designer.
  2. Desative a opção Documentos de formulário fixo.
Observação: Todos os campos rotulados são preservados.
  1. Treine novamente sua skill.
Se você editar sua skill no Advanced Designer e combinar a atividade Forms com outras atividades, a opção Documentos de formulário fixo será desabilitada no Vantage e você não poderá mais editar a skill fora do Advanced Designer.

Trabalhando com tabelas e grupos repetidos

Ao processar documentos estruturados, o Vantage pode lidar com tabelas e grupos repetidos se o número máximo de linhas da tabela ou instâncias do grupo for conhecido de antemão e os limites da tabela ou do grupo forem fixos. Você deve identificar todas as linhas que possam ocorrer em todas as variantes do formulário.
Observação: Apenas as linhas com dados são exibidas nos resultados do processamento. Quaisquer linhas vazias são ignoradas.
Se o número de linhas ou instâncias em um grupo não for conhecido de antemão, você deve usar outra tecnologia do Vantage; consulte Processamento de documentos estruturados.
Dica: No momento, apenas tabelas com valores de texto podem ser processadas. Se sua tabela tiver colunas com caixas de seleção ou códigos de barras, use um grupo repetido.

Configurando um idioma de reconhecimento

Ao processar um documento, o Vantage seleciona um idioma de processamento a partir de uma lista de idiomas especificados. Ao configurar uma nova skill, os quatro idiomas a seguir são selecionados por padrão: inglês, francês, alemão e espanhol. A lista de idiomas de reconhecimento pode ser modificada clicando em icon à direita do nome da skill no Skill Designer. Os idiomas exibidos na caixa de diálogo de configurações são ordenados em ordem alfabética. Os idiomas selecionados são exibidos no topo da lista. Pelo menos um idioma precisa estar selecionado. Para fechar a caixa de diálogo de configurações, clique em Save para manter as alterações ou em Cancel para descartá-las.
Nota: O número de idiomas selecionados pode afetar a velocidade de processamento do documento. Se você tiver plena certeza de quais idiomas o Vantage encontrará em seus documentos, recomendamos restringir a seleção apenas a esses idiomas específicos.
Você pode modificar a lista de idiomas de reconhecimento de uma skill mesmo que ela já tenha sido treinada. Para aplicar as alterações, envie os documentos novamente e treine a skill novamente.

Configurando o modo de Aprendizado Online

O Aprendizado Online está disponível para Skills de Documento e para Skills de Classificação. O serviço de Aprendizado Online reúne documentos em um conjunto de treinamento e, em seguida, treina a Skill novamente usando os documentos coletados. Em Configurações da Skill de Documento, estão disponíveis os seguintes modos de Aprendizado Online:
  • Coletar e aprender. Opção padrão.
  • Apenas coletar. Quando for necessário coletar documentos sem treinamento no Skill Designer.
Para habilitar a coleta de documentos sem treinamento, clique no icon à direita do nome da Skill no Skill Designer e selecione o modo Apenas coletar na caixa de diálogo de configurações. Esse modo permite revisar os documentos adicionados ao conjunto de treinamento antes de reentreinar a Skill. Modo Apenas Coletar

Veja também