Pular para o conteúdo principal
A guia Results no Skill Designer de Documento contém estatísticas de extração de campos para Skills de Documento. Analisar essas estatísticas ajuda a entender como melhorar a qualidade dos dados extraídos. Todos os campos extraídos pela skill são exibidos na coluna Fields. Os campos que fazem parte de grupos de campos são reunidos em listas suspensas recolhidas nomeadas conforme seus respectivos grupos. Document Skill Results As seguintes estatísticas de extração de campos estão disponíveis:
  • A coluna Accuracy mostra a porcentagem de campos com valores extraídos corretamente (a linha ALL FIELDS), bem como a porcentagem de valores extraídos corretamente para campos individuais.
    • Os valores de Accuracy para campos individuais são calculados como Accuracy = Correct / (Correct + Recognition Issue + Located Incorrectly + Not Detected).
    • O valor de Accuracy de ALL FIELDS é calculado usando a mesma fórmula, mas os números no denominador são agregados em todos os campos.
  • A coluna Correct mostra o número de instâncias de campo cujo valor extraído corresponde ao valor de referência.
  • A coluna Recognition Issue mostra o número de instâncias de campo detectadas no documento, mas não reconhecidas corretamente.
  • A coluna Located Incorrectly mostra o número de instâncias de campo cujos valores diferem dos valores previstos porque suas regiões foram detectadas em locais diferentes dos especificados na rotulagem.
  • A coluna Not Detected mostra o número de instâncias de campo não detectadas.
  • A coluna Frequency in Documents mostra a porcentagem de documentos que contêm o campo em questão.
Dica: Por padrão, essas estatísticas são exibidas para todos os campos. Você pode ocultar campos individuais na lista e visualizar as estatísticas apenas dos campos desejados. Para isso, clique no ícone de filtro no topo da coluna Fields e selecione os campos desejados.

Revisando campos extraídos com erros

Você pode visualizar documentos que contêm campos extraídos com erros. Para isso, clique em uma estatística na coluna Recognition Issue, Located Incorrectly ou Not Detected. Exemplo: Clicar na estatística na coluna Recognition Issue do campo Order Date abrirá uma guia onde você pode visualizar os documentos nos quais o campo Order Date foi extraído com um problema de reconhecimento. Na guia Result Review que é aberta, você pode revisar os resultados de extração, os erros de rotulagem do documento e os problemas de reconhecimento. Você também pode comparar a rotulagem criada ao configurar a Skill de Documento com a rotulagem criada durante o treinamento. Os Documents podem ser visualizados nesta guia em um dos seguintes modos:
  • O modo Reference exibe a rotulagem de referência criada ao configurar a skill (ou seja, antes de ser treinada), bem como os valores de campo extraídos usando essa rotulagem. Valores e regiões de campo podem ser editados nesse modo.
  • O modo Predicted exibe os valores e as regiões de campo obtidos ao processar documentos. Valores e regiões de campo não podem ser editados nesse modo.
  • O modo Difference exibe as diferenças entre a rotulagem de referência e a prevista. Valores e regiões de campo idênticos são exibidos em verde, enquanto valores e regiões de campo diferentes são exibidos em vermelho. Valores e regiões de campo não podem ser editados nesse modo.
Diferenças da Skill de Documento Você pode alternar entre esses três modos clicando em suas guias na barra de ferramentas. Se um campo foi rotulado incorretamente ao configurar a skill e o resultado correto foi obtido ao processar um documento, você pode corrigir a rotulagem de referência. Para isso, alterne para o modo Difference e clique no icon localizado acima do valor do campo que contém o erro de rotulagem: Problemas de reconhecimento A caixa Field in Reference conterá o valor extraído usando a rotulagem de referência. Clique em Copy from Predicted para substituir o valor incorreto pelo valor extraído ao processar o documento.
Dica: Um problema de reconhecimento significa que um ou mais caracteres no valor do campo não foram reconhecidos corretamente. Para corrigir um erro desse tipo, modifique as propriedades do campo para que tais caracteres sejam interpretados corretamente.
Exemplo: Se um campo puder conter apenas números, defina seu tipo de dados como “Number”. Isso evitará, por exemplo, que o número “1” seja reconhecido como “l” (l minúsculo) ou “I” (I maiúsculo), quaisquer um dos quais pode se parecer muito com “1” em um documento. Se a caixa Field in Reference contiver o valor correto, mas o resultado do processamento não estiver correto, recomendamos aumentar o número de documents no conjunto e retreinar a skill. Para ir para o próximo documento que contém o mesmo tipo de erro no mesmo campo, clique em Go to Next Document no painel Actions.