Pular para o conteúdo principal
Você pode adicionar um campo de texto das seguintes maneiras:
  • Especifique uma região do campo na imagem do documento clicando no valor de um campo (destacado em verde ao passar o mouse) ou delimitando uma região retangular ao redor do valor do campo. Depois disso, o novo campo aparecerá no formulário de dados. Você pode modificar o nome do campo clicando duas vezes nele no formulário de dados ou clicando nele nas propriedades do campo. Você pode selecionar o nome inteiro clicando três vezes. Para abrir as propriedades do campo, clique no botão Opções do Field.
  • Adicione um novo campo ao formulário de dados clicando em Adicionar Field na barra de ferramentas e, em seguida, delimitando a região do campo na imagem. Isso definirá, no formulário de dados, como valor do campo os dados detectados dentro da região selecionada.
Você também pode adicionar novas regiões de campo de texto a campos existentes no formulário de dados selecionando o campo apropriado no formulário de dados e, em seguida, clicando no local correspondente na imagem do documento. Se um campo precisar conter mais de uma palavra, selecione várias palavras ao delimitar toda a região do campo.

Adicionando um campo de texto com várias regiões

Alguns campos de texto exigem várias regiões em um único documento pelos seguintes motivos:
  • Alguns valores de campo podem começar em uma linha de texto e terminar em outra.
  • Alguns valores de campo podem começar em uma página e terminar em outra.
Para adicionar um campo de texto com várias regiões, faça o seguinte:
  • Adicione um campo usando um dos métodos descritos acima.
  • Mantenha a tecla Shift pressionada e selecione regiões adicionais para o campo adicionado.
As regiões de um campo de texto também podem ser anotadas:
  • Em páginas diferentes
  • Dentro de outra região do campo (nesse caso, a região interna será destacada com uma cor mais escura e, se estiver em foco, será destacada em amarelo).

Propriedades gerais do campo de texto

  • Nome do campo. O nome exclusivo do campo em uma skill específica. O nome do campo não pode conter caracteres especiais como ponto final, vírgula, barra, dois-pontos, asterisco, ponto de interrogação, aspas, sinais de menor que, maior que ou barra vertical. O comprimento máximo permitido para um nome de campo é de 90 caracteres.
  • Tipo de dados. O tipo de dado que um campo contém. Este é um parâmetro crucial do campo de texto, pois afeta a precisão do reconhecimento. Cada tipo de dado tem seu próprio conjunto de restrições para o valor do campo, reduzindo as possibilidades para cada caractere e tornando a extração de dados mais precisa.
Tipo de dadosDescrição
TextPode conter letras latinas e cirílicas, dígitos, ideogramas e caracteres especiais.
DateData e hora em qualquer formato. Podem ser usados como separadores: ponto (.), espaço ( ), hífen (-), barra invertida () e barra (/).
NumberPode conter dígitos, separadores decimais e o caractere de porcentagem (%). Podem ser usados como separadores decimais: ponto (.), vírgula (,), hífen (-), sinal de igual (=) e espaço ( ). Podem ser usados como separadores de milhar: ponto (.), vírgula (,), aspa simples (’) e espaço ( ).
MoneyContém um valor numérico e um símbolo de moeda. O símbolo da moeda pode ser colocado antes ou depois do montante.
Exemplo: A letra minúscula “l” (L), a letra maiúscula “I” (i) e o dígito “1” podem ter aparência semelhante. Se um caractere com essa aparência for detectado em um campo Number ou Currency Amount, ele será reconhecido como “1”, já que campos desse tipo não podem conter letras.
  • Permitir vários itens. Especifica se o campo é repetível ou não. Instâncias de campos repetíveis podem se referir a vários objetos do mesmo tipo. Por exemplo, nomes de filhos ou números de conta.
  • Campo obrigatório. Especifica que o valor do campo não pode ficar em branco. Ativar essa propriedade adiciona uma regra de validação à página. Se o campo ficar vazio após a extração, o documento será enviado para revisão manual com um erro.
  • Campo-chave. Especifica se o valor do campo é usado para pesquisar documentos.
  • Campo de dimensão. Especifica se o valor do campo é usado para obter informações detalhadas sobre transações da skill no Skill Monitor.

Aparência do texto

Este grupo de propriedades refere-se à aparência dos caracteres esperados no campo.
  • Origem do texto. Especifica se o campo pode conter apenas caracteres impressos, apenas manuscritos ou ambos. Se você adicionar um campo marcando uma região retangular no documento, o valor dessa propriedade será definido com base nos caracteres encontrados nessa região. Se você adicionar um campo clicando em Add Field, o valor dessa propriedade será definido como Printed por padrão.
Você pode encontrar a lista de idiomas com suporte a reconhecimento de texto manuscrito aqui.
Observação: O reconhecimento de texto manuscrito é habilitado por padrão para novas Skill de Documento. Para desabilitar ou habilitar novamente, clique no ícone de configurações da skill à direita do nome da skill e, em seguida, acesse a guia Languages e selecione a opção Handwritten na seção Text Appearance.
  • Eliminar fundo do campo. Use esta opção para melhorar a precisão do reconhecimento quando o campo tiver moldura, caixas para caracteres individuais ou texto de preenchimento. Ao habilitar esta opção, você deve enviar o documento do formulário em branco que será usado como modelo para o reconhecimento do fundo e rotular o campo correspondente no formulário em branco. O documento do formulário em branco aparece no Conjunto de Documentos e é marcado com um ícone.
  • Fontes especiais. Se for esperado que o campo contenha texto digitado em uma fonte específica, você pode usar esta opção para selecionar o tipo de fonte, o que melhorará a precisão do reconhecimento. É possível selecionar várias fontes.

Fontes compatíveis

FonteDescriçãoAmostra de fonte
FaxFonte normalmente usada por aparelhos de fax.Fax Font
GothicTextos impressos em tipo gótico.Gothic Font
IndexConjunto especial de caracteres que inclui apenas dígitos no estilo de CEP.Index Font
Matrix printerTextos impressos em impressora matricial.Matrix Font
MICR CMC-7Fonte MICR especial do tipo código de barras (CMC-7).CMC-7 Font
MICR E-13BConjunto especial de caracteres numéricos impressos com tinta magnética. Caracteres MICR (Magnetic Ink Character Recognition) são encontrados em diversos documentos, incluindo cheques.E-13B Font
OCR-AFonte monoespaçada projetada para Optical Character Recognition (OCR). Ampliamente utilizada por bancos, administradoras de cartões e negócios semelhantes.OCR-A Font
OCR-BFonte projetada para Optical Character Recognition (OCR).OCR-B Font
ReceiptO reconhecedor espera texto de baixa qualidade, geralmente em fonte monoespaçada ou normal, típica de recibos.Receipt Font
TypewriterTextos datilografados.Typewriter Font

Propriedades adicionais do campo de texto

As propriedades adicionais dependem do tipo de dado especificado para o campo.

Texto

O grupo de configurações Value:
  • Comprimento máximo. O número máximo permitido de caracteres no campo. Se o número de caracteres no valor extraído exceder esse limite, uma mensagem de erro será exibida. Se houver uma etapa de revisão manual no processo, o documento será enviado para revisão manual.
  • Expressão regular. Esta opção permite adicionar uma expressão regular (isto é, uma descrição formal da estrutura do valor do campo). Um campo configurado com uma expressão regular pode conter letras, dígitos e outros caracteres conforme definido no formulário de dados.
O uso de uma expressão regular pode melhorar a precisão da extração — isto é, a identificação de padrões no texto — influenciando o resultado ao restringir o conjunto de caracteres válidos. Por exemplo, se um campo de texto contiver apenas números, você pode especificar uma expressão regular que descreva a estrutura do campo como contendo apenas dígitos. Nesse caso, ao reconhecer o campo, o programa tentará reconhecer cada caractere como um dígito. Você também pode especificar uma expressão regular para um formato específico de número de telefone (exemplo 1) ou verificar se o campo contém 2 palavras e uma delas é um número, por exemplo 50 lbs (exemplo 2): Exemplo 1 (para números de telefone como 1-(234)-567-8900 ou 2 (987) 654 3211)
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Exemplo 2 (para valores de peso de 50 lb/50 lbs/50lb/50lbs/50Lb/50Lbs etc.)
/^[\d]*(\s)?(L|l)b(s)?$/
Observação: As expressões regulares não afetam o reconhecimento de texto de um documento PDF.

Data

O grupo de configurações O valor pode incluir:
  • Hora. Selecione esta opção para campos de Data que também possam conter a hora. Se um valor de hora não for permitido, ele não será extraído durante o reconhecimento.
  • Dia da semana. Esta opção permite que o dia da semana seja especificado no campo de Data. Se um valor de dia da semana não for permitido, ele não será extraído durante o reconhecimento.
  • Mês por nome. Esta opção permite que o mês seja especificado como palavra.
O grupo de configurações Ordem aceitável dos componentes permite selecionar um formato de data adequado entre as seguintes opções: Dia-Mês-Ano, Mês-Dia-Ano e Ano-Mês-Dia. Você também pode especificar vários formatos diferentes ao mesmo tempo. Se o formato de data detectado não corresponder aos formatos especificados, o documento será enviado para revisão manual com um erro. O grupo de configurações Data aceitável permite definir um intervalo de datas válidas. Você pode definir um intervalo válido selecionando um número de meses antes e depois do dia em que o documento foi processado. O número de meses deve ser especificado como um inteiro. Uma regra é usada para verificar se a data informada está dentro do intervalo definido. Caso contrário, a regra exibirá um erro e o documento será enviado para revisão manual.

Número

O grupo de configurações Valor permite especificar que tipo de número é o valor detectado (inteiro ou decimal), bem como quais formatos numéricos podem ser detectados neste campo. Se o valor deste campo não atender aos requisitos especificados, o documento será enviado para revisão manual.
  • Apenas inteiros indica que o valor pode ser somente um inteiro. Se um número com separador for detectado no campo enquanto esta opção estiver ativada, ele será tratado como separador de milhar.
  • A parte fracionária pode conter mais de dois dígitos. Ative esta opção se a parte decimal do valor extraído for ter mais de dois dígitos. Os seguintes caracteres podem ser usados como separadores decimais: ponto (.), vírgula (,), hífen (-), sinal de igual (=) e espaço ( ).
  • Pode ter valores negativos. Esta opção permite que o valor extraído seja negativo. Valores negativos podem ser indicados por um sinal de menos ou por colchetes.
  • Pode incluir o símbolo ’%’. Esta opção permite que o valor extraído tenha o caractere de porcentagem antes ou depois do número.
O grupo de configurações O número deve estar dentro do intervalo permite especificar um intervalo no qual o valor deve estar para ser válido. A faixa do intervalo é definida especificando valores mínimo e máximo. Esses valores podem ser inteiros ou decimais. Valores negativos também podem ser especificados. Em seguida, uma regra é usada para verificar se o valor está dentro do intervalo especificado. Caso não esteja, a regra exibirá um erro e o documento será enviado para revisão manual.

Money

As propriedades de Money são idênticas às de Number, com a única exceção de que o campo Money não pode conter o caractere de porcentagem.

Veja também