Pular para o conteúdo principal
Este objeto representa texto reconhecido em um formato especial de “texto simples”. Ele fornece informações apenas sobre os símbolos do texto reconhecido, o nível de confiança do reconhecimento e suas posições em relação à imagem de origem. Você pode obter essas informações tanto para um único caractere quanto para todos os caracteres do texto.
No caso de reconhecimento de código de barras, a propriedade Text do objeto PlainText fica vazia. Se você precisar obter o texto reconhecido de um documento de uma página que contenha um único código de barras, use a propriedade Text do primeiro bloco no Layout:
document.Pages[0].Layout.Blocks[0].GetAsBarcodeBlock().Text

Properties

,read-only

Retorna o objeto Engine.

, somente leitura

Fornece acesso ao texto reconhecido completo na forma de uma string Unicode. Essa string pode conter os seguintes caracteres especiais:

  • 0x2028 — Símbolo de quebra de linha
  • 0x2029 — Símbolo de quebra de parágrafo
  • 0xFFFC — Caractere de substituição de objeto (indica uma imagem incorporada no texto)
  • 0x0009 — Tabulação
  • 0x005E — Acento circunflexo (^), usado pelo ABBYY FineReader Engine como substituto para caracteres não reconhecidos
  • 0x00AC — Hífen suave
Se a imagem contiver tabelas, o texto das células será armazenado na ordem de leitura lógica (da esquerda para a direita e de cima para baixo).

, somente leitura

Retorna o número de símbolos no texto, incluindo os caracteres especiais.

, somente leitura

Esta propriedade recebe como parâmetro de entrada o índice de um símbolo no texto reconhecido. Retorna o número da página em que o símbolo especificado está localizado.

, somente leitura

Retorna o valor de confiança do reconhecimento do caractere. Este é o nível de confiança da variante de reconhecimento principal (selecionada).

A confiança estima a precisão de uma variante de reconhecimento. Ela não deve ser interpretada como uma medida geral de qualidade do reconhecimento: o único uso seguro da confiança é comparar variantes de reconhecimento do mesmo caractere. Os caracteres extraídos do arquivo PDF de origem sem reconhecimento têm a confiança definida como 55.

, somente leitura

Retorna a probabilidade estimada (no intervalo de 0 a 100) de que o caractere especificado tenha sido reconhecido incorretamente.

, somente leitura

Retorna TRUE se o caractere especificado foi reconhecido de forma não confiável. Use esta propriedade para determinar se a verificação é necessária.

Esta propriedade é calculada com base no valor de ErrorProbability e nas configurações de reconhecimento. Se você precisar implementar distinções mais granulares para verificação, use ErrorProbability em vez disso.

, somente leitura

Esta propriedade recebe como parâmetro de entrada o índice de um símbolo no texto reconhecido. Retorna a coordenada da borda inferior do Rectangle do símbolo em relação à imagem corrigida quanto à inclinaçãoblack-and-whiteplano da imagem de origem.

, somente leitura

Esta propriedade recebe como parâmetro de entrada o índice de um símbolo no texto reconhecido. Ela retorna a coordenada da borda esquerda do retângulo do caractere em relação ao planopreto e brancocorrigido quanto à inclinação da imagem de origem.

, somente leitura

Esta propriedade recebe como parâmetro de entrada o índice de um símbolo no texto reconhecido. Ela retorna a coordenada da borda direita do retângulo do símbolo em relação ao planopreto e brancocorrigido quanto à inclinação da imagem de origem.

, somente leitura

Esta propriedade recebe como parâmetro de entrada o índice de um símbolo no texto reconhecido. Ela retorna a coordenada da borda superior do retângulo do símbolo em relação ao planopreto e brancocorrigido quanto à inclinação da imagem de origem.

Métodos

NomeDescrição
GetCharacterData <Note> Apenas para Windows. </Note>Retorna informações sobre todos os caracteres do texto como um conjunto de arrays: os números das páginas em que os caracteres estão localizados, as coordenadas dos retângulos dos caracteres e os níveis de confiança dos caracteres.
SaveToAsciiXMLFileSalva o texto reconhecido em um arquivo XML.
SaveToTextFileSalva o texto reconhecido em um arquivo de texto com a codificação especificada.
PlainText Diagrama de objetos

Veja também

Qual é a diferença entre CharConfidence, ErrorProbability e IsSuspicious? Trabalhando com texto Trabalhando com Properties