Pular para o conteúdo principal
Este objeto permite acessar diferentes parâmetros de um único caractere no texto reconhecido: sua formatação, a área retangular na imagem, o idioma de reconhecimento e as hipóteses de reconhecimento. Todas as propriedades booleanas de um objeto recém-criado desse tipo são definidas como FALSE.
Se você quiser trabalhar com os parâmetros de um determinado caractere no texto reconhecido, primeiro deverá chamar qualquer uma das funções que executam a síntese (por exemplo, o método Process ou Synthesize do objeto FRDocument), pois esses parâmetros só passam a fazer sentido após a síntese.
Se o caractere for obtido do texto de um cartão de visita, somente as seguintes propriedades do objeto serão definidas:
  • BaseLine
  • Bottom
  • Left
  • Right
  • Top
  • IsSuspicious
  • ErrorProbability
  • CharacterRegion
  • CharacterRecognitionVariantIndex
  • CharacterRecognitionVariants
  • SelectedCharacterRecognitionVariant
  • WordRecognitionVariants
  • IsFromSourceContent
  • IsWordFirst
  • IsWordLeftmost

Properties

,read-only

Retorna o objeto Engine.

Especifica o ID do idioma do caractere. Para convertê-lo para Win32 LCID, use omethod.

Por padrão, esta propriedade é inicializada com o ID de idioma padrão do sistema.

Armazena e permite definir o nome interno do idioma para um caractere.

Se umidioma base de reconhecimentocorresponder a uma palavra reconhecida, a propriedade LanguageName de cada caractere nessa palavra será definida com o nome interno do idioma base após o reconhecimento. Se vários idiomas base de reconhecimento corresponderem a uma palavra (por exemplo, em palavras compostas bilíngues), a propriedade LanguageName dos caracteres dessa palavra ficará vazia. Já a propriedade LanguageId contém o identificador do idioma base independentemente de qual seja a palavra reconhecida.

Por padrão, o valor desta propriedade é uma string vazia.

Especifica a região exata do caractere. A região pode não ser retangular e inicialmente está contida no retângulo definido pelas propriedades Left, Top, Right e Bottom. Se você alterar a região exata do caractere, as propriedades Left, Top, Right e Bottom não serão alteradas.

A propriedade só está disponível após o reconhecimento com apropriedade definida como TRUE.

A propriedade retorna um objeto constante. Para alterar a região exata do caractere, você deve primeiro obter um objeto Region intermediário usando o métodoIEngine::CreateRegion, alterar os parâmetros necessários e, em seguida, atribuir o objeto obtido à propriedade.

, read-only

Armazena a coordenada da borda inferior do retângulo do caractere. Esse retângulo é definido na imagem, sem considerar a orientação do texto. Pode ser indefinido; nesse caso, todas as quatro coordenadas são zero. Esta propriedade não pode ser alterada diretamente, apenas por meio do método SetRect.

O valor padrão desta propriedade é 0.

, read-only

Armazena a coordenada da borda esquerda do retângulo do caractere. Esse retângulo é definido na imagem, sem considerar a orientação do texto. Pode ser indefinido; nesse caso, todas as quatro coordenadas são zero. Esta propriedade não pode ser alterada diretamente, apenas por meio do método SetRect.

O valor padrão desta propriedade é 0.

, read-only

Armazena a coordenada da borda direita do retângulo do caractere. Esse retângulo é definido na imagem, sem considerar a orientação do texto. Pode ser indefinido; nesse caso, todas as quatro coordenadas são zero. Esta propriedade não pode ser alterada diretamente, apenas por meio do método SetRect.

O valor padrão desta propriedade é 0.

, read-only

Armazena a coordenada da borda superior do retângulo do caractere. Esse retângulo é definido na imagem, sem considerar a orientação do texto. Pode ser indefinido; nesse caso, todas as quatro coordenadas serão zero. Esta propriedade não pode ser alterada diretamente, apenas por meio do método SetRect.

O valor padrão desta propriedade é 0.

Especifica se o caractere é o caractere mais à esquerda em uma palavra.

Em situações complexas (como duas palavras não separadas por espaço ou uma palavra contendo um sinal de pontuação sem espaços), esta propriedade pode não funcionar corretamente. O reconhecedor pode alterar a hipótese sobre o número de palavras após as flags dos caracteres terem sido definidas.

Esta propriedade é definida durante a síntese. Se a propriedade for chamada antes de a síntese ser concluída, seu valor padrão será FALSE.

Parachinês, japonês ou coreanoesta propriedade não é confiável, pois as palavras não são detectadas.

Especifica se o caractere é o primeiro caractere em uma palavra.

Esta propriedade é definida durante a síntese. Se a propriedade for chamada antes de a síntese ser concluída, seu valor padrão será FALSE.

Observações:

  • Para idiomas com direção de escrita da direita para a esquerda (por exemplo, hebraico), esta propriedade indicará o caractere mais à direita na palavra.
  • Parachinês, japonês ou coreanoesta propriedade não é confiável, pois as palavras não são detectadas.

Define o deslocamento de um caractere em relação à linha de base da string em pixels. A linha de base da string é definida pela propriedade. Esta propriedade é usada principalmente para imagens incorporadas no texto.

Por padrão, o valor desta propriedade é 0.

Especifica o espaçamento adicional entre caracteres em twips. Um twip equivale a 1/20 de ponto, e um ponto equivale a 1/72”.

O valor padrão desta propriedade é 0.

Armazena o escalonamento horizontal de um caractere em 1/1000.

Se o caractere for obtido do texto de um cartão de visita, esta propriedade terá o valor padrão.

O valor padrão desta propriedade é 1000, o que corresponde à ausência de escalonamento.

Define o valor RGB da cor do símbolo. A cor de plano de fundo é definida para todo o parágrafo pela propriedade.

O valor desta propriedade pode ser -1, o que indica que a cor é transparente.

O valor int é calculado a partir do triplete RGB usando a fórmula: ( valor vermelho ) + (256 x valor verde ) + (65536 x valor azul ), onde valor vermelho é o primeiro componente do triplete, valor verde é o segundo componente do triplete e valor azul é o terceiro componente do triplete. Por exemplo, o valor int da cor branca é 16777215.

Por padrão, a cor do texto é preta ou RGB(0,0,0).

Especifica se o caractere está em negrito.

Se o caractere for obtido do texto de um cartão de visita, esta propriedade assume o valor padrão.

Esta propriedade é FALSE por padrão.

Especifica se o caractere está em itálico.

Se o caractere for obtido do texto de um cartão de visita, esta propriedade assume o valor padrão.

Esta propriedade é FALSE por padrão.

Especifica se o caractere está sublinhado.

Esta propriedade é FALSE por padrão.

Especifica se o caractere está tachado.

Se o caractere for obtido do texto de um cartão de visita, esta propriedade assume o valor padrão.

Esta propriedade é FALSE por padrão.

Especifica se o caractere é subscrito. Não pode ser definido como TRUE simultaneamente com a propriedade IsSuperscript, pois isso causará erros durante a exportação do texto reconhecido.

Se o caractere for obtido do texto de um cartão de visita, esta propriedade assume o valor padrão.

Esta propriedade é FALSE por padrão.

Especifica se o caractere é sobrescrito. Não pode ser definido como TRUE simultaneamente com a propriedade IsSubscript, pois isso causará erros durante a exportação do texto reconhecido.

Se o caractere for obtido do texto de um cartão de visita, esta propriedade assume o valor padrão.

Esta propriedade é FALSE por padrão.

Especifica se o caractere possui o estilo “versalete”. Isso significa que os caracteres minúsculos são exibidos como versaletes.

Esta propriedade é FALSE por padrão.

, somente leitura

Armazena o nome da fonte do caractere. Esta propriedade não pode ser alterada diretamente, apenas por meio do método SetFont.

Por padrão, este valor é “Times New Roman”.

Especifica a altura da fonte do caractere em twips. Um twip equivale a 1/20 de ponto, e um ponto equivale a 1/72”.

O valor padrão desta propriedade corresponde a 10 pontos ou 200 twips.

Fornece acesso ao estilo de fonte do caractere.

, somente leitura

Armazena o tipo de fonte do caractere. Esta propriedade não pode ser alterado diretamente, mas por meio do método SetFont.

Por padrão, esse valor é FT_Unknown.

Retorna TRUE se o caractere foi reconhecido de forma não confiável. Use esta propriedade para determinar se a verificação é necessária.

Esta propriedade é calculada com base no valor de ErrorProbability e nas configurações de reconhecimento. Se você precisar implementar distinções mais granulares para verificação, use ErrorProbability em vez disso.

Esta propriedade é FALSE por padrão.

, somente leitura

Retorna a probabilidade estimada (no intervalo de 0 a 100) de que o caractere foi reconhecido incorretamente.

A probabilidade de erro leva em conta o contexto completo, por isso está disponível apenas para o resultado do reconhecimento, e não para cada variante de reconhecimento de caractere. Para comparar variantes de reconhecimento entre si, use.

A probabilidade de erro não é calculada para símbolos obtidos sem reconhecimento, por exemplo, aqueles extraídos diretamente do arquivo PDF de origem.

,read-only

Retorna uma coleção de variantes de reconhecimento de caractere.

A propriedade contém zero para caracteres não imprimíveis (espaços, retornos de carro, etc.) e caracteres que não foram reconhecidos, mas foram adicionados ao texto durante a edição explícita. Zero também é retornado se o texto foi reconhecido por uma das versões anteriores do ABBYY FineReader Engine.

Se a propriedadeestiver definida como FALSE, a coleção retornada contém um elemento; caso contrário, a coleção contém no mínimo um elemento e as variantes são ordenadas da melhor para a pior.

, somente leitura

Armazena o índice da variante selecionada de reconhecimento de caractere na coleção CharacterRecognitionVariants.

,read-only

Armazena a variante selecionada de reconhecimento de caractere. É o elemento com o índice CharacterRecognitionVariantIndex na coleção de variantes de reconhecimento de caractere (a propriedade CharacterRecognitionVariants).

,read-only

Retorna uma coleção de variantes de reconhecimento para a palavra à qual o caractere pertence.

A propriedade contém zero para caracteres não imprimíveis (espaços, retornos de carro, etc.) e caracteres que não foram reconhecidos, mas foram adicionados ao texto durante a edição explícita. Zero também é retornado se o texto foi reconhecido por uma das versões anteriores do ABBYY FineReader Engine.

Se a propriedadeestiver definida como FALSE, a coleção retornada contém um elemento; caso contrário, a coleção contém no mínimo um elemento e as variantes são ordenadas da melhor para a pior, conforme determinado pelo mecanismo interno de estimativa.

, somente leitura

Especifica se o caractere foi extraído do conteúdo de texto do arquivo de entrada sem reconhecimento. Por exemplo, pode ser extraído de um arquivo PDF com uma camada de texto.

Especifica se a verificação ortográfica foi realizada neste caractere. Não é usado nem definido internamente pelo ABBYY FineReader Engine e apenas fornece uma estrutura de suporte à verificação ortográfica.

Métodos

NomeDescrição
CopyFromInicializa as propriedades do objeto atual com os valores das propriedades correspondentes de outro objeto.
SetFontDefine a nova fonte do símbolo.
SetRectDefine o novo Rectangle do símbolo.
CharParams Diagrama de objetos

Parâmetro de saída

Este objeto é o parâmetro de saída dos seguintes métodos:

Parâmetro de entrada

Este objeto é passado como parâmetro de entrada para os seguintes métodos:

Exemplos

int suspiciousCharsCount = 0;
// Calcula o número de caracteres suspeitos em um bloco de texto
void computeStatisticsForBlock(FREngine.IBlock block)
{
 if (block.Type == FREngine.BlockTypeEnum.BT_Text)
 {
  FREngine.ITextBlock textBlock = block.GetAsTextBlock();
  int paragraphsCount = textBlock.Text.Paragraphs.Count;
  for (int iPar = 0; iPar < paragraphsCount; iPar++)
  {
   FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
   string text = par.Text;
   FREngine.ICharParams charParams = engine.CreateCharParams();
   for (int iChar = 0; iChar < text.Length; iChar++)
   {
    par.GetCharParams(iChar, charParams);
    if (charParams.IsSuspicious)
    {
     suspiciousCharsCount++;
    }
   }
  }
 }
}
O objeto é usado nos seguintes exemplos de código: RecognizedTextProcessing (Win); e nas ferramentas de demonstração do Windows: Perfis de Processamento Predefinidos do Engine.

Veja também

Paragraph Qual é a diferença entre CharConfidence, ErrorProbability e IsSuspicious? Trabalhando com texto Trabalhando com Properties