Pular para o conteúdo principal
Este objeto expõe métodos e propriedades para trabalhar com um único parágrafo do texto reconhecido. No modelo de objetos do ABBYY FineReader Engine, um parágrafo é uma unidade elementar de texto. Por meio deste objeto, o usuário pode obter:
  • o texto reconhecido (use a propriedade Text para isso)
  • diferentes parâmetros do parágrafo (propriedades ExtendedParams, ListParams e ParagraphStyle)
  • coleções de linhas e Words do parágrafo (propriedades Lines e Words)
  • parâmetros de um único caractere (métodos GetCharParams, SetCharParams e GetDropCapCharParams)
  • marcadores (propriedades Bookmark e UserBookmark)
  • As coordenadas dos limites do parágrafo (propriedades Left, Top, Right e Bottom) não estão disponíveis para parágrafos de códigos de barras.
  • Os marcadores no ABBYY FineReader Engine são entidades internas (técnicas) ou personalizadas, com nomes codificados por palavras-chave (prefixos). Essas palavras-chave e seu vocabulário podem variar dependendo da versão das tecnologias usadas.

Properties

,read-only

Retorna o objeto Engine.

, read-only

Fornece acesso ao texto reconhecido do parágrafo na forma de uma string Unicode. É por meio desta propriedade que você obtém o texto reconhecido. Essa string pode conter os seguintes caracteres especiais:

  • 0x2028 — Símbolo de quebra de linha
  • L’\n’ — Símbolo de quebra de parágrafo
  • 0xFFFC — Caractere de substituição de objeto (indica uma imagem incorporada no texto)
  • 0x0009 — Tabulação.
  • 0x005E — Acento circunflexo (^), usado pelo ABBYY FineReader Engine como substituto para caracteres não reconhecidos
  • 0x00AC — Hífen suave
Se o parágrafo tiver direção de escrita da direita para a esquerda (como no hebraico), o texto do parágrafo é uma string que contém os caracteres do parágrafo na ordem em que são lidos. Por exemplo, o texto hebraico Hebrew será retornado como a string ”Hebrew_backtofront”.

Observe que o texto reconhecido pode diferir ligeiramente do original. Alguns símbolos de entrada podem ser substituídos por um caractere especial. Por exemplo, o símbolo ”…” pode ser substituído por tabulação. Por isso, o número de símbolos no texto reconhecido pode ser diferente do original. Se você quiser acessar a palavra de entrada sem símbolos substituídos, use.

,read-only

Fornece acesso à coleção de palavras do parágrafo.

Ao contrário da propriedade Text, se o parágrafo tiver direção de escrita da direita para a esquerda (como no hebraico), uma palavra no parágrafo é uma string que contém os caracteres da palavra da esquerda para a direita. Por exemplo, a palavra hebraica Hebrew será retornada como a string ”Hebrew”.

,read-only

Fornece acesso à coleção de linhas do parágrafo. A propriedade retorna um objeto constante.

, read-only

Retorna o número de marcadores no parágrafo.

, read-only

Fornece acesso ao marcador de qualquer tipo (técnico ou de usuário) pelo seu índice na coleção interna de marcadores do parágrafo. O marcador acessado por meio desta propriedade contém um prefixo em seu nome.

,read-only

Retorna uma referência ao objeto Hyperlink que descreve o hiperlink na posição. Se não houver hiperlink, esta propriedade é definida como 0.

,somente leitura

Fornece acesso a todos os tab stops do parágrafo.

, somente leitura

Fornece acesso ao marcador do usuário pelo seu índice na coleção interna dos marcadores do parágrafo. O marcador acessado por meio desta propriedade não contém prefixo em seu nome.

, somente leitura

Retorna o número de marcadores do usuário no parágrafo.

, somente leitura

Esta propriedade contém o número de caracteres no parágrafo. Esse valor é igual ao número de caracteres na string recebida por meio da propriedade Text.

O símbolo de quebra de parágrafo ao final do parágrafo está incluído na propriedade Text e é contabilizado na propriedade Length.

Fornece acesso aos parâmetros do objeto Paragraph expostos pelo objeto ParagraphParams.

,somente leitura

Fornece acesso aos parâmetros da lista à qual o parágrafo pertence. Se o parágrafo não estiver na lista, a propriedade IListParams::List retorna NULL.

Fornece acesso aos parâmetros do estilo de parágrafo. Esses parâmetros ficam acessíveis somente após a síntese do documento.

A propriedade retorna um objeto constante.

Fornece acesso ao número de caracteres na capitular de um parágrafo. Os primeiros DropCapCharsCount símbolos do parágrafo são considerados capitular. Esta propriedade não é alterada quando o parágrafo é editado, portanto pode ser maior que o comprimento do parágrafo.

, somente leitura

Armazena o número da coluna à qual o caractere na posição pertence.

, somente leitura

Armazena a coordenada da borda inferior do parágrafo conforme posicionado na imagem.

Esta propriedade não está disponível para os parágrafos de códigos de barras.

, somente leitura

Armazena a coordenada da borda esquerda do parágrafo conforme sua posição na imagem.

Esta propriedade não está disponível para os parágrafos de códigos de barras.

, somente leitura

Armazena a coordenada da borda direita do parágrafo conforme sua posição na imagem.

Esta propriedade não está disponível para os parágrafos de códigos de barras.

, somente leitura

Armazena a coordenada da borda superior do parágrafo conforme sua posição na imagem.

Esta propriedade não está disponível para os parágrafos de códigos de barras.

Métodos

NomeDescrição
DeleteBookmarkExclui do parágrafo o marcador especificado, de qualquer tipo (técnico ou de usuário).
GetBookmarkRangeDetecta o índice do caractere inicial e o comprimento da string que forma o marcador com base no nome dele.
GetCharParamsFornece acesso aos parâmetros de um único caractere.
GetDropCapCharParamsFornece acesso aos parâmetros da letra capitular de um parágrafo.
GetHyperlinkRangeAnalisa um único caractere de hiperlink e detecta o índice do caractere inicial e o comprimento da string que forma o hiperlink.
GetWordRecognitionVariantsRetorna uma coleção de variantes de reconhecimento de uma palavra na posição atual no texto de um parágrafo.
InsertInsere uma string no texto do parágrafo.
InsertParagraphBreakDivide o parágrafo em duas partes.
InsertTabInsere uma tabulação na posição escolhida no texto.
InsertTextInsere o texto especificado no texto do parágrafo.
NextGroupEncontra o próximo caractere no parágrafo cujos parâmetros selecionados diferem dos do caractere em que a pesquisa se inicia. Esse método pode ser usado para localizar todas as palavras em negrito ou itálico no parágrafo, todos os caracteres reconhecidos com incerteza etc.
RangeRetorna uma substring do texto do parágrafo.
RemoveExclui um intervalo do texto do parágrafo.
SetBookmarkDefine um marcador de usuário para uma string dentro de um parágrafo.
SetCharParamsDefine parâmetros para um grupo de caracteres.
SetHyperlinkDefine um hiperlink para uma string dentro de um parágrafo.
Paragraph Diagrama de objetos

Parâmetro de saída

Este objeto é o parâmetro de saída dos métodos a seguir:

Parâmetro de entrada

Este objeto é o parâmetro de entrada do método IndexOf do objeto Paragraphs.

Exemplos

FREngine.IBlock block;
int suspiciousCharsCount = 0;
// Itera pelos parágrafos de um bloco de texto e calcula o número de caracteres suspeitos
FREngine.ITextBlock textBlock = block.GetAsTextBlock();
int paragraphsCount = textBlock.Text.Paragraphs.Count;
for (int iPar = 0; iPar < paragraphsCount; iPar++)
{
 FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
 string text = par.Text;
 FREngine.ICharParams charParams = engine.CreateCharParams();
 for (int iChar = 0; iChar < text.Length; iChar++)
 {
  par.GetCharParams(iChar, charParams);
  if (charParams.IsSuspicious)
  {
   suspiciousCharsCount++;
  }
 }
}
O objeto é usado nos exemplos de código a seguir:

Veja também

Paragraphs Trabalhando com texto Trabalhando com Properties