Passer au contenu principal
Cet objet fournit des méthodes et des propriétés pour travailler avec un seul paragraphe du texte reconnu. Dans le modèle objet d’ABBYY FineReader Engine, un paragraphe est une unité de texte élémentaire. C’est au moyen de cet objet qu’un utilisateur peut obtenir :
  • le texte reconnu (utilisez la propriété Text à cet effet)
  • différents paramètres du paragraphe (propriétés ExtendedParams, ListParams et ParagraphStyle)
  • les collections de lignes et de mots du paragraphe (propriétés Lines et Words)
  • les paramètres d’un caractère unique (méthodes GetCharParams, SetCharParams et GetDropCapCharParams)
  • les signets (propriétés Bookmark et UserBookmark)
  • Les coordonnées des bordures du paragraphe (propriétés Left, Top, Right et Bottom) ne sont pas disponibles pour les paragraphes de code-barres.
  • Dans ABBYY FineReader Engine, les signets sont des entités internes (techniques) ou personnalisées, dont les noms sont encodés à l’aide de mots-clés (préfixes). Ces mots-clés et leur vocabulaire peuvent varier selon la version des technologies utilisées.

Propriétés

,read-only

Renvoie l’objet Engine.

, read-only

Donne accès au texte reconnu du paragraphe sous la forme d’une chaîne Unicode. C’est via cette propriété que vous obtenez le texte reconnu. Cette chaîne peut contenir les caractères spéciaux suivants :

  • 0x2028 — Symbole de saut de ligne
  • L’\n’ — Symbole de saut de paragraphe
  • 0xFFFC — Caractère de remplacement d’objet (désigne une image incorporée dans le texte)
  • 0x0009 — Tabulation.
  • 0x005E — Accent circonflexe (^), utilisé par ABBYY FineReader Engine comme substitut aux caractères non reconnus
  • 0x00AC — Trait d’union conditionnel
Si le paragraphe a une direction d’écriture de droite à gauche (comme en hébreu), le texte du paragraphe est une chaîne contenant les caractères du paragraphe dans l’ordre de lecture. Par exemple, le texte hébreu Hebrew sera renvoyé sous la forme de la chaîne ”Hebrew_backtofront”.

Notez que le texte reconnu peut légèrement différer de l’original. Certains symboles saisis peuvent être remplacés par un caractère spécial. Par exemple, le symbole ”…” peut être remplacé par une tabulation. C’est pourquoi le nombre de symboles dans le texte reconnu peut différer de l’original. Pour accéder au mot saisi sans symboles remplacés, utilisez.

,read-only

Donne accès à la collection des mots du paragraphe.

Contrairement à la propriété Text, si le paragraphe a une direction d’écriture de droite à gauche (comme en hébreu), un mot dans le paragraphe est une chaîne contenant les caractères du mot de gauche à droite. Par exemple, le mot hébreu Hebrew sera renvoyé sous la forme de la chaîne ”Hebrew”.

,read-only

Donne accès à la collection des lignes du paragraphe. La propriété renvoie un objet constant.

, read-only

Renvoie le nombre de signets dans le paragraphe.

, read-only

Donne accès au signet de tout type (technique ou utilisateur) par son indice dans la collection interne des signets du paragraphe. Le signet accessible via cette propriété contient un préfixe dans son nom.

,read-only

Renvoie une référence à l’objet Hyperlink qui décrit le lien hypertexte à la position. S’il n’y a pas de lien hypertexte, cette propriété est définie à 0.

,read-only

Donne accès à tous les taquets de tabulation du paragraphe.

, read-only

Donne accès au signet utilisateur par son indice dans la collection interne des signets du paragraphe. Le signet accessible via cette propriété ne contient pas de préfixe dans son nom.

, read-only

Retourne le nombre de signets utilisateur dans le paragraphe.

, read-only

Cette propriété contient le nombre de caractères du paragraphe. Cette valeur est identique au nombre de caractères de la chaîne obtenue via la propriété Text.

Le symbole de saut de paragraphe en fin de paragraphe est inclus dans la propriété Text et comptabilisé dans la propriété Length.

Donne accès aux paramètres de l’objet Paragraph exposés par l’objet ParagraphParams.

,read-only

Donne accès aux paramètres de la liste à laquelle appartient le paragraphe. Si le paragraphe ne fait pas partie de la liste, la propriété IListParams::List retourne NULL.

Donne accès aux paramètres du style de paragraphe. Ces paramètres ne deviennent accessibles qu’après la synthèse du document.

La propriété retourne un objet constant.

Donne accès au nombre de caractères de la lettrine d’un paragraphe. Les DropCapCharsCount premiers symboles du paragraphe sont considérés comme faisant partie de la lettrine. Cette propriété n’est pas modifiée lors de l’édition du paragraphe ; elle peut donc être supérieure à la longueur du paragraphe.

, read-only

Stocke le numéro de la colonne à laquelle appartient le caractère à la position.

, read-only

Stocke la coordonnée du bord inférieur du paragraphe tel qu’il est positionné sur l’image.

Cette propriété n’est pas disponible pour les paragraphes des code-barres.

, lecture seule

Stocke la coordonnée de la bordure gauche du paragraphe telle qu’elle apparaît sur l’image.

Cette propriété n’est pas disponible pour les paragraphes des codes-barres.

, lecture seule

Stocke la coordonnée de la bordure droite du paragraphe telle qu’elle apparaît sur l’image.

Cette propriété n’est pas disponible pour les paragraphes des codes-barres.

, lecture seule

Stocke la coordonnée de la bordure supérieure du paragraphe telle qu’elle apparaît sur l’image.

Cette propriété n’est pas disponible pour les paragraphes des codes-barres.

Méthodes

NomDescription
DeleteBookmarkSupprime du paragraphe le signet spécifié, quel qu’en soit le type (technique ou utilisateur).
GetBookmarkRangeDétecte l’indice du caractère initial et la longueur de la chaîne formant le signet à partir de son nom.
GetCharParamsDonne accès aux paramètres d’un caractère unique.
GetDropCapCharParamsDonne accès aux paramètres de la lettrine d’un paragraphe.
GetHyperlinkRangeAnalyse un caractère d’un lien hypertexte et détecte l’indice du caractère initial ainsi que la longueur de la chaîne formant le lien hypertexte.
GetWordRecognitionVariantsRenvoie une collection de variantes de reconnaissance d’un mot à la position courante dans le texte d’un paragraphe.
InsertInsère une chaîne dans le texte du paragraphe.
InsertParagraphBreakDivise le paragraphe en deux parties.
InsertTabInsère une tabulation à l’emplacement choisi dans le texte.
InsertTextInsère le texte spécifié dans le texte du paragraphe.
NextGroupRecherche, dans le paragraphe, le caractère suivant dont les paramètres sélectionnés diffèrent de ceux du caractère à partir duquel la recherche commence. Cette méthode peut être utilisée pour trouver tous les mots en gras ou en italique du paragraphe, tous les caractères reconnus avec incertitude, etc.
RangeRenvoie une sous-chaîne du texte du paragraphe.
RemoveSupprime une plage du texte du paragraphe.
SetBookmarkDéfinit un signet utilisateur sur une chaîne dans un paragraphe.
SetCharParamsDéfinit les paramètres d’un groupe de caractères.
SetHyperlinkDéfinit un lien hypertexte sur une chaîne dans un paragraphe.
Paragraph Diagramme d’objets

Paramètre de sortie

Cet objet constitue le paramètre de sortie des méthodes suivantes :

Paramètre d’entrée

Cet objet constitue le paramètre d’entrée de la méthode IndexOf de l’objet Paragraphs.

Exemples

FREngine.IBlock block;
int suspiciousCharsCount = 0;
// Itère les paragraphes d'un bloc de texte et calcule le nombre de caractères suspects
FREngine.ITextBlock textBlock = block.GetAsTextBlock();
int paragraphsCount = textBlock.Text.Paragraphs.Count;
for (int iPar = 0; iPar < paragraphsCount; iPar++)
{
 FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
 string text = par.Text;
 FREngine.ICharParams charParams = engine.CreateCharParams();
 for (int iChar = 0; iChar < text.Length; iChar++)
 {
  par.GetCharParams(iChar, charParams);
  if (charParams.IsSuspicious)
  {
   suspiciousCharsCount++;
  }
 }
}
L’objet est utilisé dans les exemples de code suivants :

Voir aussi

Paragraphs Utilisation du texte Utilisation des propriétés