Zum Hauptinhalt springen
Dieses Objekt stellt Methoden und Eigenschaften für die Arbeit mit einem einzelnen Absatz des erkannten Textes bereit. Ein Absatz im ABBYY FineReader Engine-Objektmodell ist eine elementare Texteinheit. Über dieses Objekt kann der Benutzer Folgendes abrufen:
  • den erkannten Text (verwenden Sie dafür die Eigenschaft Text)
  • verschiedene Absatzparameter (die Eigenschaften ExtendedParams, ListParams und ParagraphStyle)
  • Sammlungen von Absatzzeilen und -wörtern (die Eigenschaften Lines und Words)
  • die Parameter eines einzelnen Zeichens (die Methoden GetCharParams, SetCharParams und GetDropCapCharParams)
  • Lesezeichen (die Eigenschaften Bookmark und UserBookmark)
  • Die Koordinaten der Absatzgrenzen (die Eigenschaften Left, Top, Right und Bottom) sind für Barcode-Absätze nicht verfügbar.
  • Lesezeichen in ABBYY FineReader Engine sind interne (technische) oder benutzerdefinierte Entitäten mit Namen, die mithilfe von Schlüsselwörtern (Präfixen) codiert sind. Diese Schlüsselwörter und ihr Wortschatz können je nach Version der verwendeten Technologien variieren.

Eigenschaften

,read-only

Gibt das Engine-Objekt zurück.

, read-only

Ermöglicht den Zugriff auf den erkannten Text des Absatzes in Form eines Unicode-Strings. Über diese Eigenschaft wird der erkannte Text abgerufen. Dieser String kann folgende Sonderzeichen enthalten:

  • 0x2028 — Zeilenumbruchsymbol
  • L’\n’ — Absatzumbruchsymbol
  • 0xFFFC — Objekt-Ersatzzeichen (kennzeichnet ein eingebettetes Bild im Text)
  • 0x0009 — Tabulator.
  • 0x005E — Zirkumflex (^), wird von ABBYY FineReader Engine als Ersatz für nicht erkannte Zeichen verwendet
  • 0x00AC — Weiches Trennzeichen
Wenn der Absatz eine Schreibrichtung von rechts nach links aufweist (wie z. B. bei Hebräisch), enthält der Text des Absatzes die Zeichen in der Lesereihenfolge. Beispielsweise wird der hebräische Text Hebrew als der String ”Hebrew_backtofront” zurückgegeben.

Beachten Sie, dass der erkannte Text geringfügig vom Original abweichen kann. Einige Eingabezeichen können durch ein Sonderzeichen ersetzt werden. So kann beispielsweise das Symbol ”…” durch einen Tabulator ersetzt werden. Daher kann die Anzahl der Zeichen im erkannten Text vom Original abweichen. Um auf das Eingabewort ohne ersetzte Zeichen zuzugreifen, verwenden Sie.

,read-only

Ermöglicht den Zugriff auf die Sammlung der Absatzwörter.

Im Gegensatz zur Text-Eigenschaft enthält ein Wort im Absatz bei einer Schreibrichtung von rechts nach links (wie z. B. bei Hebräisch) die Zeichen des Wortes von links nach rechts. Beispielsweise wird das hebräische Wort Hebrew als der String ”Hebrew” zurückgegeben.

,read-only

Ermöglicht den Zugriff auf die Sammlung der Absatzzeilen. Die Eigenschaft gibt ein konstantes Objekt zurück.

, read-only

Gibt die Anzahl der Lesezeichen im Absatz zurück.

, read-only

Ermöglicht den Zugriff auf ein Lesezeichen beliebigen Typs (technisch oder benutzerdefiniert) über seinen Index in der internen Sammlung der Absatz-Lesezeichen. Das über diese Eigenschaft abgerufene Lesezeichen enthält ein Präfix in seinem Namen.

,read-only

Gibt einen Verweis auf das Hyperlink-Objekt zurück, das beschreibt den Hyperlink an der Position. Wenn kein Hyperlink vorhanden ist, wird diese Eigenschaft auf 0 gesetzt.

,read-only

Ermöglicht den Zugriff auf alle Tabstopps im Absatz.

, nur lesbar

Ermöglicht den Zugriff auf das Benutzer-Lesezeichen über seinen Index in der internen Sammlung der Absatz-Lesezeichen. Das über diese Eigenschaft abgerufene Lesezeichen enthält kein Präfix in seinem Namen.

, nur lesbar

Gibt die Anzahl der Benutzer-Lesezeichen im Absatz zurück.

, nur lesbar

Diese Eigenschaft enthält die Anzahl der Zeichen im Absatz. Dieser Wert entspricht der Anzahl der Zeichen in der Zeichenkette, die über die Eigenschaft Text abgerufen wird.

Das Absatzumbruchzeichen am Ende des Absatzes ist in der Eigenschaft Text enthalten und wird in der Eigenschaft Length mitgezählt.

Ermöglicht den Zugriff auf die Parameter des Paragraph Objekts, die vom ParagraphParams-Objekt bereitgestellt werden.

,read-only

Ermöglicht den Zugriff auf die Parameter der Liste, zu der der Absatz gehört. Wenn der Absatz nicht in der Liste enthalten ist, gibt die Eigenschaft IListParams::List NULL zurück.

Ermöglicht den Zugriff auf die Parameter des Absatzstils. Diese Parameter sind erst nach der Dokumentsynthese verfügbar.

Die Eigenschaft gibt ein konstantes Objekt zurück.

Ermöglicht den Zugriff auf die Anzahl der Zeichen im Initialbuchstaben eines Absatzes. Die ersten DropCapCharsCount Symbole des Absatzes werden als Initialbuchstabe behandelt. Diese Eigenschaft wird beim Bearbeiten des Absatzes nicht aktualisiert und kann daher größer als die Länge des Absatzes sein.

, nur lesbar

Enthält die Nummer der Spalte, zu der das Zeichen an der Position gehört.

, nur lesbar

Enthält die Koordinate des unteren Rands des Absatzes, wie er auf dem Bild positioniert ist.

Diese Eigenschaft ist für Absätze von Barcodes nicht verfügbar.

, nur lesbar

Speichert die Koordinate des linken Rands des Absatzes gemäß seiner Position im Bild.

Diese Eigenschaft ist für die Absätze von Barcodes nicht verfügbar.

, nur lesbar

Speichert die Koordinate des rechten Rands des Absatzes gemäß seiner Position im Bild.

Diese Eigenschaft ist für die Absätze von Barcodes nicht verfügbar.

, nur lesbar

Speichert die Koordinate des oberen Rands des Absatzes gemäß seiner Position im Bild.

Diese Eigenschaft ist für die Absätze von Barcodes nicht verfügbar.

Methoden

NameBeschreibung
DeleteBookmarkLöscht das angegebene Lesezeichen beliebigen Typs (technisch oder benutzerdefiniert) aus dem Absatz.
GetBookmarkRangeErmittelt anhand des Namens des Lesezeichens den Index des ersten Zeichens und die Länge der Zeichenfolge, die das Lesezeichen bildet.
GetCharParamsErmöglicht den Zugriff auf die Parameter eines einzelnen Zeichens.
GetDropCapCharParamsErmöglicht den Zugriff auf die Parameter einer Initiale im Absatz.
GetHyperlinkRangeAnalysiert ein einzelnes Hyperlink-Zeichen und ermittelt den Index des ersten Zeichens sowie die Länge der Zeichenfolge, die den Hyperlink bildet.
GetWordRecognitionVariantsGibt eine Sammlung von Varianten der Erkennung eines Worts an der aktuellen Position im Text eines Absatzes zurück.
InsertFügt eine Zeichenfolge in den Text des Absatzes ein.
InsertParagraphBreakTeilt den Absatz in zwei Teile.
InsertTabFügt an der ausgewählten Position im Text einen Tabstopp ein.
InsertTextFügt den angegebenen Text in den Text des Absatzes ein.
NextGroupFindet das nächste Zeichen im Absatz, dessen ausgewählte Parameter sich von denen des Zeichens unterscheiden, bei dem die Suche beginnt. Diese Methode kann verwendet werden, um alle fett oder kursiv formatierten Wörter im Absatz, alle unsicher erkannten Zeichen usw. zu finden.
RangeGibt eine Teilzeichenfolge aus dem Text des Absatzes zurück.
RemoveLöscht einen Bereich aus dem Text des Absatzes.
SetBookmarkLegt für eine Zeichenfolge innerhalb eines Absatzes ein benutzerdefiniertes Lesezeichen fest.
SetCharParamsLegt Parameter für eine Gruppe von Zeichen fest.
SetHyperlinkLegt für eine Zeichenfolge innerhalb eines Absatzes einen Hyperlink fest.
Paragraph Objektdiagramm

Ausgabeparameter

Dieses Objekt ist der Ausgabeparameter der folgenden Methoden:

Eingabeparameter

Dieses Objekt ist der Eingabeparameter der Methode IndexOf des Objekts Paragraphs.

Beispiele

FREngine.IBlock block;
int suspiciousCharsCount = 0;
// Durchläuft die Absätze eines Textblocks und berechnet die Anzahl verdächtiger Zeichen
FREngine.ITextBlock textBlock = block.GetAsTextBlock();
int paragraphsCount = textBlock.Text.Paragraphs.Count;
for (int iPar = 0; iPar < paragraphsCount; iPar++)
{
 FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
 string text = par.Text;
 FREngine.ICharParams charParams = engine.CreateCharParams();
 for (int iChar = 0; iChar < text.Length; iChar++)
 {
  par.GetCharParams(iChar, charParams);
  if (charParams.IsSuspicious)
  {
   suspiciousCharsCount++;
  }
 }
}
Das Objekt wird in den folgenden Codebeispielen verwendet:

Siehe auch

Paragraphs Arbeiten mit Text Arbeiten mit Eigenschaften