Zum Hauptinhalt springen
Zeichenkette ist ein Element eines FlexiLayouts, das eine Folge von Zeichen beschreibt, die in einer Zeile von links nach rechts geschrieben werden. Zeichenketten können aus Wörtern oder Wortteilen bestehen. Zeichenkette-Elemente sind im FlexiLayout-Baum mit gekennzeichnet. Zeichenkette-Elemente werden verwendet, um nach nicht näher angegebenem Text zu suchen. Dabei berücksichtigt das Programm die Erkannte Wörter-Objekte, die während der Vorerkennung im Suchbereich des Elements erkannt wurden, als Kandidaten. Normalerweise befinden sich Zeichenketten neben statischem Text. Wenn das Programm beispielsweise nach der Ref.-Nr. eines Dokuments sucht, muss es zuerst den statischen Text „Ref. No.“ finden und dann daneben nach Ziffern suchen.

Suchtext beschreiben

Klicken Sie im Dialogfeld „Eigenschaften“ auf die Registerkarte „Zeichenkette“, um das entsprechende Objekt zu beschreiben. Um das Dialogfeld „Eigenschaften“ zu öffnen, klicken Sie im FlexiLayout-Baum mit der rechten Maustaste auf das Element und wählen Sie im Kontextmenü Eigenschaften… aus.
Der zu findende Text kann auf zwei Arten beschrieben werden.

Suchtext mithilfe eines regulären Ausdrucks beschreiben

Ein regulärer Ausdruck definiert mögliche Kombinationen von Zeichen. Wenn Sie einen regulären Ausdruck verwenden, muss die Hypothese die darin festgelegten Bedingungen erfüllen. Diese Methode wird in der Regel bei Dokumenten guter Qualität verwendet, die fehlerfrei erkannt werden. Um einen regulären Ausdruck einzugeben, wählen Sie die Option „Regulärer Ausdruck“ aus und geben Sie den Ausdruck in das danebenliegende Feld ein. Sie können auch auf die Schaltfläche klicken. Daraufhin wird eine Dropdown-Liste mit Optionen geöffnet (Beliebiger Buchstabe, Zeichen aus Menge usw.). Wählen Sie die gewünschte Option aus, um den entsprechenden regulären Ausdruck in das Feld einzugeben.

Beliebiges Zeichen

*

“k”*“t” – erlaubt ‘kit’, ‘kat’ usw.

Buchstabe

C

C”at” – erlaubt cat, bat, Rat, mat usw.

Großbuchstabe

A

A”at” – erlaubt Cat, Bat, Rat, Mat usw.

Kleinbuchstabe

a

a”at” – erlaubt car, bat, rat, mat usw.

Buchstabe oder Ziffer

Х

X – erlaubt einen beliebigen einzelnen Buchstaben oder eine beliebige einzelne Ziffer.

Ziffer

N

N”th” erlaubt 5th, 4th, 6th usw.

String

""

"cat”

Oder

|

“dr”(“i”|“u”)“nk” – erlaubt “drink” oder “drunk”.

Zeichen aus der Menge

[]

[hm]“at” – erlaubt ‘hat’ oder ‘mat’.

Zeichen nicht aus der Menge

[^]

[^b]“at” – erlaubt ‘cat’, ‘mat’, ‘rat’, aber nicht bat.

Beliebige Anzahl von Wiederholungen

(gilt für den Ausdruck oder Teilausdruck links)

{-}

[AB74]{-} – erlaubt beliebige Kombinationen aus A, B, 7 und 4 in beliebiger Länge.

Anzahl der Wiederholungen ist n

{n}

N{2}“th” erlaubt 25th, 84th, 11th usw.

n bis m Wiederholungen

{n-m}

N{1-3}“th” erlaubt 5th, 84th, 111th usw.

0 bis n Wiederholungen

{-n}

N{-2}“th” erlaubt th, 84th, 4th usw.

n oder mehr Wiederholungen

{n-}

N{2-}“th” erlaubt 25th, 834th, 311th, 34576th usw.

Teilausdruck

()

 

Suchtext mithilfe eines Alphabets beschreiben

Ein Alphabet listet die Zeichen auf, die im Suchtext vorkommen können. Diese Methode wird verwendet, wenn sich die Zeichenkette nicht mithilfe eines regulären Ausdrucks beschreiben lässt oder wenn der erkannte Text aufgrund unzureichender Bildqualität zu viele Fehler enthält. Sie können für ein Zeichenkette-Element mehrere Alphabete angeben. Wenn das Format des Textes unbekannt ist, werden keine Alphabete angegeben. In diesem Fall berücksichtigt das Programm bei der Suche nach dem dem Element entsprechenden Objekt alle möglichen Zeichen. So beschreiben Sie Suchtext mithilfe eines Alphabets:
  1. Wählen Sie einen Modus für die Hypothesengenerierung aus. Wenn die Zeichen im Suchbereich zum Erzeugen aller möglichen Hypothesen verwendet werden sollen, einschließlich sich überschneidender und eingebetteter Hypothesen, wählen Sie Eingebettete Hypothesen zulassen. Um Hypothesen mit maximaler Länge zu erzeugen, deaktivieren Sie Eingebettete Hypothesen zulassen.
  2. Erstellen Sie ein oder mehrere Alphabete.
So erstellen Sie ein Alphabet:
  1. Klicken Sie auf Hinzufügen… 2. Wählen Sie im Dialogfeld Neues Alphabet hinzufügen die gewünschte Codeseite aus der Liste Codeseite aus. 3. Wählen Sie in der Zeichentabelle die Zeichen aus, die im Suchtext vorkommen. Die ausgewählten Zeichen und ihre Anzahl werden im Feld Auf dem Bildschirm ausgewählt/insgesamt ausgewählt angezeigt. 4. Geben Sie im Feld Prozentsatz der Alphabetzeichen den gewünschten Prozentsatz an Alphabetzeichen im Suchtext an.
Hinweis. Sie können mehrere Alphabete angeben, diese dürfen sich jedoch nicht überschneiden, d. h. nicht dieselben Zeichen enthalten. Um ein Alphabet zu löschen, wählen Sie es in der Liste Alphabete aus und klicken auf Löschen. Um Zeichen zu einem Alphabet hinzuzufügen oder daraus zu löschen, wählen Sie das gewünschte Alphabet in der Liste Alphabete aus und klicken dann auf Bearbeiten…
  1. Geben Sie im Feld Prozentsatz der Nicht-Alpha­betzeichen den zulässigen Prozentsatz an Zeichen an, die zu keinem der Alphabete gehören.
Je nach der Methode, mit der der Suchtext beschrieben wird, müssen Sie möglicherweise die folgenden Eigenschaften angeben:
  1. Wählen Sie Nur ganze Wörter, wenn nur ganze Wörter gefunden werden sollen.
  2. Verwenden Sie die Option Wörter erkennen anhand von Wortzwischenräumen, um festzulegen, wie Zeilen in Wörter unterteilt werden. Deaktivieren Sie diese Option, um Wörter automatisch zu erkennen. Wenn diese Option aktiviert ist, wird eine Zeile immer dann in Wörter unterteilt, wenn der Abstand zwischen benachbarten Zeichen größer oder gleich dem in Min. Wortzwischenraum eingegebenen Wert ist. Hinweis. Bei der automatischen Worterkennung werden Wortenden anhand von Leerzeichen oder anderen Symbolen erkannt, die Wörter voneinander trennen (z. B. ” , ”, ” ; ”, ” / ”, ” ? ” – die genaue Symbolmenge hängt von der ausgewählten Sprache für die Vorerkennung ab), oder anhand anderer Attribute. Um sicherzustellen, dass das Programm die Zeilen korrekt in Wörter unterteilt, überprüfen Sie die Textobjekte in den Testbildern (Ansicht → Bilder → Objekte → Erkannte Wörter).
  3. Geben Sie in den Feldern Wortanzahl die Anzahl der Wörter in der Zeichenkette an. Die Anzahl der Wörter wird mithilfe eines Fuzzy-Intervalls angegeben. Das Standardintervall ist {-1,-1,INF,INF} (d. h., das Programm sucht nach Hypothesen mit beliebig vielen Wörtern).
  4. Geben Sie im Feld Maximale Leerzeichenlänge die maximale Länge des Leerzeichens innerhalb des Objekts an. Sie wird in benutzerdefinierten Maßeinheiten gemessen. Sie können die Länge des Leerzeichens schätzen, indem Sie die Koordinaten der benachbarten Objekte betrachten. Bewegen Sie den Mauszeiger auf eines der benachbarten Objekte, um seine Koordinaten in der Statusleiste anzuzeigen. Bei der Suche nach Text werden der Zeichenkette so lange Zeichen hinzugefügt, bis der Abstand zwischen benachbarten Elementen die maximale Leerzeichenlänge überschreitet.
  5. Geben Sie im Feld Zeichenanzahl die Länge der Zeichenkette an (d. h. die Anzahl der Zeichen in der Zeichenkette). Die Anzahl der Zeichen wird mithilfe eines Fuzzy-Intervalls angegeben und dient zur Bewertung der Qualität der Hypothese anhand ihrer Länge. Verwenden Sie die Schaltfläche , um Fuzzy-Intervalle in einem separaten Fenster anzugeben, in dem sie zur besseren Übersicht visualisiert werden.

Siehe auch:

Elemente erstellen und löschen Übersicht über die Elementeigenschaften Suchbereich Zusätzliche Suchbedingungen für das Zeichenkette-Element