Die Eigenschaften eines Static-Text-Elements
Dialogfeld „Properties“, Registerkarte „Static Text“ anzeigen
Dialogfeld „Properties“, Registerkarte „Static Text“ anzeigen

- Suchtext der Text, der im Bild gefunden werden soll. Wenn Sie eine Phrase oder mehrere Wörter finden müssen und wissen, dass sie immer in derselben Zeile stehen, empfiehlt es sich, Leerzeichen zu ignorieren (d. h. die Option Leerzeichen berücksichtigen deaktiviert zu lassen), da dies die Suche beschleunigt. In diesem Fall können Sie Ihre Suchphrase ohne Leerzeichen eingeben – das Programm entfernt sie ohnehin, wenn die Option Leerzeichen berücksichtigen nicht ausgewählt ist.
| Z. B.: | Um den Namen ‘Purchase Agreement’ zu finden, der in allen Dokumenten in einer Zeile steht, müssen Sie PURCHASEAGREEMENT eingeben. |
|---|
- Text aus Datenbank suchen Sie können im Bild nach einem Textfragment aus einer Datenbank suchen. Um in der Tabelle nach den relevanten Feldern zu suchen, wird eine SQL-Abfrage verwendet, die mit dem Befehl SELECT beginnt. Das Programm sucht im Bild nach dem Text, der im gefundenen Feld enthalten ist.
-
Geben Sie die Datenbank-Verbindungszeichenfolge in die Felder Connection string ein oder klicken Sie auf
, um das Standarddialogfeld für die Datenbankverbindung zu öffnen.
- Geben Sie Ihre Abfrage in das Feld Query text ein. Sie können auch auf
klicken, um ein separates Dateneingabefenster zu öffnen, in das Sie Ihre Abfrage eingeben können.
- Geben Sie Ihre Abfrage in das Feld Query text ein. Sie können auch auf
- Text aus Datei suchen Sie können nach einem Textfragment aus einer Datei suchen. Klicken Sie auf die Schaltfläche Browse…, um die gewünschte Datei auszuwählen. Ausführliche Informationen zur Verwendung von Datenbanken und Dateien finden Sie unter Verwenden von Datenbanken und Textdateien in der FlexiLayout-Sprache.
- Maximale Anzahl von Fehlern
- die maximale Anzahl von Fehlern in einem Wort. Das Programm prüft jedes Wort in der Phrase, wenn die Wörter in der Phrase durch Leerzeichen getrennt sind. Andernfalls wird die Phrase als ein einziges Wort behandelt. Wenn die Anzahl der Fehler in einem Wort größer ist als die in diesem Feld angegebene Zahl, gilt das Wort als nicht erkannt. Ein Fehler entspricht einem Lösch-, Einfüge- oder Ersetzungsvorgang, der erforderlich ist, um den Text so anzupassen, dass er dem im Feld Suchtext eingegebenen Text entspricht. Standardmäßig ist der Wert dieser Eigenschaft unbegrenzt.
| Z. B.: | Angenommen, das Feld Suchtext enthält das Wort ‘meet’ und die maximale Anzahl von Fehlern ist auf 1 gesetzt. Wenn das Programm in diesem Suchbereich das Wort ‘moot’ findet, enthält das Wort 2 Fehler, und das Wort ‘meet’ gilt als nicht gefunden. |
|---|
- Max. Fehlerprozentsatz der maximal zulässige Prozentsatz an Fehlern in einem Wort (berechnet als Verhältnis der Anzahl der Fehler in der Hypothese zur Anzahl der Buchstaben in der Hypothese). Wenn der Fehlerprozentsatz in einem Wort höher ist als der in diesem Feld angegebene Prozentsatz, wird das Wort als nicht erkannt betrachtet. Der Standardwert beträgt 30 %. Hinweis. Wenn Sie sowohl die maximale Anzahl von Fehlern als auch den maximalen Fehlerprozentsatz angeben, verwendet das Programm das strengere Kriterium und ignoriert das andere.
- Max. Leerzeichenlänge ermöglicht es Ihnen, die maximale Länge des Leerzeichens innerhalb des erkannten Objekts festzulegen.
- Nur ganze Wörter sucht nur nach ganzen Wörtern.
- Groß-/Kleinschreibung beachten aktiviert die Groß-/Kleinschreibung bei der Suche (das Programm unterscheidet zwischen Klein- und Großbuchstaben).
- Leerzeichen berücksichtigen ermöglicht Leerzeichen in der Suchzeichenfolge. Wenn diese Option nicht ausgewählt ist, werden Leerzeichen aus der Suchzeichenfolge entfernt. Das Ignorieren von Leerzeichen beschleunigt die Suche. Wenn sich Ihr Suchausdruck jedoch über mehrere Zeilen erstrecken kann oder wenn einige Wörter im Ausdruck fehlen können, müssen Sie die Option Leerzeichen berücksichtigen aktivieren und Ihren Suchausdruck unter Beibehaltung der Leerzeichen eingeben.
- Mehrere Zeilen zulassen - ermöglicht, dass der Ausdruck in mehreren Zeilen geschrieben wird.
- Umbruchstrafe - legt eine Strafe für Zeilenumbrüche zwischen Wörtern fest. Die Strafe ist eine Zahl von 0 bis 1. Die Quality der Hypothese wird mit dieser Zahl so oft multipliziert, wie es Zeilenumbrüche im Ausdruck gibt. Wenn Zeilenumbrüche im Ausdruck zulässig sind, setzen Sie diesen Parameter auf 1 (die Multiplikation der Quality der Hypothese mit 1 mindert ihre Quality nicht).
- Fehlende Wörter zulassen - ermöglicht fehlende Wörter im Ausdruck.
- Strafe für fehlende Wörter - legt eine Strafe für fehlende Wörter fest. Die Strafe ist eine Zahl von 0 bis 1. Die Quality der Hypothese wird mit dieser Zahl so oft multipliziert, wie es fehlende Wörter im Ausdruck gibt. Wenn einige Wörter im Ausdruck fehlen können, setzen Sie diesen Parameter auf 1 (die Multiplikation der Quality der Hypothese mit 1 mindert ihre Quality nicht).
Empfehlungen zum Erstellen eines Static Text-Elements
- Um sicherzustellen, dass der ausgewählte statische Text auf allen Bildern zuverlässig erkannt werden kann, sehen Sie sich die Ergebnisse der Vorerkennung auf allen Bildern an, indem Sie für Wörter bzw. Wortgruppen auf
oder
klicken. Vergewissern Sie sich, dass die Buchstaben korrekt zu Wörtern und die Wörter korrekt zu Zeilen gruppiert sind. - Wählen Sie nach Möglichkeit statischen Text in größerer Schrift, der selbst bei Scans schlechter Qualität unverändert bleibt oder bei dem die Anzahl der OCR-Fehler vorhersehbar ist.
- Wenn die Dokumente nur klein gedruckten statischen Text enthalten, der während der Vorerkennung nicht zuverlässig erkannt werden kann (d. h. Anzahl und Art der Fehler unterscheiden sich bei verschiedenen Bildern stark), sollten solche Textfragmente besser nicht als Static Text, sondern als Object Collection mit ausgewählten Optionen Text und Punctuation mark beschrieben werden. (Möglicherweise müssen Sie auch die Option Picture auswählen – klicken Sie dazu auf
(Raw Objects ) in der Symbolleiste und wählen Sie das entsprechende Objekt im Bild aus. Der Objekttyp wird in der Zeile DataType im Fenster Properties angezeigt.) - Es empfiehlt sich, eindeutige statische Textfragmente auszuwählen, um falsche Treffer zu vermeiden und zusätzliche Suchbedingungen auf ein Minimum zu beschränken.
- Wenn es sowohl einwortige Namen gibt (die Sie mithilfe von Static Text-Elementen finden möchten) als auch mehrwortige Namen, die dieselben Wörter wie die einwortigen Namen enthalten, erstellen Sie zuerst Elemente für die Wortgruppen. Dadurch wird verhindert, dass das Programm einwortige Namen fälschlicherweise innerhalb mehrwortiger Namen erkennt.
Empfehlungen für hieroglyphische Sprachen
Für diese Sprachen ist eine Ganzwortsuche nicht verfügbar, da Texte in diesen Sprachen häufig nicht explizit in Wörter unterteilt werden.
