Zum Hauptinhalt springen
Sie können ein Textfeld auf eine der folgenden Arten hinzufügen:
  • Markieren Sie eine Feldregion auf dem Dokumentbild, indem Sie auf den Wert eines Feldes klicken (beim Darüberfahren grün hervorgehoben) oder indem Sie eine rechteckige Region um den Feldwert ziehen. Anschließend erscheint das neue Feld im Datenformular. Sie können den Feldnamen ändern, indem Sie im Datenformular darauf doppelklicken oder ihn in den Feldeigenschaften anklicken. Den gesamten Namen können Sie per Dreifachklick auswählen. Um die Feldeigenschaften zu öffnen, klicken Sie auf die Schaltfläche Field options.
  • Fügen Sie dem Datenformular ein neues Feld hinzu, indem Sie in der Symbolleiste auf Add Field klicken und anschließend die Feldregion auf dem Bild markieren. Dadurch werden die innerhalb der ausgewählten Region erkannten Daten als Feldwert im Datenformular übernommen.
Sie können im Datenformular bestehenden Feldern auch neue Text-Feldregionen hinzufügen, indem Sie das entsprechende Feld im Datenformular auswählen und dann seine Position auf dem Dokumentbild anklicken. Wenn ein Feld mehr als ein Wort enthalten soll, wählen Sie mehrere Wörter aus, indem Sie die gesamte Feldregion markieren.

Hinzufügen eines Textfelds mit mehreren Bereichen

Einige Textfelder benötigen in einem einzelnen Dokument mehrere Bereiche, und zwar aus folgenden Gründen:
  • Manche Feldwerte beginnen in einer Textzeile und enden in einer anderen.
  • Manche Feldwerte beginnen auf einer Seite und enden auf einer anderen.
So fügen Sie ein Textfeld mit mehreren Bereichen hinzu:
  • Fügen Sie ein Feld mit einer der oben beschriebenen Methoden hinzu.
  • Halten Sie die Taste Shift gedrückt und wählen Sie zusätzliche Bereiche für das hinzugefügte Feld aus.
Bereiche eines Textfelds können außerdem wie folgt markiert werden:
  • Auf verschiedenen Seiten
  • Innerhalb eines anderen Bereichs eines Felds (in diesem Fall wird der innere Bereich in einer dunkleren Farbe hervorgehoben; befindet er sich im Fokus, wird er gelb hervorgehoben).

Allgemeine Eigenschaften des Textfelds

  • Feldname. Der eindeutige Name des Felds in einem bestimmten Skill. Der Feldname darf keine Sonderzeichen wie Punkte, Kommas, Schrägstriche, Doppelpunkte, Sternchen, Fragezeichen, Anführungszeichen, Kleiner-als-Zeichen, Größer-als-Zeichen oder senkrechte Striche enthalten. Die maximal zulässige Länge eines Feldnamens beträgt 90 Zeichen.
  • Datentyp. Der Datentyp, den ein Feld enthält. Dies ist ein entscheidender Parameter des Textfelds, da er die Erkennungsgenauigkeit beeinflusst. Jeder Datentyp hat eigene Einschränkungen für den Feldwert, wodurch die möglichen Zeichenwerte eingegrenzt und die Datenerfassung präziser werden.
DatentypBeschreibung
TextKann lateinische und kyrillische Buchstaben, Ziffern, Logogramme und Sonderzeichen enthalten.
DateDatum und Uhrzeit in beliebigem Format. Folgende Zeichen können als Trennzeichen verwendet werden: der Punkt (.), das Leerzeichen ( ), der Bindestrich (-), der Backslash () und der Schrägstrich (/).
NumberKann Ziffern, Dezimaltrennzeichen und das Prozentzeichen (%) enthalten. Folgende Zeichen können als Dezimaltrennzeichen verwendet werden: der Punkt (.), das Komma (,), der Bindestrich (-), das Gleichheitszeichen (=) und das Leerzeichen ( ). Folgende Zeichen können als Tausendertrennzeichen verwendet werden: der Punkt (.), das Komma (,), das einfache Anführungszeichen (’ ) und das Leerzeichen ( ).
MoneyEnthält sowohl einen Zahlenwert als auch ein Währungssymbol. Das Währungssymbol kann entweder vor oder nach dem Amount stehen.
Beispiel: Der Kleinbuchstabe „l“ (L), der Großbuchstabe „I“ (i) und die Ziffer „1“ können ähnlich aussehen. Wird ein derartiges Zeichen in einem Number- oder Currency Amount-Feld erkannt, wird es als „1“ interpretiert, da Felder dieses Typs keine Buchstaben enthalten dürfen.
  • Mehrere Elemente zulassen. Legt fest, ob das Feld wiederholbar ist. Instanzen wiederholter Felder können sich auf mehrere Objekte desselben Typs beziehen, zum Beispiel Namen von Kindern oder Kontonummern.
  • Erforderliches Feld. Legt fest, dass der Wert des Felds nicht leer sein darf. Das Aktivieren dieser Eigenschaft fügt der Seite eine Validierungsregel hinzu. Ist das Feld nach der Extraktion leer, wird das Dokument mit einem Fehler zur Manuellen Überprüfung gesendet.
  • Schlüsselfeld. Legt fest, ob der Wert des Felds zur Suche nach Dokumenten verwendet wird.
  • Dimensionsfeld. Legt fest, ob der Wert des Felds verwendet wird, um detaillierte Informationen zu Skill-Vorgängen im Skill Monitor zu erhalten.

Textdarstellung

Diese Gruppe von Eigenschaften bezieht sich auf das Erscheinungsbild der im Feld erwarteten Zeichen.
  • Textursprung. Legt fest, ob das Feld nur gedruckte Zeichen, nur handschriftliche Zeichen oder beides enthalten darf. Wenn Sie ein Feld hinzufügen, indem Sie einen rechteckigen Bereich auf dem Dokument markieren, wird der Wert dieser Eigenschaft abhängig davon festgelegt, welche Zeichen in diesem Bereich gefunden werden. Wenn Sie ein Feld über Feld hinzufügen erstellen, ist der Wert dieser Eigenschaft standardmäßig auf Gedruckt festgelegt.
Eine Liste aller Sprachen, für die die Erkennung handschriftlichen Texts unterstützt wird, finden Sie hier.
Hinweis: Die Erkennung handschriftlichen Texts ist für neue Document-Skills standardmäßig aktiviert. Um sie zu deaktivieren oder erneut zu aktivieren, klicken Sie rechts neben dem Namen des Skills auf das Skill-Einstellungsicon und wechseln Sie anschließend zur Registerkarte Sprachen. Wählen Sie dort im Bereich Textdarstellung die Option Handwritten.
  • Feldhintergrund entfernen. Diese Option kann verwendet werden, um die Erkennungsgenauigkeit zu verbessern, wenn das Feld einen Rahmen, Kästchen für einzelne Zeichen oder Platzhaltertext enthält. Wenn Sie diese Option aktivieren, müssen Sie das leere Formulardokument hochladen, das als Vorlage für die Hintergrunderkennung verwendet wird, und das entsprechende Feld auf dem leeren Formular kennzeichnen. Das leere Formulardokument erscheint im Document-Set und ist mit einem Symbol markiert.
  • Spezielle Schriftarten. Wenn erwartet wird, dass das Feld Text in einer bestimmten Schriftart enthält, können Sie mit dieser Option die Schriftart auswählen, was die Erkennungsgenauigkeit verbessert. Es können auch mehrere Schriftarten ausgewählt werden.

Unterstützte Schriftarten

SchriftartBeschreibungSchriftart-Beispiel
FaxEine Schriftart, die typischerweise von Faxgeräten verwendet wird.Fax Font
GothicIn gebrochener Schrift gedruckte Texte.Gothic Font
IndexEin spezieller Zeichensatz, der nur Ziffern im Postleitzahl‑Stil enthält.Index Font
Matrix printerAuf einem Nadeldrucker gedruckte Texte.Matrix Font
MICR CMC-7Eine spezielle MICR‑Barcode‑Schriftart (CMC‑7).CMC-7 Font
MICR E-13BEin spezieller Satz numerischer Zeichen, die mit magnetischer Tinte gedruckt werden. MICR (Magnetic Ink Character Recognition)‑Zeichen finden sich auf verschiedenen Dokumenten, z. B. auf persönlichen Schecks.E-13B Font
OCR-AEine nichtproportionale Schriftart, die für Optical Character Recognition (OCR) entwickelt wurde. Wird häufig von Banken, Kreditkartenunternehmen und ähnlichen Branchen eingesetzt.OCR-A Font
OCR-BEine für Optical Character Recognition (OCR) entwickelte Schriftart.OCR-B Font
ReceiptDer Erkenner erwartet Text minderer Qualität, meist in einer nichtproportionalen oder normalen Schriftart, wie sie typischerweise auf Kassenbons verwendet wird.Receipt Font
TypewriterTexte in Maschinenschrift.Typewriter Font

Zusätzliche Eigenschaften des Text-Feldes

Zusätzliche Eigenschaften hängen vom für das Feld festgelegten Datentyp ab.

Text

Die Einstellungsgruppe Value:
  • Maximale Länge. Die maximal zulässige Anzahl von Zeichen im Feld. Überschreitet die Anzahl der Zeichen im extrahierten Wert diese Länge, wird eine Fehlermeldung angezeigt. Ist im Prozess eine Manuelle Überprüfung vorgesehen, wird das Dokument zur Manuellen Überprüfung gesendet.
  • Regulärer Ausdruck. Mit dieser Option können Sie einen regulären Ausdruck hinzufügen (d. h. eine formale Beschreibung der Struktur des Feldwerts). Ein mithilfe eines regulären Ausdrucks konfiguriertes Feld kann Buchstaben, Ziffern und andere Zeichen enthalten, wie im Datenformular festgelegt.
Die Verwendung eines regulären Ausdrucks kann die Extraktionsgenauigkeit verbessern, indem Muster im Text erkannt werden und der gültige Zeichensatz eingeschränkt wird. Enthält ein Textfeld beispielsweise nur Zahlen, können Sie einen regulären Ausdruck angeben, der die Struktur des Felds so beschreibt, dass nur Ziffern zulässig sind. In diesem Fall versucht das Programm beim Erkennen des Felds, jedes Zeichen als Ziffer zu interpretieren. Sie können außerdem einen regulären Ausdruck für ein bestimmtes Telefonnummernformat angeben (Beispiel 1) oder prüfen, ob das Feld zwei Wörter enthält und eines davon eine Zahl ist, zum Beispiel 50 lbs (Beispiel 2): Beispiel 1 (für Telefonnummern wie 1-(234)-567-8900 oder 2 (987) 654 3211)
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Beispiel 2 (für Gewichtsangaben wie 50lb/50lbs/50Lb/50Lbs/50 lb/50 lbs usw.)
/^[\d]*(\s)?(L|l)b(s)?$/
Hinweis: Reguläre Ausdrücke beeinflussen die Texterkennung eines PDF-Dokuments nicht.

Datum

Die Einstellungsgruppe Wert kann enthalten:
  • Uhrzeit. Diese Option sollte für Datumsfelder ausgewählt werden, die auch die Uhrzeit enthalten können. Ist ein Zeitwert nicht zulässig, wird er bei der Erkennung nicht extrahiert.
  • Wochentag. Diese Option ermöglicht es, den Wochentag im Datumsfeld anzugeben. Ist ein Wochentag nicht zulässig, wird er bei der Erkennung nicht extrahiert.
  • Monat als Name. Diese Option ermöglicht es, den Monat als Wort anzugeben.
Die Einstellungsgruppe Zulässige Reihenfolge der Komponenten ermöglicht die Auswahl eines geeigneten Datumsformats aus den folgenden Optionen: Tag-Monat-Jahr, Monat-Tag-Jahr und Jahr-Monat-Tag. Sie können auch mehrere unterschiedliche Formate gleichzeitig angeben. Wenn das erkannte Datumsformat nicht den angegebenen Datumsformaten entspricht, wird das Dokument mit einem Fehler zur manuellen Überprüfung gesendet. Die Einstellungsgruppe Zulässiges Datum ermöglicht es, einen Bereich gültiger Daten festzulegen. Sie können einen gültigen Bereich festlegen, indem Sie die Anzahl der Monate vor und nach dem Tag angeben, an dem das Dokument verarbeitet wurde. Die Anzahl der Monate sollte als ganze Zahl angegeben werden. Eine Regel prüft, ob das angegebene Datum innerhalb des festgelegten Bereichs liegt. Ist dies nicht der Fall, zeigt die Regel einen Fehler an und das Dokument wird zur manuellen Überprüfung gesendet.

Zahl

Die Einstellungsgruppe Wert ermöglicht es, festzulegen, um welche Art von Zahl es sich beim erkannten Wert handelt (Ganzzahl oder Dezimalzahl) sowie welche Zahlenformate in diesem Feld zulässig sind. Erfüllt der Wert dieses Felds die angegebenen Anforderungen nicht, wird das Dokument zur Manuellen Überprüfung gesendet.
  • Nur ganze Zahlen legt fest, dass der Wert nur eine Ganzzahl sein darf. Wird bei aktivierter Option eine Zahl mit einem Trennzeichen im Feld erkannt, wird dieses als Tausendertrennzeichen interpretiert.
  • Dezimalteil kann mehr als zwei Ziffern enthalten. Aktivieren Sie diese Option, wenn der Dezimalteil des extrahierten Werts voraussichtlich mehr als zwei Ziffern hat. Die folgenden Zeichen können als Dezimaltrennzeichen verwendet werden: Punkt (.), Komma (,), Bindestrich (-), Gleichheitszeichen (=) und Leerzeichen ( ).
  • Kann negative Werte haben. Diese Option erlaubt negative Werte. Negative Werte können entweder durch ein Minuszeichen oder durch Klammern dargestellt werden.
  • Kann das Symbol ’%’ enthalten. Diese Option erlaubt ein Prozentzeichen vor oder nach dem Wert.
Die Einstellungsgruppe Zahl muss innerhalb eines Intervalls liegen ermöglicht es, ein Intervall festzulegen, in das der Wert fallen muss, um gültig zu sein. Der Bereich des Intervalls wird festgelegt, indem ein Minimal- und ein Maximalwert angegeben werden. Diese Werte können sowohl Ganzzahlen als auch Dezimalzahlen sein; auch negative Werte sind möglich. Anschließend prüft eine Regel, ob der Wert innerhalb des angegebenen Bereichs liegt. Ist dies nicht der Fall, wird ein Fehler angezeigt und das Dokument zur Manuellen Überprüfung gesendet.

Geld

Die Eigenschaften von Geld entsprechen denen von Zahl, mit der einzigen Ausnahme, dass das Geld-Feld kein Prozentzeichen enthalten darf.

Siehe auch