Zum Hauptinhalt springen
Formate werden mithilfe erweiterter regulärer Ausdrücke angegeben. Erweiterte reguläre Ausdrücke umfassen die folgenden Erweiterungen:
  1. Spezielle Klammern [% und %]. Zeichen innerhalb dieser Klammern werden um häufige OCR-Fehler ergänzt. Zum Beispiel kann [%S%] S, $ und 5 zulassen.
  2. Spezielle Wörter innerhalb von [%…%] für gängige Zeichensätze und OCR-Fehler:
  3. LETTERS - Großbuchstaben des lateinischen Alphabets und Zeichen, die häufig als solche erkannt werden
  4. DIGITS - Ziffern und Zeichen, die häufig als Ziffern erkannt werden
  5. LETERSANDDIGITS - Großbuchstaben des lateinischen Alphabets, Ziffern und Zeichen, die häufig als Großbuchstaben des lateinischen Alphabets oder als Ziffern erkannt werden
Zum Beispiel steht [%DIGITS%]{9} für neun aufeinanderfolgende Ziffern oder typische OCR-Fehler bei Ziffern, z. B. “OI234Sb7B9”.