Zum Hauptinhalt springen
Das in diesem Artikel beschriebene Schema definiert die Struktur von JSON-Dateien mit Ergebnissen der Dokumentverarbeitung. Diese Dateien enthalten Informationen über grafische Elemente, Textelemente, Tabellen und Listen, die auf dem Bild erkannt wurden, sowie Informationen über die ermittelte Dokumentstruktur: Der gesamte erkannte Text wird in Absätze unterteilt, denen jeweils eine bestimmte Funktion zugewiesen wird. Absätze werden zu logischen Abschnitten gruppiert. Sie finden das JSON-Schema in der Datei ABBYY_Scheme_JSON.json. Diese Datei befindet sich im Ordner Headers für macOS bzw. im Ordner Inc für Linux und Windows (Start > Programme > ABBYY FineReader Engine 12 > Installationsordner > Ordner mit Include-Dateien). Das Wurzelobjekt beschreibt das gesamte erkannte Dokument. Allgemeine Informationen über das Dokument werden in den Objekten layout und content gespeichert. Das Objekt layout beschreibt Bildparameter sowie alle erkannten grafischen Elemente und Textelemente, während das Objekt content die Datenkomponenten des Dokuments und ihre Position in dessen logischer Struktur beschreibt. Die folgende Tabelle listet alle Eigenschaften des Wurzelobjekts auf:
EigenschaftDatentypBeschreibung
version*stringDie Version des JSON-Schemadokuments. Wird beim Export auf den folgenden Wert gesetzt: FineReader Engine 12
producer*stringDie Quelle der JSON-Datei. Wird beim Export auf den folgenden Wert gesetzt: FineReader Engine
languagesstring arrayEine Liste aller im Dokument erkannten Sprachen.
layoutobjectPhysische (Layout-)Struktur des Dokuments.
contentobjectInhalt (logische Struktur des Dokuments).
  • Kennzeichnet eine erforderliche Eigenschaft.