Zum Hauptinhalt springen
Das in diesem Artikel beschriebene Schema legt die Struktur von JSON-Dateien fest, die Verarbeitungsergebnisse für eine OCR-Skill enthalten. Diese Dateien speichern Informationen über grafische Elemente, Textelemente, Tabellen und Listen, die im Bild erkannt wurden, sowie Informationen über die ermittelte Dokumentstruktur: Aller erkannter Text wird in Absätze unterteilt, denen jeweils eine bestimmte Funktion zugewiesen wird. Absätze werden zu logischen Abschnitten gruppiert. Alle Objekteigenschaften, ihre Datentypen und ihre zulässigen Werte sind im JSON-Schema aufgeführt. Daher empfehlen wir, sich damit vertraut zu machen, um das Einrichten von Tools zur Analyse von JSON-Dateien zu erleichtern. Das JSON-Schema für OCR-Skills kann hier heruntergeladen werden. Das Stammobjekt beschreibt das vollständig erkannte Dokument. Allgemeine Informationen über das Dokument sind in den Objekten layout und content gespeichert. Das Objekt layout beschreibt Bildparameter sowie alle erkannten grafischen und Textelemente, während das Objekt content die Datenkomponenten des Dokuments und deren Platz in seiner logischen Struktur beschreibt. Die folgende Tabelle listet alle Eigenschaften des Stammobjekts auf:
PropertyData typeDescription
version *stringDie Version des JSON-Schema-Dokuments. Standardwert: Vantage OCR.Skill JSON output v1.0
producer *stringDie Quelle der JSON-Datei. Standardwert: ABBYY Vantage OCR.Skill
languagesstring arrayEine Liste aller im Dokument erkannten Sprachen.
layoutobjectPhysische (Layout-)Struktur des Dokuments.
contentobjectInhalt (logische Struktur des Dokuments).
  • Kennzeichnet eine erforderliche Eigenschaft.