Zum Hauptinhalt springen
Jedes Element im pages-Array beschreibt eine einzelne Dokumentseite und enthält wiederum eigene Arrays, die Texte, Tabellen, Bilder, Barcodes, Ankreuzfelder und Trennzeichen repräsentieren, die auf dieser Seite erkannt wurden. Die Eigenschaften jedes Elements werden verwendet, um Koordinaten für den entsprechenden Bereich auf dem Bild zu speichern. Der Konfidenzwert dafür, dass das Element korrekt erkannt wurde, wird ebenfalls in den Eigenschaften der Textelemente gespeichert.
Hinweis: Wenn das Dokument in JSON, aber nicht in eines der Bildformate exportiert wird, werden die Koordinaten relativ zum Originalbild angegeben. Wenn das Dokument in JSON und gleichzeitig in eines der Bildformate exportiert wird, werden die Koordinaten relativ zu dem vorverarbeiteten Bild angegeben, das exportiert wird.
Alle Textelemente werden entweder in das texts-Array oder in das tables-Array aufgenommen.
PropertyData typeDescription
widthintegerDie Breite der Seite in Pixeln.
heightintegerDie Höhe der Seite in Pixeln.
rotatedstring enumDrehung der Seite relativ zum Originalbild. Mögliche Werte: none, clockwise, counterclockwise, upside-down
textsobject arrayArray von Textblöcken.
tablesobject arrayArray von Blöcken, die Tabellen enthalten.
picturespicture object arrayArray von Bildblöcken.
barcodesbarcode object arrayArray von Barcode-Blöcken.
separatorsobject arrayArray von Trennzeichenblöcken.
checkmarksobject arrayArray von Ankreuzfeld-Blöcken.

Confidence

Alle Objekte, die erkannte Texte oder Bilder beschreiben, haben eine Eigenschaft namens confidence, die die Wahrscheinlichkeit angibt, dass der Text korrekt erkannt wurde. Zunächst wird ein Confidence-Wert für einzelne Zeichen berechnet. Der Confidence-Wert für Elemente höherer Ebenen wird anhand der Confidence-Werte der enthaltenen Elemente ermittelt. Für diese Eigenschaft ist ein spezieller Datentyp namens confidence definiert. Dieser Datentyp ist eine Ableitung des numerischen Datentyps. Zulässige Werte: 0 bis 100. Ein Wert von -1 kennzeichnet ein Element, das keine Textdaten enthält.