Zum Hauptinhalt springen
Jedes Element im pages-Array beschreibt eine einzelne Dokumentseite und enthält wiederum eigene Arrays, die die auf dieser Seite erkannten Texte, Tabellen, Bilder, Barcodes, Häkchen und Trennzeichen darstellen. Die Eigenschaften jedes Elements dienen dazu, die Koordinaten des entsprechenden Bereichs im Bild zu speichern. Der Vertrauenswert für die korrekte Erkennung wird ebenfalls in den Eigenschaften der Textelemente gespeichert.
Hinweis: Wenn das Dokument nach JSON, aber nicht in eines der Bildformate exportiert wird, werden die Koordinaten relativ zum Originalbild angegeben. Wenn das Dokument nach JSON und gleichzeitig in eines der Bildformate exportiert wird, werden die Koordinaten relativ zum vorverarbeiteten, exportierten Bild angegeben.
Alle Textelemente werden entweder dem texts-Array oder dem tables-Array zugeordnet.
PropertyData typeDescription
widthintegerDie Breite der Seite in Pixeln.
heightintegerDie Höhe der Seite in Pixeln.
rotatedstring enumDrehung der Seite relativ zum Originalbild. Mögliche Werte: none, clockwise, counterclockwise, upside-down
textsobject arrayArray von Textblöcken.
tablesobject arrayArray von Blöcken mit Tabellen.
picturespicture object arrayArray von Bildblöcken.
barcodesbarcode object arrayArray von Barcode‑Blöcken.
separatorsobject arrayArray von Trennzeichen‑Blöcken.
checkmarksobject arrayArray von Häkchen‑Blöcken.

Confidence

Alle Objekte, die erkannte Texte oder Bilder beschreiben, haben eine Eigenschaft namens confidence, die die Wahrscheinlichkeit angibt, dass der Text korrekt erkannt wurde. Zunächst wird ein Confidence-Wert für einzelne Zeichen berechnet. Der Confidence-Wert für Elemente höherer Ebenen wird anhand der Confidence-Werte der enthaltenen Elemente ermittelt. Für diese Eigenschaft ist ein spezieller Datentyp namens confidence definiert. Dieser Datentyp ist eine Ableitung des numerischen Datentyps. Zulässige Werte: 0 bis 100. Ein Wert von -1 kennzeichnet ein Element, das keine Textdaten enthält.