Zum Hauptinhalt springen
Ein Content-Objekt beschreibt die logische Struktur eines Dokuments, indem es verschiedene logische Abschnitte auf einer Seite definiert. Diese Abschnitte können aus mehreren Spalten bestehen. Jeder Text innerhalb eines Abschnitts wird in Absätze aufgeteilt, von denen jeder eine bestimmte Funktion zugewiesen bekommt (z. B. Überschrift, Haupttext, Kopf-/Fußzeile, Notiz usw.). Wenn in einem Dokument Listen erkannt werden, legen die Eigenschaften der zugehörigen Absätze die Listenebene und die Position des Absatzes innerhalb der Liste fest. Die Struktur einer Liste wird in einem separaten Objekt-Array beschrieben.
EigenschaftDatentypBeschreibung
paragraphsobject arrayEin Array von Dokumentabsätzen, in Lesereihenfolge sortiert.
listsobject arrayEin Array aller Listen, die in einem Dokument erkannt wurden.