Schema JSON della Skill OCR

Lo schema descritto in questo articolo determina la struttura dei file JSON che contengono i risultati dell’elaborazione dei documenti per una Skill OCR. Questi file memorizzano informazioni sugli elementi grafici, sugli elementi di testo, sulle tabelle e sugli elenchi rilevati nell’immagine, nonché informazioni sulla struttura stimata del documento: tutto il testo rilevato è suddiviso in paragrafi, a ciascuno dei quali è assegnata una funzione specifica. I paragrafi sono raggruppati in sezioni logiche. Tutte le proprietà degli oggetti, i relativi tipi di dati e i valori consentiti sono elencati nello schema JSON; si consiglia pertanto di conoscerlo per facilitare la configurazione degli strumenti utilizzati per analizzare i file JSON. È possibile scaricare qui lo schema JSON per le Skill OCR. L’oggetto radice descrive l’intero documento riconosciuto. Le informazioni generali sul documento sono memorizzate negli oggetti layout e content. L’oggetto layout descrive i parametri dell’immagine e tutti gli elementi grafici e di testo rilevati, mentre l’oggetto content descrive i componenti di dati del documento e la loro posizione nella relativa struttura logica. La tabella seguente elenca tutte le proprietà dell’oggetto radice:

Property	Data type	Description
`version` *	`string`	La versione del documento di schema JSON. Impostata sul seguente valore per impostazione predefinita: Vantage OCR.Skill JSON output v1.0
`producer` *	`string`	L’origine del file JSON. Impostata sul seguente valore per impostazione predefinita: ABBYY Vantage OCR.Skill
`languages`	`string array`	Elenco di tutte le lingue rilevate nel documento.
layout	`object`	Struttura fisica (layout) del documento.
content	`object`	Contenuto (struttura logica del documento).

Indica una proprietà obbligatoria.

Guida per gli sviluppatori

Panoramica

API REST di Vantage Processing

API di reportistica di Vantage