Vai al contenuto principale
Lo schema descritto in questo articolo determina la struttura dei file JSON che contengono i risultati dell’elaborazione dei documenti per una Skill di OCR. Questi file memorizzano informazioni su elementi grafici, elementi di testo, tabelle ed elenchi rilevati nell’immagine, nonché informazioni sulla struttura stimata del documento: tutto il testo rilevato è suddiviso in paragrafi, a ciascuno dei quali viene assegnata una funzione specifica. I paragrafi sono raggruppati in sezioni logiche. Tutte le proprietà degli oggetti, i relativi tipi di dati e i valori consentiti sono elencati nello schema JSON; pertanto, si consiglia di familiarizzare con esso per facilitare la configurazione degli strumenti per l’analisi dei file JSON. Puoi scaricare qui lo schema JSON per le Skill OCR. L’oggetto radice descrive l’intero documento riconosciuto. Le informazioni generali sul documento sono memorizzate negli oggetti layout e content. L’oggetto layout descrive i parametri dell’immagine e tutti gli elementi grafici e di testo rilevati, mentre l’oggetto content descrive i componenti dati del documento e il loro posto nella sua struttura logica. La tabella seguente elenca tutte le proprietà dell’oggetto radice:
ProprietàTipo di datoDescrizione
version *stringLa versione del documento di schema JSON. Valore predefinito: Vantage OCR.Skill JSON output v1.0
producer *stringL’origine del file JSON. Valore predefinito: ABBYY Vantage OCR.Skill
languagesstring arrayElenco di tutte le lingue rilevate nel documento.
layoutobjectStruttura fisica (layout) del documento.
contentobjectContenuto (struttura logica del documento).
  • Indica una proprietà obbligatoria.