Vai al contenuto principale
Lo schema descritto in questo articolo determina la struttura dei file JSON che contengono i risultati dell’elaborazione dei documenti per una Skill OCR. Questi file memorizzano informazioni sugli elementi grafici, sugli elementi di testo, sulle tabelle e sugli elenchi rilevati nell’immagine, nonché informazioni sulla struttura stimata del documento: tutto il testo rilevato è suddiviso in paragrafi, a ciascuno dei quali è assegnata una funzione specifica. I paragrafi sono raggruppati in sezioni logiche. Tutte le proprietà degli oggetti, i relativi tipi di dati e i valori consentiti sono elencati nello schema JSON; si consiglia pertanto di conoscerlo per facilitare la configurazione degli strumenti utilizzati per analizzare i file JSON. È possibile scaricare qui lo schema JSON per le Skill OCR. L’oggetto radice descrive l’intero documento riconosciuto. Le informazioni generali sul documento sono memorizzate negli oggetti layout e content. L’oggetto layout descrive i parametri dell’immagine e tutti gli elementi grafici e di testo rilevati, mentre l’oggetto content descrive i componenti di dati del documento e la loro posizione nella relativa struttura logica. La tabella seguente elenca tutte le proprietà dell’oggetto radice:
PropertyData typeDescription
version *stringLa versione del documento di schema JSON. Impostata sul seguente valore per impostazione predefinita: Vantage OCR.Skill JSON output v1.0
producer *stringL’origine del file JSON. Impostata sul seguente valore per impostazione predefinita: ABBYY Vantage OCR.Skill
languagesstring arrayElenco di tutte le lingue rilevate nel documento.
layoutobjectStruttura fisica (layout) del documento.
contentobjectContenuto (struttura logica del documento).
  • Indica una proprietà obbligatoria.