Comprendere i risultati

Dopo l’elaborazione di un documento — tramite l’API o l’interfaccia web — Vantage restituisce dati strutturati contenenti i valori dei field estratti, i punteggi di attendibilità e i flag di verifica. Questa pagina spiega come interpretare l’output.

Panoramica della struttura di Result

Ogni risultato segue la stessa gerarchia:

ExtractedDataTransaction
├── SkillName, SkillId
├── Documents[]
│   ├── ExtractedData
│   │   ├── DocumentDefinition    ← schema dei field (cosa può essere estratto)
│   │   └── RootObject            ← valori dei field (cosa è stato estratto)
│   │       └── Fields[]
│   │           ├── Name
│   │           └── List[]
│   │               ├── Value
│   │               ├── Annotation (Confidence, RawValue, ...)
│   │               ├── NeedVerification
│   │               └── isVerified
│   └── ClassificationResult      ← tipo di documento (se è stata applicata la classificazione)
└── SourceFiles[]

Nella maggior parte dei casi d’uso, è sufficiente andare a Documents[0].ExtractedData.RootObject.Fields per accedere ai valori estratti.

Lettura dei fields estratti

Ecco un esempio semplificato tratto da una fattura elaborata con la skill ABBYY Invoice:

{
  "SkillName": "ABBYY Invoice",
  "SkillId": "a1b2c3d4-...",
  "Documents": [
    {
      "ExtractedData": {
        "RootObject": {
          "Fields": [
            {
              "Name": "InvoiceNumber",
              "List": [
                {
                  "Value": "INV-2024-0042",
                  "Annotation": {
                    "Confidence": 97,
                    "RawValue": "INV-2024-0042",
                    "Source": "Text"
                  },
                  "NeedVerification": false,
                  "isVerified": false
                }
              ]
            },
            {
              "Name": "InvoiceDate",
              "List": [
                {
                  "Value": "2024-03-15",
                  "Annotation": {
                    "Confidence": 94,
                    "RawValue": "March 15, 2024",
                    "Source": "Text"
                  },
                  "NeedVerification": false,
                  "isVerified": false
                }
              ]
            },
            {
              "Name": "TotalAmount",
              "List": [
                {
                  "Value": "1,250.00",
                  "Annotation": {
                    "Confidence": 62,
                    "RawValue": "1.250,00",
                    "Source": "Image"
                  },
                  "NeedVerification": true,
                  "isVerified": false
                }
              ]
            }
          ]
        }
      }
    }
  ]
}

Ogni field contiene:

Property	Cosa significa
`Name`	Il nome del field definito dalla skill (ad es. “InvoiceNumber”, “VendorName”)
`Value`	Il valore estratto dopo la normalizzazione: le date vengono convertite nel formato ISO e i numeri standardizzati
`Annotation.Confidence`	Un numero intero da 0 a 100 che indica quanto Vantage sia sicuro dell’estrazione
`Annotation.RawValue`	Il testo originale riconosciuto tramite OCR, prima di qualsiasi normalizzazione
`Annotation.Source`	Se il valore proviene dal livello `Text` del documento o è stato letto dall’`Image`
`NeedVerification`	`true` se il field è stato contrassegnato per la revisione manuale (ad es. per bassa confidenza o mancato superamento di una regola di validazione)
`isVerified`	`true` se un operatore umano ha già confermato il valore nella revisione manuale

Nota come TotalAmount sopra abbia Confidence: 62 e NeedVerification: true. Il valore grezzo 1.250,00 (formato europeo) è stato normalizzato in 1,250.00, ma la bassa confidenza suggerisce che Vantage non fosse del tutto sicuro del risultato OCR. Questo è esattamente il tipo di field che un revisore umano controllerebbe.

Fields di tabella (Righe articolo)

Le skill che estraggono tabelle, come le Righe articolo di una fattura, le rappresentano come fields che contengono gruppi ripetuti. Ogni riga appare come un ExtractedObject all’interno dell’array List del field, con i propri fields secondari:

{
  "Name": "LineItems",
  "List": [
    {
      "Fields": [
        { "Name": "Description", "List": [{ "Value": "Consulting services", ... }] },
        { "Name": "Quantity",    "List": [{ "Value": "10", ... }] },
        { "Name": "UnitPrice",   "List": [{ "Value": "100.00", ... }] },
        { "Name": "Amount",      "List": [{ "Value": "1,000.00", ... }] }
      ]
    },
    {
      "Fields": [
        { "Name": "Description", "List": [{ "Value": "Travel expenses", ... }] },
        { "Name": "Quantity",    "List": [{ "Value": "1", ... }] },
        { "Name": "UnitPrice",   "List": [{ "Value": "250.00", ... }] },
        { "Name": "Amount",      "List": [{ "Value": "250.00", ... }] }
      ]
    }
  ]
}

Ogni riga ha la stessa struttura dei field, il che rende semplice iterare nel codice.

Punteggi di confidenza nella pratica

I punteggi di confidenza riflettono quanto Vantage sia sicuro di un valore estratto. Diversi fattori influiscono sulla confidenza:

Qualità del documento — scansioni sfocate, immagini a bassa risoluzione o testo scritto a mano producono punteggi più bassi
Complessità del layout — strutture di tabella insolite o fields sovrapposti possono ridurre l’accuratezza
Corrispondenza con i dati di training — i valori che corrispondono strettamente agli schemi su cui è stata addestrata la skill ottengono punteggi più alti

Come utilizzare la confidenza a livello di codice:

Confidenza alta (90–100) — accetta automaticamente il valore
Confidenza media (70–89) — accettalo con cautela oppure invialo in revisione per i fields critici
Confidenza bassa (inferiore a 70) — invialo alla revisione manuale per una verifica umana

I fields con NeedVerification: true sono già stati contrassegnati da Vantage in base alle soglie di confidenza e alle regole di validazione configurate nella skill.

Nomi comuni dei field per le skill

Ogni skill definisce il proprio insieme di nomi dei field. Ecco i field più comuni per le skill usate più di frequente:

Skill	Fields principali
Fattura	`InvoiceNumber`, `InvoiceDate`, `VendorName`, `TotalAmount`, `TaxAmount`, `LineItems`
Ricevuta	`ReceiptNumber`, `Date`, `VendorName`, `Total`, `Tax`, `PaymentMethod`, `LineItems`
Ordine d’acquisto	`PONumber`, `OrderDate`, `BuyerName`, `SupplierName`, `TotalAmount`, `LineItems`
Documento d’identità	`FirstName`, `LastName`, `DateOfBirth`, `DocumentNumber`, `ExpirationDate`, `Nationality`

Questi sono i field più comuni. Ogni skill può includere fields aggiuntivi. Consulta lo Skill Catalog per vedere l’elenco completo dei fields di qualsiasi skill.

Passi successivi

Schema JSON completo

Riferimento completo di tutti gli oggetti e le proprietà nell’output JSON.

Output XML

Formato di output alternativo con gli stessi dati estratti in una struttura XML.

Revisione manuale

Configura la verifica umana dei fields estratti.

Cosa approfondire dopo

Scegli il tuo percorso nella documentazione di Vantage in base ai tuoi obiettivi.

Guida introduttiva

Approfondimenti

Panoramica della struttura di Result

Lettura dei fields estratti

Fields di tabella (Righe articolo)

Punteggi di confidenza nella pratica

Nomi comuni dei field per le skill

Passi successivi

Schema JSON completo

Output XML

Revisione manuale

Cosa approfondire dopo

Guida introduttiva

Approfondimenti

​Panoramica della struttura di Result

​Lettura dei fields estratti

​Fields di tabella (Righe articolo)

​Punteggi di confidenza nella pratica

​Nomi comuni dei field per le skill

​Passi successivi

Schema JSON completo

Output XML

Revisione manuale

Cosa approfondire dopo

Panoramica della struttura di Result

Lettura dei fields estratti

Fields di tabella (Righe articolo)

Punteggi di confidenza nella pratica

Nomi comuni dei field per le skill

Passi successivi