Vai al contenuto principale
Dopo l’elaborazione di un documento — tramite l’API o l’interfaccia web — Vantage restituisce dati strutturati contenenti i valori dei field estratti, i punteggi di attendibilità e i flag di verifica. Questa pagina spiega come interpretare l’output.

Panoramica della struttura di Result

Ogni risultato segue la stessa gerarchia:
ExtractedDataTransaction
├── SkillName, SkillId
├── Documents[]
│   ├── ExtractedData
│   │   ├── DocumentDefinition    ← schema dei field (cosa può essere estratto)
│   │   └── RootObject            ← valori dei field (cosa è stato estratto)
│   │       └── Fields[]
│   │           ├── Name
│   │           └── List[]
│   │               ├── Value
│   │               ├── Annotation (Confidence, RawValue, ...)
│   │               ├── NeedVerification
│   │               └── isVerified
│   └── ClassificationResult      ← tipo di documento (se è stata applicata la classificazione)
└── SourceFiles[]
Nella maggior parte dei casi d’uso, è sufficiente andare a Documents[0].ExtractedData.RootObject.Fields per accedere ai valori estratti.

Lettura dei fields estratti

Ecco un esempio semplificato tratto da una fattura elaborata con la skill ABBYY Invoice:
{
  "SkillName": "ABBYY Invoice",
  "SkillId": "a1b2c3d4-...",
  "Documents": [
    {
      "ExtractedData": {
        "RootObject": {
          "Fields": [
            {
              "Name": "InvoiceNumber",
              "List": [
                {
                  "Value": "INV-2024-0042",
                  "Annotation": {
                    "Confidence": 97,
                    "RawValue": "INV-2024-0042",
                    "Source": "Text"
                  },
                  "NeedVerification": false,
                  "isVerified": false
                }
              ]
            },
            {
              "Name": "InvoiceDate",
              "List": [
                {
                  "Value": "2024-03-15",
                  "Annotation": {
                    "Confidence": 94,
                    "RawValue": "March 15, 2024",
                    "Source": "Text"
                  },
                  "NeedVerification": false,
                  "isVerified": false
                }
              ]
            },
            {
              "Name": "TotalAmount",
              "List": [
                {
                  "Value": "1,250.00",
                  "Annotation": {
                    "Confidence": 62,
                    "RawValue": "1.250,00",
                    "Source": "Image"
                  },
                  "NeedVerification": true,
                  "isVerified": false
                }
              ]
            }
          ]
        }
      }
    }
  ]
}
Ogni field contiene:
PropertyCosa significa
NameIl nome del field definito dalla skill (ad es. “InvoiceNumber”, “VendorName”)
ValueIl valore estratto dopo la normalizzazione: le date vengono convertite nel formato ISO e i numeri standardizzati
Annotation.ConfidenceUn numero intero da 0 a 100 che indica quanto Vantage sia sicuro dell’estrazione
Annotation.RawValueIl testo originale riconosciuto tramite OCR, prima di qualsiasi normalizzazione
Annotation.SourceSe il valore proviene dal livello Text del documento o è stato letto dall’Image
NeedVerificationtrue se il field è stato contrassegnato per la revisione manuale (ad es. per bassa confidenza o mancato superamento di una regola di validazione)
isVerifiedtrue se un operatore umano ha già confermato il valore nella revisione manuale
Nota come TotalAmount sopra abbia Confidence: 62 e NeedVerification: true. Il valore grezzo 1.250,00 (formato europeo) è stato normalizzato in 1,250.00, ma la bassa confidenza suggerisce che Vantage non fosse del tutto sicuro del risultato OCR. Questo è esattamente il tipo di field che un revisore umano controllerebbe.

Fields di tabella (Righe articolo)

Le skill che estraggono tabelle, come le Righe articolo di una fattura, le rappresentano come fields che contengono gruppi ripetuti. Ogni riga appare come un ExtractedObject all’interno dell’array List del field, con i propri fields secondari:
{
  "Name": "LineItems",
  "List": [
    {
      "Fields": [
        { "Name": "Description", "List": [{ "Value": "Consulting services", ... }] },
        { "Name": "Quantity",    "List": [{ "Value": "10", ... }] },
        { "Name": "UnitPrice",   "List": [{ "Value": "100.00", ... }] },
        { "Name": "Amount",      "List": [{ "Value": "1,000.00", ... }] }
      ]
    },
    {
      "Fields": [
        { "Name": "Description", "List": [{ "Value": "Travel expenses", ... }] },
        { "Name": "Quantity",    "List": [{ "Value": "1", ... }] },
        { "Name": "UnitPrice",   "List": [{ "Value": "250.00", ... }] },
        { "Name": "Amount",      "List": [{ "Value": "250.00", ... }] }
      ]
    }
  ]
}
Ogni riga ha la stessa struttura dei field, il che rende semplice iterare nel codice.

Punteggi di confidenza nella pratica

I punteggi di confidenza riflettono quanto Vantage sia sicuro di un valore estratto. Diversi fattori influiscono sulla confidenza:
  • Qualità del documento — scansioni sfocate, immagini a bassa risoluzione o testo scritto a mano producono punteggi più bassi
  • Complessità del layout — strutture di tabella insolite o fields sovrapposti possono ridurre l’accuratezza
  • Corrispondenza con i dati di training — i valori che corrispondono strettamente agli schemi su cui è stata addestrata la skill ottengono punteggi più alti
Come utilizzare la confidenza a livello di codice:
  • Confidenza alta (90–100) — accetta automaticamente il valore
  • Confidenza media (70–89) — accettalo con cautela oppure invialo in revisione per i fields critici
  • Confidenza bassa (inferiore a 70) — invialo alla revisione manuale per una verifica umana
I fields con NeedVerification: true sono già stati contrassegnati da Vantage in base alle soglie di confidenza e alle regole di validazione configurate nella skill.

Nomi comuni dei field per le skill

Ogni skill definisce il proprio insieme di nomi dei field. Ecco i field più comuni per le skill usate più di frequente:
SkillFields principali
FatturaInvoiceNumber, InvoiceDate, VendorName, TotalAmount, TaxAmount, LineItems
RicevutaReceiptNumber, Date, VendorName, Total, Tax, PaymentMethod, LineItems
Ordine d’acquistoPONumber, OrderDate, BuyerName, SupplierName, TotalAmount, LineItems
Documento d’identitàFirstName, LastName, DateOfBirth, DocumentNumber, ExpirationDate, Nationality
Questi sono i field più comuni. Ogni skill può includere fields aggiuntivi. Consulta lo Skill Catalog per vedere l’elenco completo dei fields di qualsiasi skill.

Passi successivi

Schema JSON completo

Riferimento completo di tutti gli oggetti e le proprietà nell’output JSON.

Output XML

Formato di output alternativo con gli stessi dati estratti in una struttura XML.

Revisione manuale

Configura la verifica umana dei fields estratti.

Cosa approfondire dopo

Scegli il tuo percorso nella documentazione di Vantage in base ai tuoi obiettivi.