Ergebnisstruktur im Überblick
Documents[0].ExtractedData.RootObject.Fields navigieren, um auf die extrahierten Werte zuzugreifen.
Extrahierte Felder lesen
| Eigenschaft | Bedeutung |
|---|---|
Name | Der vom Skill definierte Feldname (z. B. “InvoiceNumber”, “VendorName”) |
Value | Der extrahierte Wert nach der Normalisierung – Datumsangaben werden ins ISO-Format umgewandelt, Zahlen standardisiert |
Annotation.Confidence | Ein ganzzahliger Wert von 0 bis 100, der angibt, wie sicher Vantage bei der Extraktion ist |
Annotation.RawValue | Der ursprüngliche Text, wie er durch Optical Character Recognition (OCR) erkannt wurde, vor jeglicher Normalisierung |
Annotation.Source | Gibt an, ob der Wert aus der Text-Ebene des Dokuments stammt oder aus dem Image ausgelesen wurde |
NeedVerification | true, wenn das Feld zur manuellen Überprüfung markiert wurde (z. B. bei geringer Konfidenz oder fehlgeschlagener Validierungsregel) |
isVerified | true, wenn ein menschlicher Bearbeiter den Wert in der Manuellen Überprüfung bereits bestätigt hat |
Beachten Sie, dass
TotalAmount oben Confidence: 62 und NeedVerification: true aufweist. Der Rohwert 1.250,00 (europäisches Format) wurde zu 1,250.00 normalisiert, die geringe Konfidenz deutet jedoch darauf hin, dass Vantage beim OCR-Ergebnis nicht vollständig sicher war. Genau solche Felder würde ein menschlicher Prüfer kontrollieren.Tabellenfelder (Positionen)
ExtractedObject innerhalb des List-Arrays des Feldes mit eigenen Unterfeldern:
Konfidenzwerte in der Praxis
- Dokumentqualität — unscharfe Scans, Bilder mit niedriger Auflösung oder handschriftlicher Text führen zu niedrigeren Werten
- Layoutkomplexität — ungewöhnliche Tabellenlayouts oder sich überlappende Felder können die Genauigkeit verringern
- Übereinstimmung mit den Trainingsdaten — Werte, die den Mustern, auf denen der Skill trainiert wurde, stark entsprechen, erzielen höhere Werte
- Hohe Konfidenz (90–100) — den Wert automatisch akzeptieren
- Mittlere Konfidenz (70–89) — mit Vorsicht akzeptieren oder bei kritischen Feldern zur Überprüfung weiterleiten
- Niedrige Konfidenz (unter 70) — zur Manuellen Überprüfung zur manuellen Prüfung weiterleiten
NeedVerification: true wurden von Vantage bereits anhand der im Skill konfigurierten Konfidenzschwellen und Validierungsregeln markiert.
Häufige Feldnamen pro Skill
| Skill | Wichtige Felder |
|---|---|
| Rechnung | InvoiceNumber, InvoiceDate, VendorName, TotalAmount, TaxAmount, LineItems |
| Kassenbon | ReceiptNumber, Date, VendorName, Total, Tax, PaymentMethod, LineItems |
| Bestellung | PONumber, OrderDate, BuyerName, SupplierName, TotalAmount, LineItems |
| Ausweisdokument | FirstName, LastName, DateOfBirth, DocumentNumber, ExpirationDate, Nationality |
Dies sind die häufigsten Felder. Jeder Skill kann zusätzliche Felder enthalten. Im Skill Catalog finden Sie die vollständige Feldliste für jeden Skill.
Nächste Schritte
Vollständiges JSON-Schema
Vollständige Referenz für alle Objekte und Eigenschaften in der JSON-Ausgabe.
XML-Ausgabe
Alternatives Ausgabeformat mit denselben extrahierten Daten in einer XML-Struktur.
Manuelle Überprüfung
Richten Sie die Überprüfung extrahierter Felder mit menschlicher Beteiligung ein.
Was Sie als Nächstes lernen
Wählen Sie anhand Ihrer Ziele den passenden Weg durch die Vantage-Dokumentation.
