Vue d’ensemble de la structure de Result
Documents[0].ExtractedData.RootObject.Fields pour obtenir les valeurs extraites.
Lecture des champs extraits
| Property | Ce que cela signifie |
|---|---|
Name | Le nom du champ défini par la compétence (par ex. “InvoiceNumber”, “VendorName”) |
Value | La valeur extraite après normalisation — les dates sont converties au format ISO, les nombres sont standardisés |
Annotation.Confidence | Un entier de 0 à 100 indiquant le niveau de certitude de Vantage quant à l’extraction |
Annotation.RawValue | Le texte d’origine tel qu’il a été reconnu par l’OCR, avant toute normalisation |
Annotation.Source | Indique si la valeur provient du calque Text du document ou a été lue depuis l’Image |
NeedVerification | true si le champ a été signalé pour une relecture manuelle (par ex. faible confiance ou échec d’une règle de validation) |
isVerified | true si un opérateur humain a déjà confirmé la valeur dans la relecture manuelle |
Notez que
TotalAmount ci-dessus a Confidence: 62 et NeedVerification: true. La valeur brute 1.250,00 (format européen) a été normalisée en 1,250.00, mais ce faible niveau de confiance suggère que Vantage n’était pas totalement certain du résultat de l’OCR. C’est exactement le type de champ qu’un opérateur humain devrait vérifier.Champs de tableau (lignes d’articles)
ExtractedObject dans le tableau List du champ, avec ses propres sous-champs :
Scores de confiance en pratique
- Qualité du document — les numérisations floues, les images de faible résolution ou le texte manuscrit produisent des scores plus faibles
- Complexité de la mise en page — des tableaux à la mise en page inhabituelle ou des champs qui se chevauchent peuvent réduire la précision
- Correspondance avec les données d’entraînement — les valeurs qui correspondent étroitement aux motifs sur lesquels la compétence a été entraînée obtiennent des scores plus élevés
- Confiance élevée (90–100) — acceptez automatiquement la valeur
- Confiance moyenne (70–89) — acceptez-la avec prudence, ou envoyez-la en relecture pour les champs critiques
- Confiance faible (inférieure à 70) — envoyez-la en relecture manuelle pour vérification humaine
NeedVerification: true ont déjà été signalés par Vantage en fonction des seuils de confiance et des règles de validation configurés dans la compétence.
Noms de champs courants par compétence
| Compétence | Champs principaux |
|---|---|
| Facture | InvoiceNumber, InvoiceDate, VendorName, TotalAmount, TaxAmount, LineItems |
| Reçu | ReceiptNumber, Date, VendorName, Total, Tax, PaymentMethod, LineItems |
| Commande d’achat | PONumber, OrderDate, BuyerName, SupplierName, TotalAmount, LineItems |
| Pièce d’identité | FirstName, LastName, DateOfBirth, DocumentNumber, ExpirationDate, Nationality |
Il s’agit des champs les plus courants. Chaque compétence peut inclure des champs supplémentaires. Consultez le Skill Catalog pour voir la liste complète des champs de n’importe quelle compétence.
Prochaines étapes
Schéma JSON complet
Référence complète de tous les objets et de toutes les propriétés de la sortie JSON.
Sortie XML
Autre format de sortie contenant les mêmes données extraites, sous forme de structure XML.
Relecture manuelle
Configurez une vérification avec intervention humaine pour les champs extraits.
À découvrir ensuite
Choisissez votre parcours dans la documentation Vantage en fonction de vos objectifs.
