結果の構造の概要
Documents[0].ExtractedData.RootObject.Fields をたどるだけで十分です。
抽出されたフィールドの見方
| Property | 意味 |
|---|---|
Name | Skillで定義されたfield名 (例: “InvoiceNumber”、“VendorName”) |
Value | 正規化後の抽出値 — 日付はISO形式に変換され、数値は標準化されます |
Annotation.Confidence | 抽出結果に対するVantageの確信度を示す、0~100の整数 |
Annotation.RawValue | 正規化前の、OCRで認識された元のテキスト |
Annotation.Source | 値の取得元がドキュメントの Text レイヤーか、Image からの読み取りかを示します |
NeedVerification | fieldが人による確認対象としてフラグ付けされている場合は true (例: 確信度が低い、または検証ルールに失敗した場合) |
isVerified | 手動確認でオペレーターがすでにその値を確認済みの場合は true |
上の
TotalAmount が Confidence: 62、NeedVerification: true になっている点に注目してください。生の値 1.250,00 (欧州形式) は 1,250.00 に正規化されていますが、確信度が低いため、VantageはOCR結果に完全な確信を持てていなかったことがわかります。これはまさに、人による確認が必要な種類のfieldです。テーブル fields (明細)
List 配列内の ExtractedObject として表され、それぞれ独自のサブfieldを持ちます。
実際の運用における信頼度スコア
- 文書品質 — 不鮮明なスキャン、低解像度の画像、または手書き文字はスコアを低下させます
- レイアウトの複雑さ — 特殊な表レイアウトや重なり合ったフィールドは、精度を低下させる可能性があります
- トレーニングデータとの一致度 — Skill のトレーニング時に学習したパターンによく一致する値ほど、高いスコアになります
- 高信頼度 (90–100) — 値を自動的に受け入れます
- 中信頼度 (70–89) — 注意して受け入れるか、重要なフィールドは確認に回します
- 低信頼度 (70 未満) — 人による確認のために手動確認に回します
NeedVerification: true のfieldsは、Skill で設定された信頼度のしきい値とバリデーションルールに基づいて、Vantage によってすでにフラグ付けされています。
Skill別の一般的なfield名
| Skill | 主要項目 |
|---|---|
| Invoice | InvoiceNumber, InvoiceDate, VendorName, TotalAmount, TaxAmount, LineItems |
| Receipt | ReceiptNumber, Date, VendorName, Total, Tax, PaymentMethod, LineItems |
| 購買注文書 | PONumber, OrderDate, BuyerName, SupplierName, TotalAmount, LineItems |
| ID文書 | FirstName, LastName, DateOfBirth, DocumentNumber, ExpirationDate, Nationality |
これらは代表的なfieldsです。各Skillには、このほかのfieldが含まれる場合があります。任意のSkillの完全なfield一覧を確認するには、Skill Catalogをご覧ください。
次のステップ
完全なJSONスキーマ
JSON 出力内のすべてのオブジェクトとプロパティの完全なリファレンスです。
XML出力
同じ抽出データを XML 構造で提供する別の出力形式です。
手動確認
抽出されたfieldsに対する人手による検証を設定します。
次に学ぶこと
目的に応じて、Vantage ドキュメントの読み進め方を選択します。
