Document Skill Designer の Results タブには、Document skills の field 抽出に関する統計が表示されます。これらの統計を利用して、抽出品質の改善に役立てることができます。 skill で抽出されたすべての fields は、Fields 列に表示されます。group に属する fields は、group 名の付いた折りたたみ式のドロップダウンにまとめられます。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.

-
Accuracy — 値が正しく抽出された fields の割合。field ごと、およびすべての fields 全体 (ALL FIELDS 行) について表示されます。
field ごとの精度は、次の式で計算されます。
ALL FIELDS 行でも同じ式を使用しますが、各項目はすべての fields を集計した値です。
- Correct — 抽出値が参照値と一致した field インスタンスの数。
- Recognition Issue — documents内では検出されたものの、正しく認識されなかった field インスタンスの数。
- Located Incorrectly — ラベリング時とは異なる位置で領域が検出されたため、値が予測値と異なる field インスタンスの数。
- Not Detected — 検出されなかった field インスタンスの数。
- Frequency in Documents — 指定した field を含むdocumentsの割合。
これらの統計を本番環境の品質評価に適切に反映させるには、テストセットのdocuments分布を本番環境の分布に合わせる必要があります。たとえば、本番環境の請求書の 30% が特定のベンダーからのものである場合、テストセットでも約 30% をそのベンダーの請求書にする必要があります。さらに、blind set (学習や過去のテストに使用していないdocuments) を使用すると、結果をより確実に検証できます。
エラー付きで抽出されたfieldのレビュー
Order Date fieldのRecognition Issue列の値をクリックすると、Order Dateに認識上の問題があったdocumentsのみを表示するタブが開きます。
抽出モードの表示
- Reference — Skill の設定時 (学習前) に作成された参照ラベル付けと、それを使用して抽出された field の値を表示します。このモードでは、field の値と領域を編集できます。
- Predicted — documents の処理時に取得された field の値と領域を表示します。編集はできません。
- Difference — 参照ラベル付けと予測ラベル付けの差異を表示します。同じ値と領域は緑色で表示され、異なるものは赤色で表示されます。編集はできません。

参照ラベル付けの修正

fieldを追加する
Editor タブで field を指定し、型ごとに field のプロパティを設定します。
ルールの検証
Document skill で抽出された field 値の検証、変更、計算にルールを使用します。
文書のラベル付け
学習時に構造化文書と半構造化文書をラベル付けするためのガイドライン。
Document skill の学習とテスト
Document skill の学習、テスト、品質測定に関する Advanced Designer ガイド。
