メインコンテンツへスキップデータ カタログには、ドキュメント認識を支援する情報が含まれます。これには、顧客の ERP システムからのデータ(例:ベンダー情報や購買注文書データ)や、使用通貨に関する情報、特定の国の空港リスト、組織の休日リストなどの関連データが含まれる場合があります。Document skill でデータ カタログを次の目的で使用できます:
- データ抽出の精度向上
- 抽出データの検証
- 手動確認時にユーザーがドロップダウン リストからレコードを選択し、選択したレコードのデータで他の field を自動入力できるようにする
データ カタログは本質的にデータを格納したテーブルです。使用する前にデータでカタログを準備しておく必要があります。Vantage が抽出データをデータ カタログのレコードと照合できるようにするには、適切なルールを設定します。これにより、ドキュメント処理時に ABBYY Vantage は、ドキュメント上の値と最も多くの field 値が一致するレコードをデータ カタログ内から検索します。そのようなレコードが見つかった場合、一致したドキュメントの field はそのレコードのデータで自動入力されます。データ カタログで適切なレコードが見つからない場合、または該当レコードが複数見つかった場合は、ルールがエラーを出し、手動確認でオペレーターがデータ カタログから適切なレコードを手動選択できます。
注意: カタログ レコードの最大数は 500,000 件です。カタログ内の field の値は最大 256 文字までです。
ABBYY Vantage では、組み込みの Document skill 用にデータ カタログが作成されます。たとえば:
- Invoice の Skill には、Vendors、BusinessUnits、PurchaseOrders、PurchaseOrderItems というデータ カタログが作成されます。
- 購買注文書の Skill には、Buyers および Suppliers というデータ カタログが作成されます。
各あらかじめ定義されたデータ カタログには、変更不可の事前定義の構造と正規化タイプがあります。
データ カタログの一覧を開くには、左側のメニューで Data Catalogs をクリックします。
注意: データ カタログの作成および更新の可否は、ユーザーのロールに依存します。ロールの詳細は、ロールベースアクセス制御を参照してください。
ABBYY Vantage では、Skill の編集またはインポート時に、組み込みの Document skill 用のデータ カタログを作成できます。組み込みの Skill は直接編集できないため、まず複製する必要があり、複製時にデータ カタログが自動的に作成されます。
データ カタログは次の 2 つの方法のいずれかで作成できます。
- CSV ファイルを使用する
- データ列を手動で入力する
詳細は、データ カタログの作成を参照してください。
データ カタログにデータを追加する方法は次のとおりです。
- UI から CSV ファイルをアップロードします。
- 共有フォルダー経由で CSV ファイルをアップロードします。
- JSON 形式のデータには Vantage API を使用します。
Tip: 更新済みのデータ カタログ(レコードの追加や削除を含む)は、テナント内のすべての Skill で利用できます。ただし、適用されるのはデータ カタログの更新後にアップロードされたドキュメントのみです。以前にアップロードされたドキュメントでは、更新前のデータが使用されます。