メインコンテンツへスキップドキュメントを処理する際、抽出したデータをデータ カタログに保存されているレコードと照合して検証する必要がある場合があります。Data Catalog Lookup ルールを使用すると、この作業を自動化できます。これらのルールを使用すると、次のことが可能になります。
- 請求書や注文書をベンダーや荷受人(受取人)のデータベースと照合する
- 次のようなカタログ レコードとの照合に基づき、ドキュメントで欠落している field を自動的に補完する:
- 注文番号と合計金額
- 会社情報
- 商品およびサービスの名称と説明
Document skill で使用するデータ カタログについて詳しくは、Using data catalogs を参照してください。
データ カタログ参照ルールを作成するには、次の手順に従います。
-
field のプロパティで New Rule をクリックします。
-
開いたダイアログで、ルール タイプとして Data Catalog Lookup を選択し、Next をクリックします。
-
Data Catalog for Lookup ドロップダウン リストから、ドキュメントの field 値を検証するために使用するデータ カタログを選択します。
Note: 複数のデータ カタログに対して値を比較する必要がある場合は、それぞれに対して個別のルールを作成してください。
-
データ カタログを選択すると、次のテーブルが表示されます。
Catalog Column には、選択したカタログの列が一覧表示されます。
-
Skill Field 列で、各カタログ列を、ドロップダウン リストを使用して対応する抽出済みドキュメント field にマッピングします。
検索する必要がない、またはドキュメント内に存在しない field は空白のままにしておきます。
Note: 1 つのルールで参照できるのは、1 つの繰り返しグループ内の field のみです。複数の繰り返しグループから値を検索するには、各グループごとに個別のルールを作成してください。
-
Action 列では、各 field ペアをどのように処理するかを定義します:
- Exact Comparison. 税務識別番号や商品識別子など、一意の値を照合する場合に使用します。
- Fuzzy Comparison. 通りの名前や組織の住所など、多少異なる可能性のある値に使用します。ファジー比較のしきい値は 30% で、値の 70% が一致している必要があります。大文字と小文字は区別されません。
- Get Value from Data Catalog. カタログの値を対応するドキュメント field にコピーします。このオプションは、そのルール内の少なくとも 1 つの field ペアで Exact Comparison または Fuzzy Comparison が使用されている場合にのみ利用できます。
-
(任意)Rule Name を編集し、Save をクリックします。
- Data Catalogs セクションのカタログの下に、その Skill へのリンクが表示されます。
- ルールは、セットアップ時にマッピングされたすべてのドキュメントの field に対して自動的に実行されます。
- 既存のルックアップ ルールは、field の抽出時にのみ実行されます。ユーザーが field の値を手動で編集しても、新しい値に対して自動ルックアップ処理は再実行されません。
- ルールを再度実行させるには、新しいファイルを Skill のドキュメント セットにアップロードするか、そのドキュメントを手動確認に送信します。
データ カタログの検索ルールは、比較(完全一致またはあいまい一致)の結果として、一致するレコードが 1 件を超えない場合にのみ期待どおりに動作します。そうでない場合、次のいずれかのエラーが発生する可能性があります。
- No records found. 指定された比較条件に一致するカタログ レコードが見つかりませんでした。
- Too many records found. 1 件を超えるカタログ レコードが一致しました。
このようなエラーを避けるには、マッピングされた field のうち少なくとも 1 つが、一意の値であるか、複数のカタログ レコードと一致し得ない値を使用していることを確認してください。
データ カタログで field 値を手動で検索する
データ カタログで field 値を検索するには、次の手順に従います。
- ルールが設定されている field 値ボックスの右側にある Search ボタンをクリックします。
- 表示された検索バーに、検索したい値を入力します(完全一致または部分一致、最低 3 文字)。あいまい検索のしきい値は 30% で、70% が一致している必要があります。大文字と小文字は区別されません。システムは、選択したデータ カタログ内のすべての field を対象に検索を行います。
- 検索結果から、左クリックして 正しい値を選択します。選択したカタログ値は、ルール設定時にそのカタログ列にリンクされたすべての文書内の field にコピーされます。
カタログ レコードを使用して文書の field が入力されると、手動編集は無効になります。値が正しくない場合は、再度検索を実行して別のレコードを選択します。文書の field は新しく選択したカタログ値に合わせて更新され、ルールが再実行されます。
必要な値がデータ カタログ内に見つからない場合は、Clear Document Fields をクリックするか Ctrl+Del を押します。これにより、データ カタログの値を適用せず、文書から抽出された値を使用して、ルール設定時に指定された field が復元されます。