メインコンテンツへスキップ
会社の分類に向けて、データ カタログ、正規表現、field マッピングを構成します。

ステップ 1. アクティビティを追加する

Activities タブで、Document 処理フローに「Classify By Company」アクティビティを追加します。

ステップ 2: データ カタログを選択する

Activity Properties ペインに移動し、Issuer Company のドロップダウン リストから利用可能なデータ カタログを選択します。関連する企業のペアを検索する場合は、Receiver Company (optional) のドロップダウン リストからもデータ カタログを選択します。 次のいずれかを実行できます:
  • データ カタログを名前で選択します。選択したデータ カタログ名に基づくデータ カタログの Parameter が自動的に作成されます。これらの Parameter は、Skill の設定にある Parameters タブで確認できます。
  • Skill 内に既存のデータ カタログの Parameter を選択します。参照先のデータ カタログの種類が Classify By Company アクティビティでサポートされている場合にのみ、その Parameter が一覧に表示されます。Parameter が参照するデータ カタログ名は括弧内に表示されます。
  • Manage Skill Parameters… を選択して Skill の設定を開き、新しいデータ カタログの Parameter を作成します。詳細については、Using parameters を参照してください。
注: 追加のデータ カタログは ABBYY Vantage で作成できます。詳細は Skill Designer Guide の「Creating data catalogs」を参照してください。

ステップ 3. データ カタログを更新する(任意)

必要に応じて、CSV ファイルを使用して選択したデータ カタログを更新します。データ カタログ一覧の横にある「その他のオプション」ボタンをクリックし、Update from CSV をクリックして、表示されるダイアログ ボックスで CSV ファイルを選択します。Vantage API と共有フォルダーを使用してデータ カタログを更新することもできます。詳細は、Skill Designer ガイドの「データ カタログの使用」を参照してください。

手順 4: 正規表現とキーワードを設定する

企業データの検索精度を高めるには、ドキュメントに含まれる可能性のある企業識別子(税務識別番号、国税識別番号、IBAN(国際銀行口座番号)など)に対して、正規表現とキーワードを指定できます。正規表現は特定の検索アルゴリズムを定義し、キーワードはドキュメント上の検索範囲を絞り込みます。ドキュメント処理を高速化するため、正規表現とキーワードの併用を推奨します。キーワードが見つかった検索範囲内の語に対してのみ正規表現が適用されるためです。 正規表現とキーワードを指定するには、Activity Settings をクリックします。開いたダイアログで、対象の列について次の操作を行います。
  1. フィールドに正規表現を直接入力するか、編集アイコンをクリックして Regular Expression Editor で正規表現を入力します。正規表現を Skill の Parameter の値として設定し、ドロップダウンリストからその Parameter を選択することもできます。
  2. フィールドにキーワードを直接入力します。キーワードを Skill の Parameter の値として設定し、ドロップダウンリストからその Parameter を選択することもできます。
  3. Next をクリックします。

ステップ 5: データ カタログの列をマッピングする

データ カタログの列を Skill 内の適切な field にマッピングします。データ抽出で必須となるのは会社識別子の field のみで、その他の field は任意です。適切な field のマッピングが完了したら、Save をクリックします。 Classify By Company アクティビティは、各タイプにつき 1 つのデータ カタログにのみ接続できます。複数のカタログでデータを参照する必要がある場合は、複数の Classify By Company アクティビティをドキュメント処理フローに追加し、それぞれを異なるデータ カタログに接続してください。

分類結果の活用

Classify By Company アクティビティを設定したら、Document 上の会社データを活用します。データを抽出して次の処理ステップに進むだけでも問題ありません。発行元の会社によって処理フローが大きく異なる場合は、Extraction Rules アクティビティまたは IF アクティビティを使用して、会社データに基づきフローを分岐させることもできます。