ドキュメントセットには、異なるレイアウトのドキュメントバリアント(例:銀行ごとに異なる明細書や、会社ごとに異なる請求書)が含まれる場合があります。
Advanced Designerでは、複数の独立したExtraction Rulesアクティビティとアクティビティ選択条件を含む単一の処理フロー項目を作成できます。アクティビティの選択は、ドキュメントのバリアントを識別するために用いられるデータを格納するfieldの値によって決まります。これは通常、分類結果を含むfieldですが、原則として直前までのいずれかのアクティビティで入力された任意のfieldを使用できます。セット内の各アクティビティに対する分岐条件は、fieldの値をアクティビティにマッピングすることで設定します。さらに、マッピング表で指定されていないすべてのfield値に対する処理も選択できます。セット内のいずれかのExtraction Rulesアクティビティを割り当てるか、この処理ステップをスキップするかを選べます。
この方法は、次のケースで役立ちます。
| ケース | ドキュメントのバリアントの判別方法 | サンプルのマッピング |
|---|
| ドキュメントをレイアウトまたは特定のパラメーター(例:ドキュメントの発行年度)で分類している。ドキュメントクラスの一部に対して個別の抽出ルールを設定する必要がある。 | テキストと画像による分類結果、または field に抽出されたドキュメントのパラメーターに基づく | Field value = A : Extraction Rules A / Field value = B : Extraction Rules B / All other field values : Skip this step |
| 会社別にドキュメントを分類しており、カタログ内の各社のドキュメントに対して個別の抽出ルールを設定する必要がある。カタログに記載されていないすべての会社には共通の Extraction Rules アクティビティを使用したい。 | 会社別の分類結果に基づく | CompanyID = 1 : Extraction Rules 1 / CompanyID = 2 : Extraction Rules 2 / … / Other company IDs : General Extraction Rules |
1 つの処理フロー項目に統合されたアクティビティは、同一の出力 Field セットを持ちます。あるアクティビティの field の状態を変更すると、セット内の他のすべてのアクティビティにも一貫して反映されます。
ドキュメント処理フローからその項目を削除すると、その中のすべてのアクティビティも削除され、元に戻すことはできません。
- Document 処理フローに通常の Extraction Rules アクティビティを追加します。
- Activity Properties ペインで Add activity and set condition for its use をクリックします。
- 新しいアクティビティ名を指定し、Add をクリックします。
- Activity Properties ペインの Activities タブに移動し、Add をクリックして必要な数だけアクティビティを追加します。
Add Extraction Rules Activity ダイアログで各アクティビティの分岐条件を設定するか、後でまとめて設定できます。
処理フロー内のアクティビティを選択し、Activity Properties ペインの Activities タブを開きます。アイテムに追加されたアクティビティの一覧が表示されます。エラーアイコンは、アクティビティにエラーがある、または未設定であることを示します。アラートアイコンは、そのアクティビティの分岐条件が未設定であることを示します。
分岐条件を設定するには、次の手順を実行します。
- Activity Properties ペイン下部の Conditions をクリックします。
- 開いたダイアログで、値に基づいて Extraction Rules アクティビティの選択を決定する field を指定します。
値の取得元となる field を変更すると、マッピングはリセットされます。
- 利用可能なすべての Extraction Rules アクティビティがマッピングテーブルに一覧表示されます。field の値をアクティビティにマップします。
- マッピングテーブルに記載されていない値に対するアクションを選択します。セットに追加済みのアクティビティのいずれかを使用するか、この処理ステップをスキップするかを選択できます。
- Save をクリックします。
各アクティビティは、通常の Extraction Rules アクティビティと同様に Activity Editor で設定します。詳細は、Extraction Rules activity description を参照してください。特定のアクティビティの Activity Editor を開くには、アクティビティ一覧でそのアクティビティ名をクリックします。アクティビティが一覧で選択されている場合は、Activity Editor ボタンを Activity Properties ペインの下部でクリックしてエディターを開くこともできます。
アクティビティ名の右側にある more アイコンをクリックして開くメニューから、アクティビティの名前変更や削除を実行できます。このメニューで Use as Separate Activity オプションを選択すると、アクティビティをセットから切り離せます。ドキュメント処理フローの個別のアイテムとして再作成され、設定済みの抽出ルールはすべて保持されます。
通常の Extraction Rules アクティビティを、別の同種のアクティビティやアクティビティのセットにドラッグ&ドロップすることで、既存のアクティビティをマージできます。ドロップ後は、新しく追加されたアクティビティの分岐条件を設定するために Conditions ダイアログを開く必要があります。
ドロップしたアクティビティで有効になっている field の一覧は、マージ先のアイテムで有効になっている field の一覧と整合されます。アクティビティで設定されたすべての抽出ルールは保持されます。
Extraction Rules アクティビティのセットを作成した後、ドキュメント処理フローの各分岐に他のアクティビティを追加したくなる場合があります。たとえば、Extraction Rules アクティビティの一つを Fast Learning アクティビティに置き換えたり、ワークフローの特定の分岐に Script アクティビティを追加したりできます。この場合、アクティビティのセットを、IF アクティビティの後に続く通常の Extraction Rules アクティビティのまとまりに分割できます。実行するには、ワークフロー内のアクティビティを選択し、ポップアップウィンドウで split アイコンをクリックします。
設定済みの抽出ルールはすべて保持されます。各アクティビティのケース条件は手動で設定する必要があります。