- Activities タブに移動します。
-
まず、ドキュメントのクラスを判定します。そのために分類アクティビティを使用します。Activities ペインで
Classify By Text and Imageアクティビティをクリックします。これがワークフローに追加されます。このアクティビティを追加すると、Skill の構造内に新しい field が作成されます。この field は分類結果の記録に使用され、Skill の field 構造に表示されますが、非表示の field としてマークされ、編集はできません。この field の名前は Activities タブの Activity Properties ペインで変更できます。field の名前を “Layout” に変更します。 -
分類結果に応じて、ドキュメントは処理フロー内の異なるアクティビティにルーティングされます。ワークフローを分岐するには、
IFアクティビティを挿入します。 a. ワークフロー内のClassify By Text and Imageアクティビティをクリックします。 b. ポップアップウィンドウで、IF項目を選択します。これはClassify By Text and Imageアクティビティの後にワークフローへ追加されます。
IF アクティビティの代わりに、2つの Extraction Rules アクティビティを含むワークフロー項目を作成し、ソース field として “Layout” field を選択して、その値を各ドキュメントに適用するアクティビティを選択する条件として使用することもできます。このオプションの詳細については、単一アクティビティ内の複数の Extraction Rules セットを参照してください。
-
ここで、異なるクラスのドキュメントからデータを抽出するためのアクティビティを追加します。
a. 次の項目として
Extraction Rulesアクティビティを選択します。これを “Sick Note DE” にリネームします。このアクティビティはドイツのドキュメントからデータを抽出します。 b. 次に、ベルギーおよびオランダのドキュメントからデータを抽出するアクティビティが必要です。このクラスのドキュメントにはバリエーションがありますが、単一のExtraction Rulesアクティビティで対処できます。IFアクティビティをクリックし、別のExtraction Rulesアクティビティをワークフローに追加します。アクティビティの名前を “Sick Note BE-NL” に変更します。これでIFアクティビティは両方のExtraction Rulesアクティビティおよび Finish に接続されているはずです。 -
Vantage が処理済みドキュメントを使って Skill をさらに学習できるようにするため、ワークフローの最後に
Fast Learningアクティビティを追加します。Skill を構成する際にこのアクティビティも学習させますが、主な狙いは本番環境で Skill の Online Learning を有効にすることです。 a. 処理フローで “Sick Note BE-NL” をクリックします。 b. ポップアップウィンドウで、Fast Learningアクティビティを選択します。これは “Sick Note BE-NL” アクティビティの後に追加されますが、“Sick Note DE” アクティビティは引き続き Finish に接続されたままです。 c. “Sick Note DE” アクティビティと Finish を接続している矢印にマウスカーソルを重ねます。矢印がオレンジ色に変わります。 d. この矢印をFast Learningアクティビティ上にドラッグ&ドロップします。 e.IFアクティビティと Finish を接続している矢印にマウスカーソルを重ねます。この矢印もFast Learningアクティビティ上にドラッグ&ドロップします。これで、すべてのドキュメントがFast Learningアクティビティへ転送されます。

