- Activities タブに移動します。
-
まず、ドキュメントのクラスを判定します。そのために分類アクティビティを使用します。Activities ペインで
Classify By Text and Imageアクティビティをクリックします。ワークフローに追加されます。このアクティビティを追加すると、Skill の構造内に新しい field が作成されます。この field は分類結果の記録に使用され、Skill の field 構造に表示されますが、非表示の field としてマークされ、編集はできません。この field の名前は Activities タブの Activity Properties ペインで変更できます。field の名前を “Layout” に変更します。 -
分類結果に応じて、ドキュメントは処理フロー内の異なるアクティビティへルーティングされる必要があります。ワークフローを分岐させるには、
IFアクティビティを挿入します。 a. ワークフロー内のClassify By Text and Imageアクティビティをクリックします。 b. ポップアップウィンドウでIFアイテムを選択します。Classify By Text and Imageアクティビティの後にワークフローへ追加されます。
IF アクティビティの代わりに、2つの Extraction Rules アクティビティを含むワークフローアイテムを作成し、ソース field として “Layout” field を選択して、その値を各ドキュメントに適用するアクティビティを選択する条件として使用することもできます。このオプションの詳細は、単一アクティビティ内での複数の Extraction Rules セットを参照してください。
-
次に、異なるクラスのドキュメントからデータを抽出するアクティビティを追加します。
a. 次のアイテムとして
Extraction Rulesアクティビティを選択します。“Sick Note DE” に名前を変更します。このアクティビティはドイツのドキュメントからデータを抽出します。 b. 次に、ベルギーおよびオランダのドキュメントからデータを抽出するアクティビティが必要です。このクラスのドキュメントにはバリエーションがありますが、1つの Extraction Rules アクティビティで対応できます。IFアクティビティをクリックし、別のExtraction Rulesアクティビティをワークフローに追加します。アクティビティの名前を “Sick Note BE-NL” に変更します。これでIFアクティビティは両方のExtraction Rulesアクティビティと Finish に接続されているはずです。 -
処理済みのドキュメントを使用して Skill をさらに学習させたいと考えています。そのため、ワークフローの最後に
Fast Learningアクティビティを追加する必要があります。Skill の構成時にもこのアクティビティを学習させますが、主な目的は本番運用中に Skill の Online Learning を有効化することです。 a. 処理フローで “Sick Note BE-NL” をクリックします。 b. ポップアップウィンドウでFast Learningアクティビティを選択します。“Sick Note BE-NL” アクティビティの後に追加されますが、“Sick Note DE” アクティビティは引き続き Finish に接続されています。 c. “Sick Note DE” アクティビティと Finish を結ぶ矢印にマウスカーソルを重ねます。矢印がオレンジ色に変わります。 d. この矢印をFast Learningアクティビティ上にドラッグ&ドロップします。 e.IFアクティビティと Finish を結ぶ矢印にマウスカーソルを重ねます。この矢印もFast Learningアクティビティ上にドラッグ&ドロップします。これで、すべてのドキュメントがFast Learningアクティビティに転送されます。

