メインコンテンツへスキップ
これから処理するドキュメントは、レイアウトに基づいて2つのクラスに分けられます。各クラスごとに個別の抽出ルールセットを作成します。また、Skill を標準の Vantage テクノロジーで学習可能にしたいと考えています。これらの要件に従って、Skill のドキュメント処理フローを構成しましょう。
  1. Activities タブに移動します。
  2. まず、ドキュメントのクラスを判定します。そのために分類アクティビティを使用します。Activities ペインで Classify By Text and Image アクティビティをクリックします。これがワークフローに追加されます。このアクティビティを追加すると、Skill の構造内に新しい field が作成されます。この field は分類結果の記録に使用され、Skill の field 構造に表示されますが、非表示の field としてマークされ、編集はできません。この field の名前は Activities タブの Activity Properties ペインで変更できます。field の名前を “Layout” に変更します。
  3. 分類結果に応じて、ドキュメントは処理フロー内の異なるアクティビティにルーティングされます。ワークフローを分岐するには、IF アクティビティを挿入します。 a. ワークフロー内の Classify By Text and Image アクティビティをクリックします。 b. ポップアップウィンドウで、IF 項目を選択します。これは Classify By Text and Image アクティビティの後にワークフローへ追加されます。
注: IF アクティビティの代わりに、2つの Extraction Rules アクティビティを含むワークフロー項目を作成し、ソース field として “Layout” field を選択して、その値を各ドキュメントに適用するアクティビティを選択する条件として使用することもできます。このオプションの詳細については、単一アクティビティ内の複数の Extraction Rules セットを参照してください。
  1. ここで、異なるクラスのドキュメントからデータを抽出するためのアクティビティを追加します。 a. 次の項目として Extraction Rules アクティビティを選択します。これを “Sick Note DE” にリネームします。このアクティビティはドイツのドキュメントからデータを抽出します。 b. 次に、ベルギーおよびオランダのドキュメントからデータを抽出するアクティビティが必要です。このクラスのドキュメントにはバリエーションがありますが、単一の Extraction Rules アクティビティで対処できます。IF アクティビティをクリックし、別の Extraction Rules アクティビティをワークフローに追加します。アクティビティの名前を “Sick Note BE-NL” に変更します。これで IF アクティビティは両方の Extraction Rules アクティビティおよび Finish に接続されているはずです。
  2. Vantage が処理済みドキュメントを使って Skill をさらに学習できるようにするため、ワークフローの最後に Fast Learning アクティビティを追加します。Skill を構成する際にこのアクティビティも学習させますが、主な狙いは本番環境で Skill の Online Learning を有効にすることです。 a. 処理フローで “Sick Note BE-NL” をクリックします。 b. ポップアップウィンドウで、Fast Learning アクティビティを選択します。これは “Sick Note BE-NL” アクティビティの後に追加されますが、“Sick Note DE” アクティビティは引き続き Finish に接続されたままです。 c. “Sick Note DE” アクティビティと Finish を接続している矢印にマウスカーソルを重ねます。矢印がオレンジ色に変わります。 d. この矢印を Fast Learning アクティビティ上にドラッグ&ドロップします。 e. IF アクティビティと Finish を接続している矢印にマウスカーソルを重ねます。この矢印も Fast Learning アクティビティ上にドラッグ&ドロップします。これで、すべてのドキュメントが Fast Learning アクティビティへ転送されます。
最終的なセットアップは次のようになります。 処理パイプラインを示すワークフローダイアグラム 感嘆符は、アクティビティがまだ構成されていないことを示しています。次の手順で構成します。