Skill の構成要素
- Classify(分類)アクティビティ。2つのクラスを含みます: 購買注文書 と no Purchase Order(no Purchase Order クラスは、付録、メールおよびFAXのヘッダー、請求書、その他同一ファイル内のドキュメントを含みます)
- 最初のページの信頼できる指標(例: “Page 1 of 10”)に基づいて文書を分割するための Extraction Rules(抽出ルール)アクティビティ
- 購買注文書番号を抽出するための Extraction Rules(抽出ルール)アクティビティ
ドキュメント分割ロジック
- 新しいファイルの開始が検出された場合
- 直前に検出されたものとは異なるドキュメントクラスが識別された場合
- 先頭ページを示す信頼性の高いマーカーが抽出された場合
- 新しい購買注文書番号が抽出された場合
実装ガイド
セットアップ手順
- 新しい Process skill を作成します。
- Input アクティビティを追加して設定します。
- Assemble アクティビティを追加します。このアクティビティでは、Actions ペインで By Document Splitter Skill オプションを選択し、一覧から Purchase Order Splitter Skill を選択します。
- Extract アクティビティを追加します。このアクティビティでは、Actions ペインで Add Skill ボタンをクリックし、一覧から目的の Document skill を選択します。
- 引き続き Actions ペインで、Extract アクティビティに指定した Document skill 名の横にある設定アイコンをクリックします。表示されるダイアログボックスで、Class field で Purchase Order を選択します。
- 必要に応じて、抽出データを検証し、組み立てたドキュメントに必要な調整を行うために Manual Review アクティビティを追加して設定します(たとえば、ページを並べ替えることができます)。
- Output アクティビティを追加して設定します。
- Publish Skill ボタンをクリックします。
