Skill Designer における Skill の種類
- 分類スキル
- Document skill
- Optical Character Recognition (OCR) Skill
- Process skill
仕組み
- サンプルセットの定義/文書化。処理したい種類(構造化/半構造化/非構造化)のサンプルドキュメントを収集します。
- 分類(必要に応じて)。複数のドキュメントタイプがある場合、documents を適切に自動ルーティングするための 分類スキル を構築します。
- field のラベル付け/アノテーション。抽出したいデータ要素を定義します。これにはサンプルドキュメント上で field をマーキングする作業が含まれます。
- Document skill の学習。ABBYY のモデル/トレーニングパイプライン(複雑さに応じて fast learning または deep learning)を使用して抽出モデルを学習させます。
- レビューと検証。人によるレビュー/検証で誤抽出や信頼度の問題を検出します。精度向上のために、ラベリングやビジネスルールなどを調整します。
- 公開/デプロイ。性能に満足したら、その Skill を公開し、業務ワークフローで使用できるようにします。Skill は検索可能になり、API 経由で呼び出せます。
- 監視と継続的な改善。パフォーマンス指標を追跡します。時間の経過とともに新しいサンプルを取り込み、再学習や Skill の調整を行って、より多様なドキュメントに対応させます。
