メインコンテンツへスキップ
ABBYY Vantage は、さまざまな種類のドキュメント(構造化、半構造化、非構造化)から構造化データを抽出できるインテリジェントドキュメントプロセッシング(IDP)プラットフォームです。その中核コンポーネントの 1 つが Skill Designer であり、ユーザーはこれを使って、ABBYY が Skills と呼ぶ、ドキュメントの分類、データ抽出、ビジネス/プロセスワークフローへの統合を行うためのモデル/ルールを作成・トレーニング・デプロイできます。 簡単に言うと、Skill Designer を使用すると、「Document skill」(ドキュメントタイプ定義および抽出ルール)、「Classification skill」(どの種類のドキュメントであるかを検出する Skill)、「Process skill」(分類、Document skill、ビジネスルールを組み合わせた複数ステップのロジックを構成する Skill)を構築できます。

Skill Designer における Skill の種類

Skill Designer では、次の Skill を扱うことができます:
  • 分類スキル
  • Document skill
  • Optical Character Recognition (OCR) Skill
  • Process skill

仕組み

以下は、Skill Designer を使用する際のハイレベルなフローです。
  1. サンプルセットの定義/文書化。処理したい種類(構造化/半構造化/非構造化)のサンプルドキュメントを収集します。
  2. 分類(必要に応じて)。複数のドキュメントタイプがある場合、documents を適切に自動ルーティングするための 分類スキル を構築します。
  3. field のラベル付け/アノテーション。抽出したいデータ要素を定義します。これにはサンプルドキュメント上で field をマーキングする作業が含まれます。
  4. Document skill の学習。ABBYY のモデル/トレーニングパイプライン(複雑さに応じて fast learning または deep learning)を使用して抽出モデルを学習させます。
  5. レビューと検証。人によるレビュー/検証で誤抽出や信頼度の問題を検出します。精度向上のために、ラベリングやビジネスルールなどを調整します。
  6. 公開/デプロイ。性能に満足したら、その Skill を公開し、業務ワークフローで使用できるようにします。Skill は検索可能になり、API 経由で呼び出せます。
  7. 監視と継続的な改善。パフォーマンス指標を追跡します。時間の経過とともに新しいサンプルを取り込み、再学習や Skill の調整を行って、より多様なドキュメントに対応させます。