分類スキル - ABBYY Documentation

分類スキルは、入力された文書のタイプを判定します。文書タイプによって、文書の処理方法、抽出されるfields、適用されるルールが決まります。また、たとえば文書を適切な部門に振り分けるなど、初期段階での手動仕分けにも役立ちます。

分類スキルは、1 つのトランザクションにつき 1 つのファイルを処理します。異なるタイプの文書を含む複数のファイルを分類するには、Classify Activity Process skill を使用します。

仕組み

分類スキルをトレーニングするには、必要なクラスを指定し、各クラスに対していくつかのサンプル文書を用意します。Vantage は、印影や署名を含む各文書のテキスト要素と視覚要素を分析するため、分類器は低品質な画像にも対応でき、類似した文書タイプも区別できます。

分類スキルは、Process skill の一部として実行することも、単独で実行することもできます。

Process skill の一部として。 分類器が受信した各文書をタイプ別に仕分けし、Process skill が後続のパイプラインへ自動的に振り分けます。
単独で。 Vantage API を通じて文書を直接分類することも、それを基盤として構築されたフロントエンド (Try Any Skill portal など) を通じて分類することもできます。

分類スキルはドキュメントパイプラインの最初に配置され、各ファイルの type を判定します。その後の処理は、他の Vantage スキルが担います。

分類スキルは、文書を種類ごとに分類します。field値の抽出、バリデーションルールの実行、検索可能なテキストの生成は行いません。fieldを抽出するには、Document skill と組み合わせて使用します。テキスト認識のみを行う場合は、OCRスキルを使用します。

新しい分類スキルの言語、オンラインラーニング、公開設定を行います。

トレーニングセットを作成し、ドキュメントをクラスに割り当てて、分類器を学習させます。

Resultタブでクラスごとの精度を確認し、トレーニングセットによくあるエラーを修正します。

⌘I