メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

分類スキルは、入力された文書のタイプを判定します。文書タイプによって、文書の処理方法、抽出されるfields、適用されるルールが決まります。また、たとえば文書を適切な部門に振り分けるなど、初期段階での手動仕分けにも役立ちます。
分類スキルは、1 つのトランザクションにつき 1 つのファイルを処理します。異なるタイプの文書を含む複数のファイルを分類するには、Classify Activity Process skill を使用します。

仕組み

分類スキルをトレーニングするには、必要なクラスを指定し、各クラスに対していくつかのサンプル文書を用意します。Vantage は、印影や署名を含む各文書のテキスト要素と視覚要素を分析するため、分類器は低品質な画像にも対応でき、類似した文書タイプも区別できます。

分類スキルを使用する場合

分類スキルは、Process skill の一部として実行することも、単独で実行することもできます。
  • Process skill の一部として。 分類器が受信した各文書をタイプ別に仕分けし、Process skill が後続のパイプラインへ自動的に振り分けます。
  • 単独で。 Vantage API を通じて文書を直接分類することも、それを基盤として構築されたフロントエンド (Try Any Skill portal など) を通じて分類することもできます。

一般的なユースケース

  • メールルームで受け取った書類を請求書、契約書、一般文書に仕分けする
  • 抽出前にアーカイブ文書をトリアージする
  • 受信した依頼を適切な部門に振り分ける

他のスキルとの関係

分類スキルはドキュメントパイプラインの最初に配置され、各ファイルの type を判定します。その後の処理は、他の Vantage スキルが担います。
  • Document skill — ドキュメントの種類が判明した後、そのドキュメントから field データを抽出します。
  • OCRスキル — 画像または PDF から検索可能なテキストを生成します。
  • Process skill — 複数のスキル (分類、抽出、検証) を 1 つのワークフローにまとめます。

よくある誤解

分類スキルは、文書を種類ごとに分類します。field値の抽出、バリデーションルールの実行、検索可能なテキストの生成は行いません。fieldを抽出するには、Document skill と組み合わせて使用します。テキスト認識のみを行う場合は、OCRスキルを使用します。

次のステップ

分類スキルを設定する

新しい分類スキルの言語、オンラインラーニング、公開設定を行います。

分類器を学習する

トレーニングセットを作成し、ドキュメントをクラスに割り当てて、分類器を学習させます。

分類結果を分析する

Resultタブでクラスごとの精度を確認し、トレーニングセットによくあるエラーを修正します。