メインコンテンツへスキップ
ABBYY FlexiCapture 12 には、FlexiLayout Studio で FlexiLayout を作成しなくても、文書を分類し、その文書タイプやバリエーションを検出できる技術が搭載されています。分類は、文書の仕分け、すべての入力文書の中から特定の文書を検出すること、入力ページを文書単位にまとめることに使用できます。 分類のシナリオ 分類器を使って文書を分類するには、事前に学習させる必要があります。分類器を学習させるには、サンプル文書をロードし、それらの文書に適切なクラスを手動で割り当てる必要があります。学習が完了すると、分類器は新しい文書を自動的に分類できるようになります。 分類器の設定 ABBYY FlexiCapture 12 には、文書画像に基づいて文書を分類する技術 (見た目で区別できる文書向け) と、テキストに基づいて分類する技術が含まれています。これらの技術は自動的に組み合わせることもでき、その場合は解析対象の文書の性質に応じて、プログラムが最適な技術を選択します。 分類プロファイル 分類シナリオによっては、再現率よりも適合率が重視される場合があり、逆に適合率よりも再現率の方が重要な場合もあります。プログラムでは、再現率よりも適合率を優先することも、適合率よりも再現率を優先することも、両者のバランスを取ることもできます。 分類エラーの種類と適合率および再現率のバランス 分類を補助する手段として、開発者は ABBYY FlexiLayout Studio を使用できます。これにより、数千点の画像を扱えるほか、分類結果を詳細に解析し、ページ上のテキストオブジェクトや視覚オブジェクトの処理ルールを含めて分類器を微調整するためのツールを利用できます。 ABBYY FlexiLayout Studio からの分類器のインポート 分類とは、文書画像またはテキスト文書を、あらかじめ定義されたカテゴリに振り分ける処理です。 文書は手動でも自動でも分類できます。 大量の文書を手動で分類することには、次のような問題があります。
  • 手間がかかる
  • コストが高い
  • 時間がかかる
  • 厳しい納期の下ではミスが発生しやすい
ABBYY FlexiCapture 12 には、ABBYY FlexiLayout Studio で複雑なルールや FlexiLayout を作成しなくても、文書を分類できるよう簡単に学習させられる分類技術が含まれています。 ABBYY FlexiCapture の分類技術は非常に柔軟性が高く、次のものを区別するために使用できます。
  • 文書タイプ (例: パスポートと請求書を分けることができます)
  • 文書のバリエーション (例: 異なるベンダーから受け取った請求書や、異なる州で発行された運転免許証を検出できます)
  • 文書の境界 (例: 各タイプの文書について、先頭ページとそれに続くページを検出できます) 。

関連項目:

分類器でサポートされる言語