メインコンテンツへスキップ
分類器が文書を正しく分類できないケースは、次の 2 つに分けられます。
  1. 分類器が文書に誤ったクラスを割り当てる場合。たとえば、タイプ A のページがタイプ B として分類されるケースです。
  2. 分類器が文書にどのクラスも割り当てられない場合。
これら 2 つのケースに基づく 2 つの指標を使って、分類品質を表すことができます。
  • 適合率 は、ある特定のクラスに割り当てられたすべての文書のうち、そのクラスに正しく割り当てられた文書の割合です (つまり、そのクラスに正しく割り当てられた文書数を、そのクラスに正しく割り当てられた文書数と誤って割り当てられた文書数の合計で割った値です) 。
  • 再現率 は、あるクラスに属するすべての文書のうち、そのクラスに正しく割り当てられた文書の割合です。

分類設定を調整し、再現率または適合率を優先できます。

適合率を優先する

まったくクラスが割り当てられないドキュメントが一部生じることと引き換えに、誤ったクラスが割り当てられるドキュメントの数をできるだけ少なくしたい場合は、高適合率設定を使用します。 ある会社では、請求書と契約書を分類し、それぞれの文書タイプの処理を担当する部門に送る必要があります。 FlexiCaptureが請求書を誤って分類すると、その請求書は適切な部門に送られず、支払いも行われません。FlexiCaptureが請求書をまったく分類しない場合は、その請求書を手動で分類して適切な部門に送ることができます。 この場合、できるだけ多くのドキュメントを分類することよりも、誤分類を避けることのほうが重要です。

再現率を優先する

一部の文書に誤ったクラスが割り当てられる可能性があっても、どのクラスにも割り当てられない文書の数をできるだけ少なくしたい場合は、高再現率 設定を使用します。 ある企業では、処理が必要な関連ローン文書を、さまざまなローン文書の中から特定する必要があります。 FlexiCapture が関連文書にクラスを割り当てなかった場合、その文書は処理されません。 誤ったクラスが割り当てられた文書の処理は、たとえば FlexiLayout の適用、バリデーションルールの使用、手動処理の実施などの追加処理によって回避できます。 この場合、正しいクラスをできるだけ高い頻度で割り当てることよりも、できるだけ多くの関連文書にクラスを割り当てることのほうが重要です。 既定では、Classification priorityバランス重視 に設定されています。