メインコンテンツへスキップ
学習が完了すると、分類結果に基づいて統計レポートが作成されます。
  • ページに割り当てられたクラスが参照クラスと一致する場合、True Positive (TP) として分類されます。
  • 参照クラスのないページにクラスが割り当てられなかった場合、True Negative (TN) として分類されます。
  • ページに割り当てられたクラスが参照クラスと一致しない場合、False Positive (FP) として分類されます。
  • 参照クラスがあるページにクラスが割り当てられなかった場合、False Negative (FN) として分類されます。
このようにして、各クラスについて以下の回数が集計されます。
  • 正しく割り当てられた回数 (TP)
  • 正しく割り当てられなかった回数 (TN)
  • 誤って割り当てられた回数 (FP)
  • 誤って割り当てられなかった回数 (FN)
統計を表示するには、Classifier > Show statistics を選択します。 Precision、Recall、F-measure の値が高いほど、分類結果は良好です。 (F-measure の計算方法の詳細については、Glossaryを参照してください。) F-measure は Precision と Recall の両方をバランスよく反映する指標であり、これらのパラメーターに基づいて分類品質を総合的に評価できます。F-measure を向上させる方法の詳細については、分類品質を向上させるためのヒントセクションを参照してください。 品質評価のため、次のタブではさらに詳しい統計も確認できます。
  • Confusion Matrix。混同行列は、分類器がどの文書をどの文書と混同しやすいかを視覚的に示したものです。行列の対角線上のセルは、文書のうち正しく分類された件数を示します。右端の列と最下行には、どのクラスにも割り当てられなかった文書に関する情報が含まれます。それ以外のセルには、誤って分類された文書が表示されます。
  • 混同しやすいクラス。このタブには、分類器が取り違えたクラスの一覧が表示されます。この統計により、どのクラス同士が最も頻繁に混同されているかを把握できます。
  • Statistics by Class。各クラスの詳細な統計を表示し、分類器が最も多く誤る原因となっているクラスを特定できます。