メインコンテンツへスキップ
学習が完了すると、分類統計が表示されます。これらの統計を利用して、分類器の精度向上に役立てることができます。 分類統計ウィンドウを開くには、次のいずれかの操作を行います。
  • メインメニューで Classification Training → [View Statistics] を選択する、または
  • ツールバーの Statistics ボタンをクリックします。
次の情報を確認できます。
  • F-measureRecallおよびPrecision – これらの値が高いほど、分類結果の精度が高いことを示します。 (F-measure の計算方法の詳細については、Glossary, Classifier F-measureを参照してください。)
    • 参照クラスが設定されているページ数
    • ページの分類結果:
      • True Positive – 参照クラスが割り当てられたページ数。
      • False Positive – 参照クラス以外のクラスが割り当てられたページ数。
      • False Negative – 参照クラスがあるにもかかわらず、クラスが割り当てられなかったページ数。
      • True Negative – 参照クラスがなく、クラスも割り当てられなかったページ数。
分類統計ウィンドウの左上にあるドロップダウンリストを使用して、For Testing ページの統計、For Training ページの統計、またはその両方を表示するかどうかを選択します。 参照クラスと結果クラスの比率に関する詳細情報と、分類器の学習結果に関する情報は、3 つの異なる方法で表示されます。
  1. Confusion Matrix。混同行列は、分類器がどのドキュメントを最も頻繁に取り違えているかを視覚的に示したものです。行列のセル内の値は、参照クラスと結果クラスの比率を表します。緑色のセルは、クラスが正しく割り当てられたページ数を示します。赤色のセルは、クラスが混同されたページ数、つまり分類器によって参照クラスのあるページに誤って割り当てられたクラスを示します。
  • [Confused only] オプションを使用すると、すべてのページで結果クラスが参照クラスと一致していたクラスを非表示にできます。
  • [Pages] ボタンと [Percent] ボタンを使用すると、正しく識別されたクラスと混同されたクラスを持つページ数について、件数表示と割合表示を切り替えることができます (割合は、同じ参照クラスを持つ全ページに対する、正しくクラスが割り当てられたページの比率として計算されます) 。
  • 行列のスケールは次のように操作できます。
    • - 固定スケールで行列を表示します。
    • - 行列全体を表示します。
    • - 拡大します。
    • - 縮小します。
  1. Statistics by Class。結果クラスが参照クラスと一致しなかったページの統計を含むテーブルです。これにより、特定の分類器で最も多くのエラーの原因となっているクラスを特定できます。混同されたページ数や、この参照クラスの全ページ数に対する混同ページの比率で並べ替えることができます。
  2. 混同しやすいクラス。このタブには、分類器によって誤って割り当てられたすべてのクラスの一覧が表示されます。このデータを使用すると、どのクラス同士が最も頻繁に混同されるかを把握できます。
行列のセルまたはデータテーブルの行をダブルクリックすると、選択したクラスのページが開きます。参照クラスと結果クラスの検索行は、すべてのタブで使用できます。また、任意のデータテーブルを並べ替えて、どのクラスが最も問題になっているかを確認することもできます。 便宜上、分類統計ダイアログで Export Statistics… をクリックすると、統計をテキストファイルにエクスポートできます。表示されたダイアログで、エクスポートするファイルの名前と保存場所を指定し、CSV ファイルと TXT ファイルのどちらで保存するかを選択します。エクスポートする統計の種類を選択することもできます (1 つ以上のオプションを選択) :
  • 主な分類パラメーターの要約統計: F-measureRecallPrecision、およびページ別の分類結果。
  • クラス別の主な分類パラメーター。
  • 混同しやすいクラス – 各混同クラスのページ数と割合。
  • すべてのクラス – 各クラスのページ数と割合。
統計は、分類統計ダイアログで選択したドキュメント状態のページについてのみエクスポートされます。
次のいずれかの操作を行った場合は、分類器の学習を再度初期化する必要があります。
  • For Training が割り当てられたドキュメントを追加または削除した;
  • ドキュメントに For Training 状態を割り当てた、またはドキュメントから削除した;
  • クラスを追加、削除、または結合した;
  • ドキュメントに別の参照クラスを割り当てた;
  • 分類プロファイルおよび/または適合率と再現率の優先度を変更した。