- 適合率と再現率のスライダーが正しく調整されていることを確認します。
- ドキュメント数を増やします。ドキュメントの数が多いほど、同じクラス内のさまざまなドキュメントを分類器が認識できるようになります。
- クラスをより適切に区別できるよう、追加のルールを作成します。
- 目的の適合率と再現率の値が正しく設定されていることを確認します。
- トレーニングセットに、より適切なドキュメントを追加します。これにより、クラス属性をより正確に設定でき、分類アルゴリズムも最適化されるため、結果として学習済み分類器の品質が向上します。
- 混同行列タブのテーブル内にある黄色のセルで、誤分類されたドキュメントを確認します (右クリックして表示できます) 。 テキストの内容と選択した属性から、参照クラスが誤って割り当てられていることが明らかな場合は、正しいクラスを割り当てます。ドキュメントの参照クラスを正確に特定できない場合は、そのドキュメントをトレーニングバッチから削除します。
- トレーニングバッチに、テーマが似ていて、人間の専門家でも区別が難しいクラスが含まれている可能性があります。類似したクラスは1つにまとめます。
- クラス間の区別を容易にするために、追加のルールを作成します。
