メインコンテンツへスキップ
分類器を学習させるには、基準となるクラスがすでに付与された文書を含む学習用データセットが必要です。

トレーニングセットの作成

  1. Classification Skill Designer で、Documents タブを開きます。
  2. 画面左側のクラス一覧の上にある Create class をクリックするか、Actions ペインの Create Class コマンドを使用して、適切なクラスを作成します。
    Tip: 既存のクラス名を変更するには、クラス名の横にあるアイコンをクリックし、Rename class を選択します。
  3. 画面左側のクラス一覧からクラスを選択し、Classification Skill 画面中央の Upload documents、ツールバーの Upload ボタン、または Actions ペインの Upload Documents のいずれかをクリックして、そのクラスにドキュメントをアップロードします。 ドキュメントのアップロード中は、Skill Designer の上部、ブックマークの右側に進行状況インジケーターが表示されます。インジケーターのツールチップには、アップロードおよび処理がまだ必要なドキュメント数が表示されます。
    Note: No class グループにアップロードされたドキュメントは、分類器の学習およびテストには使用されません。
各クラスについて、そのクラスのドキュメント数が表示されます。ドキュメントセットにクラスが非常に少ない場合や、クラス同士の差異が大きい場合は、各クラスのドキュメント数は少なくても問題ありません。逆に、クラスが多すぎる場合や、クラス間の差異が十分でない場合は、各クラスにつき 10~100 件のドキュメントをアップロードすることを推奨します。この場合、少なすぎると分類エラーが発生する可能性があります。いずれの場合も、1 クラスあたり 1,000 件を超えるドキュメントのアップロードは推奨しません。分類精度を最大化するため、各クラスで最も一般的なドキュメントのバリアントごとにサンプルドキュメントを含めてください(バリアントあたり概ね 1 件)。 既定では、アップロードされたドキュメントはすべてリスト表示されます。ファイル名がわかりやすい場合は、これにより目的のファイルを見つけやすくなります。見た目が大きく異なるドキュメントがある場合は、サムネイル表示に切り替えることもできます。これら 2 つの表示モードを切り替えるには、次のツールバーボタンを使用します。
  • リスト表示
  • サムネイル表示
50 件を超えるドキュメントがアップロードされた場合、複数のページに分割して表示されます。 どちらの表示でも、ドキュメント名の左にあるボタンをクリックすると、ドキュメントのプレビューウィンドウを開けます。 このウィンドウの既定の幅は、ブラウザーウィンドウ幅の 35% です。必要に応じて、プレビューウィンドウの左端をドラッグすると、ブラウザーウィンドウ幅の最大 80% まで広げられます。ユーザーが指定した幅は、ブラウザーのキャッシュをクリアするまで保持されます。 必要に応じて、ツールバーの Rotate をクリックしてドキュメントのページの向きを反時計回りに 90° 回転させることで、各クラス内のページの向きを手動で変更できます。あるいは、ドロップダウンリストから次のいずれかのオプションを選択できます: Rotate LeftRotate Right、または Rotate 180°。また、ドキュメントプレビューウィンドウでボタンをクリックし、適切な回転オプションを選択して、特定のドキュメントのページの向きを変更することもできます。 何らかの理由でファイルがアップロードされなかった場合(例: 非対応形式のファイル)、ファイル名は赤色で表示されます。

ドキュメントに割り当てられたクラスの変更

アップロード済みドキュメントに割り当てられている参照クラスは、次の手順で変更できます。
  1. 名前の左にあるチェックボックスをオンにして、新しいクラスを割り当てたいドキュメントを1つまたは複数選択します。
  2. Actions ペインに表示されるリストから該当するクラスを選択し、Assign ボタンをクリックします。リストに目的のクラスがない場合は、Actions ペインの Search for class フィールドに新しいクラス名を入力し、Create をクリックします。

セットからドキュメントを削除する

次のいずれかの方法で、セットからドキュメントを削除できます。
  • 名前の左にあるチェックボックスを選択して、削除するドキュメントを1つまたは複数選択します。ドキュメント一覧上部のクラス名の左にあるチェックボックスを選択すると、そのクラスのすべてのドキュメントを選択できます(クラスのドキュメントが複数のページにわたって表示されている場合は、現在のページに表示されているドキュメントのみが選択されます)。選択したドキュメントのいずれかの横にあるiconをクリックし、Delete をクリックします。表示されるダイアログボックスで操作を確認します。これで、選択したドキュメントが削除されます。
    Tip: ドキュメントを事前に選択していなくても、名前の横にあるiconをクリックして削除できます。
  • クラス一覧でクラス名の横にあるiconをクリックし、Delete All Documents をクリックします。表示されるダイアログボックスで操作を確認します。これで、選択したクラスのすべてのドキュメントが削除されます。代わりに Delete Class with All Documents をクリックすると、クラス本体とその中のすべてのドキュメントが削除されます。

分類器のトレーニング

特別に用意した学習用データセットで分類器をトレーニングするには、Actions ペインで Train ボタンをクリックします。Train ボタンは、学習用データセットに空ではない異なるクラスが少なくとも2つある場合にのみ有効になります。 トレーニングが完了すると、Train ボタンの横に Completed アイコンが表示されます。さらに、Documents タブでのクラス一覧の表示も変わります。各クラスにアップロードされたドキュメント数に加え、参照クラスと異なる予測クラスが割り当てられたドキュメント数も表示されます。 Classification Skill Training Documents Amount Actions ペインの Train ボタンの下にある Cancel をクリックすると、分類器のトレーニングを停止できます。

参考

分類結果の分析