Note: このアクティビティでサポートされるのは、型が Text の field のみです。
トレーニング要件
- ばらつきの大きいドキュメントの場合は、少なくとも 150 件のサンプルドキュメント(バリアントごとに 2~3 件のサンプルドキュメント)が必要です。
- ばらつきの小さいドキュメントの場合は、サンプルドキュメント 1 件からトレーニングを開始できますが、バリアントごとに少なくとも 2~3 件のサンプルドキュメントが必要です。
別の文書セットの使用
サポートされている言語
Deep Learning アクティビティの設定
- Activities タブで、Deep Learning アクティビティをドキュメント処理フローに追加します。Deep Learning アクティビティは、その Deep Learning アクティビティでソースとして使用する field を抽出するアクティビティの後に配置する必要があります。
- Activity Properties ペインの Field ドロップダウンリストを使用して、fields を抽出すべき非構造化テキスト断片に対応するソース field を選択します。
- ソース field から抽出すべき fields を選択します。ソース field と同じネストレベル、またはその 1 つ下のレベルにある fields を選択できます。
- Activity Editor をクリックし、Fields タブに移動して、ソース field から抽出すべき fields の領域を指定してドキュメントにラベル付けします。Activity Editor でのラベル付け手順は、1 つの例外を除き、通常のドキュメントのラベル付けプロセスと同じです。例外とは、Deep Learning アクティビティによって抽出される fields は、ソース field の領域内に存在している必要があるという点です。
- NLP 用の Deep Learning アクティビティはサンプル ドキュメント 1 件から開始できますが、バリアントごとに少なくとも 2~3 件のサンプル ドキュメントが必要です。
- トレーニング セットに 1~150 件のドキュメントが含まれている場合は、アクティビティのトレーニングを開始できますが、Advanced Designer には「少なくとも 150 件のドキュメントを追加することを推奨します」という警告が表示されます。
- トレーニング セットに 150~10,000 件のドキュメントが含まれている場合は、すぐにアクティビティのトレーニングを開始できます。これは、トレーニング セットに含めるドキュメント数として推奨される範囲です。
- トレーニング セットに 10,000 件を超えるドキュメントが含まれている場合は、Advanced Designer に、Skill が不安定になる可能性があるという警告が表示されます。
- Train Activity をクリックしてアクティビティをトレーニングします。
- アクティビティのトレーニングが完了すると、アクティビティのテストが自動的に開始されます。テスト完了後、Results タブに移動し、アクティビティの field 抽出結果を分析します。Results タブに表示される統計情報は、Results タブに表示される Skill 全体の一般的な統計情報と同じです。必要に応じて、ラベル付けを修正し、アクティビティを再トレーニングしてください。
