メインコンテンツへスキップ
注意: Deep Learning アクティビティの学習には、別のドキュメントセットを使用できます。そのためには、Skill 名の右側にあるドロップダウンリストから Deep Learning アクティビティを選択します。次に、Upload ボタンの左側にあるドロップダウンリストで必要なドキュメントセットを選択するか、Create Set… をクリックして新しいセットを作成します。このタブでは、Documents セクションで説明されているとおりに、ドキュメントのアップロード、削除、回転を行うことができます。

セットアップ手順

Deep Learning アクティビティをセットアップするには、次の手順を実行します。

ステップ 1. アクティビティを追加する

Activities タブで、半構造化ドキュメント用の Deep Learning アクティビティをドキュメント処理フローに追加します。

ステップ 2. フィールドを選択する

Activity Properties ペインで、このアクティビティを使用して学習させるフィールドを選択します。 次のいずれかを選択できます。
  • ネスト レベルに関係なく、最大 50 個の Text 型フィールド
  • 最大 32 列のテーブル 1 つ
さらに多くのフィールドを学習させる必要がある場合は、Deep Learning アクティビティを追加し、それらで追加のフィールドを選択します。たとえば、複数のテキスト フィールドと 1 つのテーブルを学習させる必要がある場合は、2 つの Deep Learning アクティビティを作成します。
注記: 次のフィールドは学習させることができません:
  • Text 以外の型のフィールド
  • 複数項目を持つグループ、テーブル、または複数項目のテキスト フィールドで、複数項目のグループ内にネストされているもの
  • 32 列を超えるテーブル
このようなフィールドの抽出は、Extraction Rules アクティビティなど、他のアクティビティを使用して設定する必要があります。

ステップ 3. 文書にラベルを付ける

Activity Editor をクリックし、Fields タブに移動して文書にラベルを付けます。Activity Editor でのラベル付けプロセスは、通常の文書ラベル付けプロセスと同じです。 次のガイドラインに従って、文書セットのサイズを決定してください。
  • トレーニングセットに含まれる文書が最小数の 10 件のみの場合でも、ディープラーニングのトレーニングを開始できますが、より高い精度を得るために、追加の文書をアップロードすることを推奨します。
  • トレーニングセットに 10 件の文書しか含まれていない場合でも、モデルのトレーニングを開始できます。ただし、Advanced Designer は、最適なトレーニング結果を得るために 500 件を超えるラベル付き文書を追加するよう推奨する警告を表示します。
  • トレーニングセットに含まれる文書が 500~10,000 件の場合、すぐにアクティビティのトレーニングを開始できます。この範囲が、トレーニングセットとして推奨される文書数です。
  • トレーニングセットに含まれる文書が 10,000 件を超える場合、Advanced Designer は Skill が不安定になる可能性があるという警告を表示します。

ステップ 4: アクティビティをトレーニングする

Document のアップロードとラベル付けが完了したら、Train Activity をクリックします。

ステップ 5. トレーニングの進捗を監視する

Results タブを開き、トレーニングの進捗を確認します。必要に応じて、トレーニング時間を調整するか、トレーニングを停止します。 詳細については、アクティビティ トレーニングの監視と調整を参照してください。

トレーニング後の手順

アクティビティのトレーニングが完了すると、アクティビティのテストが自動的に開始されます。トレーニングを停止した場合は、アクティビティのテストを手動で開始するよう求められます。 テストが完了したら、Results タブの Activity Test Results セクションで field 抽出結果を分析します。このアクティビティの統計情報は、Results タブに表示される Skill 全体の統計情報と同一です。field 抽出の品質に満足できない場合は、次のような対応が可能です。
  • トレーニングセットにさらにドキュメントを追加し、トレーニングプロセスを再開します。これまでに得られたトレーニング結果は保持され、更新されたドキュメント セットを使用してニューラル ネットワークが追加トレーニングされます。
  • ラベリングを調整して、トレーニングを再実行します。これまでに得られたトレーニング結果は破棄され、ニューラル ネットワークは最初から再トレーニングされます。
  • Extraction Rules アクティビティを含む Hypothesis Filtering コンテナーを作成します。これにより、Deep Learning アクティビティの出力に条件を設定できるようになります。
このアクティビティは、ラベリングが確定しているドキュメントのみを使用してトレーニングおよびテストできます。reference ラベリングが predicted ラベリングに基づいて自動生成されている場合、ドキュメント コンテキストメニューの対応するオプションを使用して predicted ラベリングを reference にコピーしない限り、そのドキュメントのラベリングは未確定のままです。各ドキュメントのラベリングステータスは、Documents タブで確認できます。ドキュメントのラベリングを確定するには、Fields タブでその内容を確認する必要があります。
Note: Advanced Designer v. 2.3.1 以降、Deep Learning アクティビティに対する field の制限が変更されています。Skill が 50 を超える fields を抽出するトレーニング済み Deep Learning アクティビティを使用している場合でも、その Skill を使用してドキュメントを処理し続けることはできます。ただし、そのような Skill を編集のために開くと、既存の Deep Learning アクティビティは複数の Deep Learning アクティビティに分割され、再トレーニングが必要になる場合があります。また、ドキュメント処理ワークフロー内でアクティビティをルーティングし直す必要もあります。