Deep Learning アクティビティを設定する

Deep Learning アクティビティの学習には、別の文書セットを使用できます。これを行うには、Skill 名の横にあるドロップダウンリストから Deep Learning アクティビティを選択します。次に、Upload ボタンの左側にあるドロップダウンリストで必要な文書セットを選択するか、Create Set… をクリックして新しい文書セットを作成します。このタブでは、Documents で説明されているように、文書のアップロード、削除、回転を行えます。

アクティビティを追加する

Activities タブで、半構造化文書用の Deep Learning アクティビティをドキュメント処理フローに追加します。

field を選択する

Activity Properties ペインで、このアクティビティで学習させる field を選択します。次のいずれかを選択できます。

ネストレベルに関係なく、型が Text の field を最大 50 個
最大 32 列のテーブルを 1 つ

さらに多くの field を学習させる必要がある場合は、Deep Learning アクティビティを追加して追加の field を選択できます。たとえば、複数のテキストの field と 1 つのテーブルを学習させる必要がある場合は、Deep Learning アクティビティを 2 つ作成します。次の field は学習できません。

Text 以外の型の field
複数アイテムを含む Group、テーブル、または複数アイテムを含む Group にネストされた複数アイテムを持つテキストの field
32 列を超えるテーブル

このような field の抽出は、たとえば Extraction Rules activity などの別のアクティビティを使用して設定する必要があります。

文書にラベル付けする

Activity Editor をクリックし、Fields タブに移動して文書にラベル付けします。Activity Editor でのラベル付けプロセスは、通常の文書のラベル付けプロセスと同じです。文書セットのサイズを判断する際は、次のガイドラインを使用してください。

トレーニングセットに最小数である 10 件の文書しか含まれていない場合でも deep learning の学習を開始できますが、より高い精度を得るために追加の文書をアップロードすることを推奨します。
トレーニングセットに 10 件の文書しか含まれていない場合でも、モデルの学習を開始できます。ただし、Advanced Designer には、最適な学習結果を得るために 500 件を超えるラベル付け済み文書を追加することを推奨する warning が表示されます。
トレーニングセットに 500 件から 10,000 件の文書が含まれている場合は、すぐにアクティビティの学習を開始できます。これは、トレーニングセットに含める文書数として推奨される範囲です。
トレーニングセットに 10,000 件を超える文書が含まれている場合、Advanced Designer には Skill が不安定になる可能性があることを示す warning が表示されます。

アクティビティを学習する

文書をアップロードしてラベル付けしたら、Train Activity をクリックします。

学習の進行状況を監視する

Results タブに移動して、学習の進行状況を評価します。必要に応じて、学習時間を調整するか、学習を停止します。詳細については、アクティビティの学習の監視と調整を参照してください。

学習後の手順

アクティビティの学習が完了すると、アクティビティのテストが自動的に開始されます。学習を停止した場合は、アクティビティのテストを手動で開始するよう求められます。テストが完了したら、Results タブの Activity Test Results セクションで field の抽出結果を確認します。このアクティビティの統計は、Results タブに表示される Skill の一般統計と同じです。field 抽出の品質に満足できない場合は、次の方法があります。

トレーニングセットに文書を追加し、学習プロセスを再開します。これまでの学習結果は保持され、更新した文書セットを使用してニューラルネットワークが追加学習されます。
ラベル付けを調整して、学習をやり直します。これまでの学習結果は破棄され、ニューラルネットワークは最初から学習されます。
Extraction Rules activity を含む Hypothesis Filtering container を作成します。これにより、Deep Learning アクティビティの出力に対する条件を設定できます。

アクティビティの学習とテストに使用できるのは、確認済みのラベル付けがある文書だけです。参照ラベル付けが予測ラベル付けに基づいて自動生成された文書は、文書のコンテキストメニューで対応するオプションを使って予測ラベル付けを参照ラベル付けにコピーしない限り、未確認のラベル付けとなります。各文書のラベル付けステータスは Documents タブで確認できます。文書のラベル付けを確認するには、Fields タブでその内容を見直す必要があります。

Advanced Designer v. 2.3.1 以降、Deep Learning アクティビティの field 制限が変更されました。Skill で 50 個を超える field を抽出する学習済みの Deep Learning アクティビティを使用している場合でも、その Skill で文書処理を続行できます。ただし、そのような Skill を編集のために開くと、既存の Deep Learning アクティビティは複数の Deep Learning アクティビティに分割され、再学習が必要になる場合があります。また、文書処理 workflow 内でそれらの activities をルーティングする必要もあります。

​学習後の手順

学習後の手順