Deep Learning for NLP アクティビティは、自然言語処理 (NLP) 技術を使用して、非構造化文書から field を抽出できるよう Skill を学習させるためのアクティビティです。 Deep Learning アクティビティは、別のアクティビティで事前に抽出された field に対してのみ設定できます。たとえば、Segmentation アクティビティを使用してテキストの段落を抽出し、その後、その段落から field を抽出するように Deep Learning アクティビティを設定できます。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
学習要件
- ばらつきの大きい文書では、少なくとも 150 件のサンプル文書 (候補ごとに 2~3 件のサンプル文書) が必要です。
- ばらつきの小さい文書では、1 件のサンプル文書から学習を開始できますが、候補ごとに少なくとも 2~3 件のサンプル文書が必要です。
別のドキュメントセットを使用する
サポートされている言語
Deep Learning アクティビティ の設定
アクティビティを追加
Activities タブで、ドキュメント処理フローに Deep Learning アクティビティ を追加します。Deep Learning アクティビティ は、その source として使用する field を抽出するアクティビティの後に配置する必要があることに注意してください。
ソース field を選択
Activity Properties ペインの Field ドロップダウンリストを使用して、fields の抽出元となる非構造化テキストフラグメントに対応する ソース field を選択します。
出力 field を選択
ソース field から抽出する fields を選択します。ソース field と同じネストレベルの fields、または 1 つ下のレベルの fields を選択できます。
documents にラベル付け
Activity Editor をクリックし、Fields タブに移動して、ソース field から抽出する fields の Region を指定しながら documents にラベル付けします。Activity Editor でのラベル付けプロセスは、通常の文書のラベル付けプロセスと同じですが、例外が 1 つあります。Deep Learning アクティビティ で抽出する fields は、ソース field の Region 内に配置されている必要があります。ドキュメントセットのサイズを決める際は、次のガイドラインを使用してください。
- NLP 用の Deep Learning アクティビティ は sample document が 1 件あれば開始できますが、候補ごとに少なくとも 2~3 件の sample document が必要です。
- トレーニングセットに 1~150 件の documents が含まれている場合は、アクティビティの学習を開始できますが、Advanced Designer に「We recommend adding at least 150 documents」という warning が表示されます。
- トレーニングセットに 150~10,000 件の documents が含まれている場合は、すぐにアクティビティの学習を開始できます。これは、トレーニングセットに含める documents 数として推奨される範囲です。
- トレーニングセットに 10,000 件を超える documents が含まれている場合は、Skill が不安定になる可能性があることを示す warning が Advanced Designer に表示されます。
結果を確認
アクティビティの学習が完了すると、アクティビティのテストが自動的に開始されます。テストの完了後、Results タブに移動して、アクティビティの field 抽出結果を確認します。Results タブに表示される統計は、Results タブに表示される Skill の一般的な統計と同じです。必要に応じてラベル付けを修正し、アクティビティを再度学習します。
