非構造化文書を処理する Skill は、Advanced Designer でのみ作成できます。クラウドベースの Skill Designer では、これらのシナリオはサポートされていません。これらの Skill では、4 つの主要な NLP アクティビティを使用して、エンティティの識別、テキストの分割、契約書、レター、メールなどの自由形式コンテンツからの field 抽出を行います。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Segmentation activity
- Deep Learning for NLP activity
- Named Entities (NER) activity
- Address Parsing activity
これらの各アクティビティがサポートする言語は限られています。対応言語の一覧については、各アクティビティのリファレンスページを参照してください。
シナリオを選択する
| シナリオ | 使用する場合 | 主なアクティビティ |
|---|---|---|
| 事前学習済みの固有表現 (文書全体) | 固有表現は文書内のどこにでも現れる可能性があり、必要な設定は最小限です | NER (+ Address Parsing) |
| 事前学習済みの固有表現 (特定の段落) | 固有表現が現れる段落があらかじめ決まっています | Segmentation + NER (または Address Parsing) |
| カスタム固有表現 (Deep Learning for NLP) | 事前学習済みモデルでは判別できない場合や、必要な固有表現の型がサポートされていない場合 | Segmentation + Deep Learning for NLP |
一般的なワークフロー
NLP アクティビティの追加と設定
Activities タブで、シナリオに必要なアクティビティ (以下で説明) を追加します。各アクティビティを Activity Editor で開き、設定して学習させます。
事前学習済みの固有表現 (文書全体)

事前学習済みの固有表現 (特定の段落)

カスタム固有表現 (Deep Learning for NLP)
Deep Learning for NLP アクティビティのトレーニングには、少なくとも 50 件の文書 (推奨 150 件) が必要です。最適な結果を得るには、事前学習済みの 固有表現 (NER) アクティビティも試し、お使いの文書に対してより高い精度で抽出できる方を選んでください。

固有表現(NER)アクティビティ
名前、組織、日付などの事前学習済みの固有表現を、フリーフォームテキストから抽出します。
Address Parsing アクティビティ
住所を、住所、市区町村、州、国、郵便番号に分割します。
Segmentation アクティビティ
抽出したいデータを含む段落を切り出します。
Deep Learning for NLP アクティビティ
カスタムの固有表現や判別が難しい固有表現を抽出できるよう、ニューラルネットワークを学習させます。
