固有表現 (NER) アクティビティは、自然言語処理 (NLP) を使用して、契約書、書簡、注文書、プレスリリースなど、ルールで定義できる明確な構造を持たない非構造化ドキュメントから固有表現を抽出するよう設計されています。固有表現 (NER) アクティビティでこれらのドキュメントを処理するには、エンティティの値を抽出する先となる Skill の field に固有表現をマッピングする必要があります。このアクティビティはドキュメントを解析し、固有表現を対応する field に抽出します。 他のアクティビティで抽出された field に対しても、固有表現の抽出を設定できます。たとえば、抽出対象の組織名と住所が各契約書の最初の段落にあることがわかっている場合、Segmentation アクティビティで最初の段落を抽出し、その段落から固有表現 (NER) アクティビティで会社名と住所を抽出できます。この方法は、抽出対象の領域を限定して制御できるため、ドキュメント全体から固有表現を抽出するよりも信頼性が高くなります。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
このアクティビティがサポートするのは、データ型が Text、Date、または Money に設定された Text タイプの field のみです。
固有表現 (NER) アクティビティを設定する
ソースを選択する
アクティビティ プロパティ ペインで、Source ドロップダウンリストを使用して、アクティビティが固有表現の抽出元として使用するソースを選択します。ドキュメント全体、または別のアクティビティによって抽出された単一の field を指定できます。
出力 field を選択する
Output field で、固有表現の抽出先となる field を選択します。出力 field は、ソース field と同じネストレベルにあるか、その 1 つ下のレベルになければなりません。
マッピングを作成する
Create Mapping をクリックします。表示されたダイアログで、Entity to extract リストの各 field に抽出する固有表現を選択します。Save をクリックします。Edit Mapping をクリックすると、マッピングはいつでも編集できます。
サポートされている固有表現
| エンティティ名 | 説明 | 例 | サポート対象のデータ型 | サポートされている言語 |
|---|---|---|---|---|
| 人 | 人名 | John Doe, Jane Smith | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Location | 地名 | Anytown, Corporate Place | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Organization | 組織名 | ABBYY, Acme Corp. | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| 住所 | 住所 | 123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USA | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Money | 金額 | $2670.00, 199 dollars 99 cents | Text, Amount of money | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Date | 日付 | November 14, 2009, 11/14/2009 | Text, Date | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| 期間 | 期間 | Twelve (12) months, 4 days | Text | English, Russian, German, French, Spanish, Italian, Portuguese (Standard), Dutch |
