跳轉到主要內容
命名實體 (NER) 活動旨在使用自然語言處理 (NLP) 從非結構化文件中擷取命名實體,例如合約、信函、訂單、新聞稿,以及其他無法以規則描述其結構的文件。若要使用命名實體 (NER) 活動來處理這些文件,您需要將命名實體對應到技能欄位,實體值將會被擷取到這些欄位中。此活動接著會分析文件,並將命名實體擷取到其對應的欄位。 您也可以為由其他活動所擷取的欄位設定命名實體擷取。假設您知道需要擷取的組織名稱和地址位於每份合約的第一個段落中。您可以先使用 Segmentation 活動擷取第一個段落,然後再使用命名實體 (NER) 活動,從此段落中擷取公司名稱和地址。此方法比從整份文件中擷取命名實體更可靠,因為您可以控制實體被擷取的特定區域。
注意: 此活動僅支援型別為 Text,且資料類型設定為 Text、Date 或 Money 的欄位。

設定命名實體(NER)活動

若要設定命名實體(NER)活動:
  1. Activities 分頁中,將命名實體(NER)活動新增到文件處理流程。
  2. Activity Properties 窗格中,使用 Source 下拉清單選擇此活動要用來擷取命名實體的來源,可以是整份文件,或是由其他活動擷取出的單一欄位。
  3. Output field 中,選擇要將命名實體擷取至其中的欄位。
注意: 輸出欄位必須與來源欄位位於相同的巢狀層級,或在其下一層。
  1. 按一下 Create Mapping。在隨即開啟的對話方塊中,於 Entity to extract 清單中選取要擷取到各欄位的命名實體。按一下 Save。您可以隨時按一下 Edit Mapping 來編輯對應。
  2. 按一下 Test Skill 以測試您的技能,並在 Results 分頁中分析命名實體擷取結果。

支援的具名實體

Entity nameDescriptionExampleSupported data typesSupported languages
Person人名John Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Location地點名稱Anytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Organization組織名稱ABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Address地址123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Money金額數值$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Date日期November 14, 2009, 11/14/2009Text, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Duration期間Twelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch