跳转到主要内容
命名实体(NER)活动旨在使用自然语言处理(NLP)从非结构化文档中提取命名实体,例如合同、信函、订单、新闻稿,以及其他无法用规则描述其特定结构的文档。要使用命名实体(NER)活动处理这些文档,您需要将命名实体映射到用于承载实体值的 Skill 字段。随后,该活动会分析文档,并将命名实体提取到相应字段中。 您还可以为由其他活动提取的字段设置命名实体抽取。假设您知道需要提取的组织名称和地址位于每份合同的第一段。您可以使用 Segmentation 活动提取第一段,然后使用命名实体(NER)活动从该段中提取公司名称和地址。与从整份文档中提取命名实体相比,这种方法更可靠,因为您可以限定实体的具体提取区域。
注意: 该活动仅支持类型为 Text 且数据类型设置为 Text、Date 或 Money 的字段。

设置命名实体(NER)活动

要设置命名实体(NER)活动:
  1. Activities选项卡上,将命名实体(NER)活动添加到文档处理流程中。
  2. Activity Properties窗格中,使用Source下拉列表选择该活动用于提取命名实体的来源——可以是整个文档,或由其他活动提取的单个field。
  3. Output field中,选择要将命名实体写入的字段。
注意: 输出字段必须与源field处于相同的嵌套级别,或位于其下一层级。
  1. 单击Create Mapping。在打开的对话框中,在Entity to extract列表中选择将哪些命名实体提取到各个字段。单击Save。您可随时单击Edit Mapping编辑映射。
  2. 单击Test Skill以测试您的Skill,并在Results选项卡上分析命名实体提取结果。

支持的命名实体

实体名称描述示例支持的数据类型支持语言
Person人名John Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Location地点名称Anytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Organization组织名称ABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Address地址123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Money货币金额$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Date日期November 14, 2009, 11/14/2009Text, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Duration时长Twelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch