跳转到主要内容
命名实体 (NER) 活动旨在使用自然语言处理 (NLP) 从非结构化文档(例如合同、信件、订单、新闻稿以及其他无法通过规则描述其结构的文档)中提取命名实体。要使用命名实体 (NER) 活动处理这些文档,您需要将命名实体映射到技能中的字段,这些字段将用于存放提取出来的实体值。随后,该活动会分析文档并将命名实体提取到相应的字段中。 您还可以为由其他活动提取的字段配置命名实体提取。假设您知道需要提取的组织名称和地址位于每份合同的第一段中。您可以先使用 Segmentation 活动提取第一段,然后再使用命名实体 (NER) 活动从该段中提取公司名称和地址。与从整个文档中提取命名实体相比,这种方法更加可靠,因为您可以精确控制实体被提取的具体范围。
注意: 该活动仅支持类型为 Text 且数据类型设置为 Text、Date 或 Money 的字段。

设置命名实体(NER)活动

要设置命名实体(NER)活动:
  1. Activities 选项卡上,将命名实体(NER)活动添加到文档处理流程中。
  2. Activity Properties 窗格中,使用 Source 下拉列表选择活动用于提取命名实体的源,可以是整个文档,也可以是由其他活动提取的单个字段。
  3. Output field 中,选择要将命名实体写入的字段。
注意: 输出字段必须与源字段处于相同的嵌套级别,或比源字段低一级。
  1. 单击 Create Mapping。在打开的对话框中,在 Entity to extract 列表中选择要为每个字段提取的命名实体。单击 Save。您可以随时单击 Edit Mapping 编辑映射。
  2. 单击 Test Skill 测试该技能,并在 Results 选项卡上分析命名实体提取结果。

支持的命名实体

实体名称描述示例支持的数据类型支持的语言
Person人名John Doe, Jane SmithText英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语
Location地点名称Anytown, Corporate PlaceText英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语
Organization机构名称ABBYY, Acme Corp.Text英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语
Address地址123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USAText英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语
Money金额$2670.00, 199 dollars 99 centsText, Amount of money英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语
Date日期November 14, 2009, 11/14/2009Text, Date英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语
Duration持续时间Twelve (12) months, 4 daysText英语、俄语、德语、法语、西班牙语、日语、意大利语、葡萄牙语(标准)、荷兰语