典型段落示例图
典型段落示例图

使用场景
- 当您明确要从文档中提取的命名实体始终位于同一段落时。例如,如果您知道需要提取的组织名称和地址位于每份合同的第一段,您可以先使用 Segmentation 活动提取第一段,再使用 Named Entities (NER) 活动从该段落中提取公司名称和地址。与从整份文档提取命名实体相比,这种做法更可靠,因为您可以限定实体提取的具体范围。
- 当需要完整保留某个段落的全部内容(因为其内容都很重要)时,例如包含合同付款条款的段落。
工作原理
- 对于高变动性的文档,至少需要 100 份样本文档。
- 对于低变动性的文档,至少需要 20 份样本文档。
