注意: 此活动无法提取复杂结构(例如嵌套表格,即表格中包含的重复结构)以及类型不是 Text 的字段。要提取此类结构,请使用 Extraction Rules 活动。
使用场景
- 您的技能将用于处理某一文档类型的多个变体。
- 您计划处理的文档变体尚未用于训练您的技能。例如,您可能拥有一个包含 Fast Learning 活动的文档技能,该技能已经过训练,可以从来自几家不同银行、字段结构各异的贷款协议中提取字段。如果您决定使用这个现有技能来处理来自某家该技能尚未见过的新银行的贷款协议,则提取质量可能会不尽如人意。为提高提取质量,您可以将 Fast Learning 活动替换为 Deep Learning 活动。
工作原理
训练要求
- 对于高变异性的文档:至少需要 200–300 份样本文档(每种变体 2–3 份样本文档)。
- 对于低变异性的文档:至少需要 10 份样本文档(每种变体 2–3 份样本文档)。
