跳转到主要内容
DocumentDefinition 包含一个 RootConcept 类型的对象。

DocumentDefinition

属性类型说明
RootConceptConcept提取信息的根概念。
提取的元素以概念表示。每个概念对应一种对象类型,并具有唯一的名称、ID 和字段描述。

概念

属性类型描述
IdString概念的 ID。
NameString概念的名称。
FieldsConceptField []已提取字段的结构说明。
ConceptField 用于描述已提取字段的结构。一个 field 可以包含不同类型的值,既可以是简单类型(例如 string、date、number、bool 或 image),也可以是组合类型(即子对象)。

ConceptField

属性类型描述
IdStringfield 的 ID。
NameStringfield 的名称。
TypeEnum {Concept / String / Image / ISOdate / Boolean / Decimal / Enum}field 数据的类型。
EnumValuesEnumValue []可能的 field 值的枚举。**注意:**此属性尚未实现。
CardinalityCardinality该 field 是否在文档中出现多次。
ValueConceptsConcept []子概念的描述。
ValueConceptIdsString []子概念 ID 的数组。仅当某个概念是多个父概念的子概念时,该属性才可用。该子概念将完整写入其某个父概念的 ValueConcepts 属性。其他父概念在其 ValueConceptIds 属性中仅包含其标识符。
EnumValue 描述 ConceptField 对象的 Enum 元素。

EnumValue

属性类型说明
IdString元素的 ID。
NameString元素的名称。
注意: EnumValues 属性尚未实现。 基数(Cardinality) 指定该 field 在文档中是否会多次出现。

基数

属性类型说明
MinInteger最小实例数。
MaxInteger最大实例数。
如果 Min=0 且 Max=1,则该 field 在文档中不得重复。 如果 Min=0 且 Max=-1,则该 field 在文档中可以出现多次。