跳转到主要内容
RootObject 包含提取的数据,这些数据以由 ExtractedObject 对象组成的列表形式呈现。

ExtractedObject

PropertyTypeDescription
IdString提取对象的 ID。
ConceptString描述该对象结构的概念名称。
ConceptIdString描述该对象结构的概念 ID。
AnnotationsAnnotation []提取对象的元数据:对象在图像上的位置、识别置信度、识别不确定的字符等。
FieldsExtractedFieldList []已提取的 field。

标注

PropertyTypeDescription
SourceEnum {None / Text / Image}提取数据的来源(Text 或 Image)。如果文档包含文本层,则该文本层将作为提取数据的来源;否则,图像将作为提取数据的来源。“None” 表示来源未知。
ImageRegionsImageRegion []field 区域的坐标。
TextRangesTextRange []文本层中文本的边界。**注意:**此属性尚未实现。
RawValueString提取的值(标准化或验证之前)。
ConfidenceInteger提取值的置信度。
UncertainCharactersUncertainCharacter []关于识别不确定字符的信息。
VerificationErrorsVerificationError []由验证规则生成的错误列表。

ImageRegion

属性类型说明
PageString源文档中该页的 ID。
RectsInteger []field 在该页上的区域。该区域由一个包含四个坐标的数组表示。

TextRange

属性类型说明
BeginInteger值的起始位置。
EndInteger值的结束位置。
注意: TextRanges 属性尚未实现。

ExtractedFieldList

属性类型描述
NameStringfield 名称。
ListExtractedField提取的字段值。

ExtractedField

PropertyTypeDescription
IdStringfield 的 ID。
AnnotationAnnotation []有关 field 的附加信息。
ValueExtractedObject / String / Boolean提取的值。
isVerifiedBoolean表示提取的值是否已验证。
NeedVerificationBoolean表示提取的值是否需要验证。