ExtractedObject
| 属性 | 类型 | 说明 |
|---|---|---|
Id | String | 提取对象的 ID。 |
Concept | String | 描述该对象结构的概念名称。 |
ConceptId | String | 描述该对象结构的概念 ID。 |
Annotations | Annotation [] | 提取对象的元数据:对象在图像中的位置、识别置信度、不确定识别的字符等。 |
Fields | ExtractedFieldList [] | 提取的字段。 |
标注
| 属性 | 类型 | 说明 |
|---|---|---|
Source | Enum {None / Text / Image} | 提取数据的来源(Text 或 Image)。如果文档包含文本层,则该文本层将作为提取数据的来源;否则,图像将作为提取数据的来源。“None” 表示来源未知。 |
ImageRegions | ImageRegion [] | field 区域的坐标。 |
TextRanges | TextRange [] | 文本层中文本的边界。**注意:**此属性尚未实现。 |
RawValue | String | 提取的值(规范化或验证之前)。 |
Confidence | Integer | 提取值的置信度。 |
UncertainCharacters | UncertainCharacter [] | 关于识别不确定字符的信息。 |
VerificationErrors | VerificationError [] | 根据验证规则生成的错误列表。 |
ImageRegion
| 属性 | 类型 | 描述 |
|---|---|---|
Page | String | 源文档中该页的 ID。 |
Rects | Integer [] | 页上该field的区域。该区域由包含四个坐标的数组表示。 |
TextRange
| 属性 | 类型 | 说明 |
|---|---|---|
Begin | Integer | 值的起始位置。 |
End | Integer | 值的结束位置。 |
ExtractedFieldList
| 属性 | 类型 | 描述 |
|---|---|---|
Name | String | field 的名称。 |
List | ExtractedField | 提取的值。 |
ExtractedField
| 属性 | 类型 | 描述 |
|---|---|---|
Id | String | field 的 ID。 |
Annotation | Annotation [] | 关于该 field 的附加信息。 |
Value | ExtractedObject / String / Boolean | 提取的值。 |
isVerified | Boolean | 指示提取的值是否已通过验证。 |
NeedVerification | Boolean | 指示提取的值是否需要验证。 |
