跳转到主要内容
pages 数组中的每个元素描述一个单独的文档页,并包含其自身的数组,表示在该页上检测到的文本、表格、图像、条码、复选标记和分隔符。每个元素的属性用于存储图像中相应区域的坐标。文本元素的属性还存储了该元素被正确识别的置信度。
注意: 如果文档仅导出为 JSON 而未导出为任何图像格式,则坐标将相对于原始图像指定。若文档同时导出为 JSON 和某种图像格式,则坐标将相对于导出的预处理图像指定。
所有文本元素都归入 texts 数组或 tables 数组。
PropertyData typeDescription
widthinteger页宽(像素)。
heightinteger页高(像素)。
rotatedstring enum页相对于原始图像的旋转。可能的取值:noneclockwisecounterclockwiseupside-down
textsobject array文本块数组。
tablesobject array表格块数组。
picturespicture object array图像块数组。
barcodesbarcode object array条码块数组。
separatorsobject array分隔符块数组。
checkmarksobject array复选标记块数组。

置信度

所有描述已识别文本或图像的对象都有一个名为置信度的属性,用于表示文本被正确识别的可能性。 首先,会为单个字符计算置信度级别。更高层级元素的置信度级别基于其所包含元素的置信度级别计算得出。 为该属性定义了一种名为“置信度”的特殊数据类型。该数据类型是数值数据类型的派生类型。 允许的取值范围为 0 到 100。取值为 -1 表示该元素不包含任何文本数据。