跳转到主要内容
pages 数组中的每个元素描述一页文档,并且包含若干子数组,分别表示在该页上检测到的文本、表格、图像、条形码、复选标记和分隔符。每个元素的属性用于存储图像上对应区域的坐标。文本元素的属性中还会存储该元素被正确识别的置信度。
注意: 如果文档仅导出为 JSON 而未导出为任何图像格式,坐标将相对于原始图像进行指定。如果文档导出为 JSON 的同时也导出为某种图像格式,坐标将相对于导出的预处理图像进行指定。
所有文本元素都会放入 texts 数组或 tables 数组中。
PropertyData typeDescription
widthinteger页的宽度(以像素为单位)。
heightinteger页的高度(以像素为单位)。
rotatedstring enum页相对于原始图像的旋转方向。可能的取值:noneclockwisecounterclockwiseupside-down
textsobject array文本块数组。
tablesobject array包含表格的块数组。
picturespicture object array图像块数组。
barcodesbarcode object array条形码块数组。
separatorsobject array分隔符块数组。
checkmarksobject array复选标记块数组。

置信度

所有描述已识别文本或图像的对象都有一个名为置信度的属性,用于表示文本被正确识别的可能性。 首先,会为单个字符计算置信度级别。更高层级元素的置信度级别基于其所包含元素的置信度级别计算得出。 为该属性定义了一种名为“置信度”的特殊数据类型。该数据类型是数值数据类型的派生类型。 允许的取值范围为 0 到 100。取值为 -1 表示该元素不包含任何文本数据。