跳转到主要内容
pages 数组中的每个元素描述一个单个的文档页面,并包含其各自的数组,用于表示在该页面上检测到的文本、表格、图像、条形码、勾选标记和分隔符。每个元素的属性用于存储图像中对应区域的坐标。对于文本元素,其属性中还会存储该元素被正确识别的置信度。
注意: 如果文档仅导出为 JSON 而未同时导出为任何图像格式,则坐标是相对于原始图像指定的。如果文档既导出为 JSON 又同时导出为某种图像格式,则坐标是相对于导出的预处理图像指定的。
所有文本元素都会被放入 texts 数组或 tables 数组中。
PropertyData typeDescription
widthinteger页面宽度(像素)。
heightinteger页面高度(像素)。
rotatedstring enum页面相对于原始图像的旋转方向。可能的取值:noneclockwisecounterclockwiseupside-down
textsobject array文本块数组。
tablesobject array表格块数组。
picturespicture object array图像块数组。
barcodesbarcode object array条形码块数组。
separatorsobject array分隔符块数组。
checkmarksobject array勾选标记块数组。

置信度

所有描述已识别文本或图像的对象都有一个名为 confidence(置信度)的属性,用于表示该文本被正确识别的可能性。 首先,会为单个字符计算置信度级别。更高层级元素的置信度级别是根据其包含的元素的置信度级别计算得到的。 为该属性定义了一种名为 confidence(置信度)的特殊数据类型。该数据类型是数字数据类型的派生类型。 允许的取值范围为 0 到 100。值为 -1 表示该元素不包含任何文本数据。