跳轉到主要內容
pages 陣列中的每個元素都描述單一文件頁面,並各自包含多個陣列,用來表示在該頁面上偵測到的文字、表格、影像、條碼、核取記號與分隔符。每個元素的屬性用於儲存影像中對應區域的座標。元素被正確辨識的置信度也會儲存在文字元素的屬性中。
注意: 如果文件匯出為 JSON,但未匯出為任何影像格式,座標會以原始影像為基準來指定。如果文件同時匯出為 JSON 和其中一種影像格式,則座標會以匯出的預先處理後影像為基準來指定。
所有文字元素都會被放入 texts 陣列或 tables 陣列中。
PropertyData typeDescription
widthinteger頁面的寬度(以像素為單位)。
heightinteger頁面的高度(以像素為單位)。
rotatedstring enum頁面相對於原始影像的旋轉方向。可能的值:noneclockwisecounterclockwiseupside-down
textsobject array文字區塊陣列。
tablesobject array包含表格的區塊陣列。
picturespicture object array影像區塊陣列。
barcodesbarcode object array條碼區塊陣列。
separatorsobject array分隔符區塊陣列。
checkmarksobject array核取記號區塊陣列。

置信度

所有用於描述已辨識文字或影像的物件都有一個名為 confidence 的屬性,用來表示文字被正確辨識的可能性。 系統會先對各個字元計算置信度等級。較高階元素的置信度等級,則是根據其所包含元素的置信度等級計算而得。 為此屬性定義了一種稱為 confidence 的特殊資料型別。此資料型別是數值(number)資料型別的衍生型別。 允許的值範圍為 0 到 100。值為 -1 表示該元素不包含任何文字資料。