跳轉到主要內容
本文所描述的結構定義了包含 OCR skill 文件處理結果的 JSON 檔案架構。這些檔案會儲存於影像中偵測到的圖形元素、文字元素、表格與清單的資訊,以及推測出的文件結構資訊:所有偵測到的文字會被分割成段落,每個段落都被指派特定的功能角色。段落會被分組成邏輯區段。 所有物件屬性、其資料型別與允許的值都列在 JSON 結構定義中,因此建議先熟悉該結構定義,以便更容易設定工具來分析 JSON 檔案。您可以在此下載 OCR skill 的 JSON 結構定義。 根物件描述整份已辨識的文件。關於文件的一般資訊儲存在 layoutcontent 物件中。layout 物件描述影像參數以及所有偵測到的圖形與文字元素,而 content 物件描述文件的資料組成及其在邏輯結構中的位置。 下表列出所有根物件屬性:
PropertyData typeDescription
version *stringJSON 結構文件的版本。預設為:Vantage OCR.Skill JSON output v1.0
producer *stringJSON 檔案的來源。預設為:ABBYY Vantage OCR.Skill
languagesstring array文件中偵測到的所有語言清單。
layoutobject文件的實體(版面配置)結構。
contentobject內容(文件的邏輯結構)。
  • 表示必要屬性。