跳轉到主要內容

概覽

ABBYY Vantage 可用於自動化文件處理,並具備智慧擷取功能。本指南著重於以 SFTP 為基礎的工作流程,讓您可以將文件上傳到共用資料夾,並自動取得已處理完成的結果。 您將完成以下事項:
  • 建立並設定一個流程技能 (Process Skill)
  • 設定用於輸入與輸出的 SFTP 存取
  • 透過命令列上傳文件
  • 下載擷取結果
預計完成時間: 15–20 分鐘

步驟 1:建立流程技能

流程技能是您在 Vantage 中建立文件處理工作流程的基礎。
  1. 前往 ABBYY Vantage 中的 Documents 區段。
  2. 在左側側邊欄按一下 Skill Designer
  3. 在技能類型中選擇 Process Skill
選取流程技能
  1. Create Process skill 對話方塊中,輸入:
    • Skill Name: 能清楚說明此流程的名稱(例如:“Process Skill Test 1”)
    • Description: 此流程技能的用途說明(選填)
    • Technology Core Version: 3.0(建議)
為流程技能命名
  1. 按一下 Create

步驟 2:設定流程技能工作流程

建立 skill 之後,您將設定文件處理流程。
  1. 在 Skill Designer 中,您會在右側看到 Select Process Skill 面板
  2. 選擇 Simple Document skill workflow 以處理單一文件類型
Selecting Simple Workflow 此操作會建立一個預先設定的工作流程,其中包含:
  • Input 連接器:文件進入系統的位置
  • OCR skill:光學字元辨識
  • Extract skill:資料擷取
  • Output 連接器:結果傳送的位置
工作流程會顯示在中央畫布上,呈現為:Input → OCR → Extract → Output

步驟 3:透過 SFTP 設定輸入

設定 Input 活動,讓其透過 SFTP 接收文件。
  1. 在工作流程中按一下 Input 活動。
  2. 在右側的 Actions 面板中,勾選 Select additional source.
  3. 選取 Shared folder 單選按鈕。
  4. 按一下 Settings 以進行設定。
Configuring Input Activity

設定輸入參數

Input Settings: Shared Folder 對話方塊中: Input Settings Dialog 資料夾設定:
  • 資料夾名稱: Input(預設)
  • 匯入方式: 單一檔案
匯入認證資訊(供您使用):
  • 資料夾連結: .../Input
  • 例外資料夾連結: .../Input-exception
  • 使用者名稱: 系統產生的 UUID(例如:685df03c-9e22-41cb-a96f-4c408ab52735
  • 密碼: 可選擇顯示/隱藏
注意: 請複製這些認證資訊,之後您將需要使用它們透過 SFTP 進行連線。無法匯入的檔案會被移至例外資料夾。Vantage 會在發佈該技能後每 20 秒檢查一次檔案。
  1. 按一下 Save

步驟 4:透過 SFTP 設定輸出

將 Output 活動設定為透過 SFTP 傳送結果。
  1. 在流程中按一下 Output 活動。
  2. Actions 面板中,勾選 Select additional destination.
  3. 選取 Shared folder 選項按鈕。
  4. 按一下 Settings 來進行設定。
Configuring Output Activity

設定輸出

Output Settings: Shared Folder 對話方塊中: Output Settings Dialog 資訊:
  • **Folder name:**Output(預設)
  • Folder:.../Output
  • **Username:**產生的 UUID(例如:685df03c-9e22-41cb-a96f-4c408ab52735
  • **Password:**可透過顯示/隱藏選項檢視
匯出資料:
  • **Fields (JSON):**預設匯出格式
**注意:**結果會依來源檔案名稱與處理作業 ID 整理到對應的子資料夾中(例如:invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82)。檔案會依據資料保留原則自動刪除。
  1. 按一下 Save。

步驟 5:設定擷取技能

設定 Extract 活動要辨識與處理的文件類型。
  1. 在流程中按一下 Extract 活動。
  2. Actions 面板中,即可看到 Document Skills
Configuring Extraction Skills 可用的文件 Skill 包括:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. 選取與您的使用案例相關的文件類型。
  2. 若需要其他文件類型,按一下 Add Skill
  3. 視需要使用 Edit Mapping 來自訂欄位擷取。

步驟 6:發佈並取得 Skill ID

在使用 SFTP 之前,你需要先發佈 skill,並找到其 ID。
  1. 在 Skill Designer 右上角按一下 Publish 按鈕。
  2. 發佈完成後,從瀏覽器的 URL 記下 Skill ID
從 URL 取得 Skill ID URL 的格式如下:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
例如:fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c 警告: 請妥善保存您的 Skill ID——您需要用它來存取 SFTP 中正確的 Input 和 Output 資料夾。

步驟 7:連線至 SFTP

現在您已準備好使用輸入/輸出設定中的認證資訊透過 SFTP 建立連線。

連線詳細資訊

在您的輸入/輸出設定中,會顯示:
  • Server: 172.172.228.138
  • Port: 2022
  • Username: 為您產生的 UUID
  • Password: 為您產生的密碼
  • Base Path: /{skill-id}/

透過終端機連線

開啟終端機並使用以下指令進行連線:
sftp -P 2022 {username}@172.172.228.138
範例:
sftp -P 2022 8d1bf446-3abb-4ddb-a8a8-ed87fac7f171@172.172.228.138
注意: 在 SFTP 中,連接埠號請使用大寫的 -P(小寫的 -p 用於其他用途)。 出現提示時,請輸入您的密碼。

步驟 8:瀏覽 SFTP 資料夾結構

連線成功後,您會看到 SFTP 提示字元:sftp>

檢視可用的技能

列出所有可用的流程技能:
sftp> ls
存取技能資料夾 你會看到每個 skill 的資料夾(以其 Skill ID 辨識),以及:
  • Catalogs - 文件 Skill 的技能目錄
  • Catalogs-exception - 匯入失敗的技能目錄
  • skills-import - Skill 匯入目錄
使用第 6 步中的 skill ID:
sftp> cd {your-skill-id}
sftp> ls
您應該會看到三個資料夾:
  • Input - 將要處理的文件上傳到此處
  • Input-exception - 匯入失敗的項目會移至此處
  • Output - 處理後的結果會顯示在此處

步驟 9:上傳文件以進行處理

前往 Input 資料夾並上傳您的文件。
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

上傳單一檔案

使用檔案的完整路徑進行上傳:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
或先切換到您的本機目錄:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
上傳與下載檔案

上傳多份文件

sftp> mput *.jpg
sftp> mput invoice_*.pdf
注意: 上傳到 Input 的檔案在成功處理完成後會自動刪除(通常在 20 秒內)。如果上傳後看不到您的檔案,表示 Vantage 已經將其取用進行處理!

確認上傳

確認檔案是否仍位於 Input 資料夾中:
sftp> ls
如果資料夾是空的或找不到您的檔案,則表示處理已經開始。

步驟 10:檢查處理狀態

監控 Input-exception 資料夾

如果有檔案匯入失敗,它會顯示在這裡:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
空的資料夾表示所有檔案已全部成功匯入。

等待處理

處理時間會因下列因素而異:
  • 文件的複雜度
  • 已設定的擷取技能
  • 目前系統負載
一般而言,簡單的發票會在 30–60 秒內處理完成。

步驟 11:下載已處理的結果

處理完成後,結果會出現在 Output 資料夾中。
sftp> cd ..
sftp> cd Output
sftp> ls

瞭解輸出結構

結果會依以下命名模式整理到子資料夾中:
{original-filename}-{transaction-id}
範例:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

檢視結果資料夾內容

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
一般內容:
  • Invoice_US.json - 以 JSON 格式擷取的資料
  • Invoice_US.csv - 以 CSV 格式擷取的資料(若已設定)
  • 其他檔案,取決於您的輸出設定

下載結果

設定您的本機下載目錄:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
下載單一檔案:
sftp> get Invoice_US.json
下載該資料夾中的所有檔案:
sftp> mget *
遞迴下載整個結果資料夾:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

瞭解 JSON 輸出

預設輸出為一個 JSON 檔案,內容包括:
  • 文件結構 - 版面配置與組織方式
  • 擷取的欄位值 - 從文件中擷取出的資料
  • 信心分數 - 每個擷取結果的可靠程度
  • 規則錯誤 - 驗證過程中的任何問題
  • 欄位中繼資料 - 關於每個欄位的其他資訊
範例結構:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
如需 JSON 結構的詳細說明,請參閱 ABBYY Vantage API 說明文件。

實用 SFTP 指令

CommandDescriptionExample
ls列出遠端檔案ls
lls列出本機檔案lls
pwd顯示遠端目錄pwd
lpwd顯示本機目錄lpwd
cd folder切換遠端目錄cd Output
lcd folder切換本機目錄lcd ~/Downloads
put file上傳單一檔案put invoice.pdf
mput files上傳多個檔案mput *.jpg
get file下載單一檔案get result.json
mget files下載多個檔案mget *
get -r folder遞迴下載資料夾get -r results/
exit結束連線exit

疑難排解

連線問題

問題:「Connection refused」或連線逾時錯誤 解決方法:
  • 確認您已連線至公司 VPN
  • 檢查連接埠號碼(應為 2022,並使用大寫 -P
  • 確認您的使用者名稱與密碼正確無誤
  • 測試基本網路連線狀況:ping 172.172.228.138

上傳問題

問題: 檔案無法處理 解決方案:
  • 檢查 Input-exception 資料夾中的匯入失敗項目
  • 確認檔案格式是否受支援(PDF、JPG、PNG、TIFF 等)
  • 確保流程技能已發佈
  • 檢查檔案大小限制(依設定而定)

沒有輸出檔案

問題: 上傳後,輸出資料夾為空 解決方法:
  • 多等一段時間——處理可能需要 30–60 秒或更久
  • 確認 Output 已設定為「Shared folder」目的地
  • 在 Vantage 網頁介面中檢查處理作業記錄
  • 確認 Extract 活動已正確設定所需的文件 Skill

權限錯誤

問題: 上傳或下載時出現「Permission denied」 解決方案:
  • 確認你對 Input 與 Output 使用的是正確的認證資訊
  • Input 認證資訊允許:上傳 (upload)、刪除 (delete)
  • Output 認證資訊允許:檢視 (view)、下載 (download)、重新命名 (rename)、刪除 (delete)
  • 檢查該 skill 是否已發佈且處於啟用狀態

最佳做法

安全性

  • 切勿以明文分享 SFTP 憑證
  • 使用安全管道傳送密碼
  • 定期更換憑證
  • 將 SFTP 存取權限僅授權給必要人員

檔案管理

  • 使用包含日期或 ID 的具描述性的檔名
  • 若可行,於離峰時段以批次方式處理檔案
  • 及時下載並封存處理結果
  • 定期清理舊的結果資料夾

監控

  • 定期檢查 Input-exception 資料夾是否有匯入失敗的項目
  • 監控處理時間以找出瓶頸
  • 檢視結果中的擷取結果信心分數
  • 設定嚴重錯誤的警示(若可用)

工作流程最佳化

  • 將相似的文件類型分組
  • 為使用案例設定適當的文件 Skill
  • 在正式上線前先使用範例文件進行測試
  • 將 SFTP 工作流程撰寫成文件,供團隊參考

下一步

現在你已經有一個可運作、基於 SFTP 的文件處理管線:
  1. 使用各種文件進行測試 - 上傳不同的檔案類型與不同版型的文件
  2. 檢查擷取準確度 - 檢視 JSON 結果與信心分數
  3. 自訂擷取 - 使用 Edit Mapping 微調欄位擷取
  4. 自動化上傳 - 建立腳本以自動上傳檔案
  5. 與系統整合 - 透過 Vantage REST API 連接你的應用程式
  6. 擴充你的工作流程 - 新增更多文件 Skill 或建立額外的流程技能
如需進階設定、API 整合或自訂工作流程,請參閱 ABBYY Vantage 文件

其他資源

  • REST API Documentation: 以程式方式上傳檔案並擷取結果
  • Skill Catalog: 瀏覽預先建置的文件 skill
  • Support: 聯絡 ABBYY 支援以取得技術協助

摘要

您已成功完成以下步驟:
  • ✅ 在 ABBYY Vantage 中建立流程技能 (Process Skill)
  • ✅ 設定 SFTP 輸入與輸出的存取
  • ✅ 設定文件擷取 skill
  • ✅ 透過 SFTP 命令列連線
  • ✅ 上傳文件進行處理
  • ✅ 下載擷取結果
您的文件處理管線現在已可正常運作,並已準備好在正式環境中使用!