메인 콘텐츠로 건너뛰기

개요

ABBYY Vantage는 지능형 추출 기능을 통해 문서 처리를 자동화할 수 있도록 지원합니다. 이 가이드는 SFTP 기반 워크플로우에 중점을 두며, 공유 폴더에 문서를 업로드하고 처리된 결과를 자동으로 가져오는 방법을 설명합니다. 이 가이드를 통해 수행할 작업:
  • 프로세스 스킬 생성 및 구성
  • 입력 및 출력용 SFTP 액세스 설정
  • 명령줄을 통한 문서 업로드
  • 추출 결과 다운로드
완료 예상 시간: 15~20분

Step 1: 프로세스 스킬 생성하기

프로세스 스킬은 Vantage에서 문서 처리 워크플로의 기반이 되는 요소입니다.
  1. ABBYY Vantage에서 Documents 섹션으로 이동합니다.
  2. 왼쪽 사이드바에서 Skill Designer를 클릭합니다.
  3. 스킬 유형에서 프로세스 스킬을 선택합니다.
프로세스 스킬 선택하기
  1. Create Process skill 대화 상자에서 다음을 입력합니다:
    • Skill Name: 프로세스를 설명하는 이름 (예: “Process Skill Test 1”)
    • Description: 이 스킬이 수행하는 작업에 대한 선택 사항인 설명
    • Technology Core Version: 3.0 (권장)
프로세스 스킬 이름 지정
  1. Create를 클릭합니다.

2단계: 프로세스 스킬 워크플로 구성

스킬을 생성한 후, 문서 처리 흐름을 설정합니다.
  1. Skill Designer의 오른쪽에 Select Process Skill 패널이 표시됩니다.
  2. 단일 문서 유형을 처리하기 위해 Simple Document skill 워크플로를 선택합니다.
Simple 워크플로 선택 이 작업으로 다음이 포함된 사전 구성된 워크플로가 생성됩니다:
  • Input 커넥터: 문서가 시스템에 유입되는 지점
  • OCR 스킬: Optical Character Recognition (OCR)
  • Extract 스킬: 데이터 추출
  • Output 커넥터: 결과가 전달되는 지점
워크플로는 중앙 캔버스에 다음과 같이 표시됩니다: Input → OCR → Extract → Output

3단계: SFTP를 통한 입력 설정

Input 작업을 구성하여 SFTP를 통해 문서를 수신하도록 합니다.
  1. 워크플로에서 Input 작업을 클릭합니다.
  2. 오른쪽의 Actions 패널에서 Select additional source. 옵션을 선택합니다.
  3. Shared folder 라디오 버튼을 선택합니다.
  4. 구성을 위해 Settings를 클릭합니다.
Configuring Input Activity

입력 설정 구성

Input Settings: Shared Folder 대화 상자에서: Input Settings Dialog 폴더 설정:
  • Folder name: Input (기본값)
  • Import method: 단일 파일
가져오기 자격 증명(참고용으로 표시됨):
  • Folder link: .../Input
  • Exceptions folder link: .../Input-exception
  • Username: 생성된 UUID(예: 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: 표시/숨기기 옵션으로 표시됨
참고: 이러한 자격 증명을 복사해 두십시오. SFTP를 통해 연결할 때 필요합니다. 가져올 수 없는 파일은 예외 폴더로 이동됩니다. Skill을 게시한 후 Vantage는 20초 간격으로 파일을 확인합니다.
  1. Save를 클릭합니다.

4단계: SFTP를 통해 출력 설정

Output 활동을 구성하여 결과가 SFTP를 통해 전달되도록 설정합니다.
  1. 워크플로에서 Output 활동을 클릭합니다.
  2. Actions 패널에서 Select additional destination을 선택합니다.
  3. Shared folder 라디오 버튼을 선택합니다.
  4. 설정을 구성하기 위해 Settings를 클릭합니다.
Configuring Output Activity

출력 설정 구성

Output Settings: Shared Folder 대화 상자에서: Output Settings Dialog 정보:
  • Folder name: Output (기본값)
  • Folder: .../Output
  • Username: 생성된 UUID(예: 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: 표시/숨기기 옵션을 통해 확인 가능
내보내는 데이터:
  • Fields (JSON): 기본 내보내기 형식
참고: 결과는 원본 파일 이름과 트랜잭션 ID를 조합한 이름의 하위 폴더로 정리됩니다(예: invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). 파일은 데이터 보존 정책에 따라 자동으로 삭제됩니다.
  1. Save를 클릭합니다.

5단계: 추출 스킬 구성

Extract 활동이 인식하고 처리해야 할 문서 유형을 구성합니다.
  1. 워크플로에서 Extract 활동을 클릭합니다.
  2. Actions 패널에서 Document Skills를 확인합니다.
추출 스킬 구성 사용 가능한 Document skill은 다음과 같습니다:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. 사용 사례와 관련된 문서 유형을 선택합니다.
  2. 추가 문서 유형이 필요하면 Add Skill을 클릭합니다.
  3. 필요한 경우 Edit Mapping을 사용하여 field 추출을 사용자 지정합니다.

6단계: 게시하고 Skill ID 가져오기

SFTP를 사용하기 전에 먼저 Skill을 게시하고 해당 ID를 확인해야 합니다.
  1. Skill Designer 오른쪽 상단에서 Publish 버튼을 클릭합니다.
  2. 게시가 완료되면 브라우저의 URL에서 Skill ID를 확인해 둡니다.
Getting Skill ID from URL URL 형식은 다음과 같습니다:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
예: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c 경고: Skill ID를 잘 보관해 두세요. SFTP에서 올바른 Input 및 Output 폴더에 액세스하는 데 필요합니다.

7단계: SFTP에 연결

이제 Input/Output 설정에서 제공된 자격 증명을 사용해 SFTP에 연결할 준비가 되었습니다.

연결 정보

Input/Output 설정에서 다음 값을 확인할 수 있습니다:
  • Server: 172.172.228.138
  • Port: 2022
  • Username: 생성된 UUID
  • Password: 생성된 비밀번호
  • Base Path: /{skill-id}/

터미널을 사용해 연결

터미널을 열고 다음 명령으로 연결합니다:
sftp -P 2022 {username}@172.172.228.138
예시:
sftp -P 2022 8d1bf446-3abb-4ddb-a8a8-ed87fac7f171@172.172.228.138
참고: SFTP에서 포트 번호를 지정할 때는 대문자 -P를 사용하세요(소문자 -p는 다른 용도로 사용됩니다). 프롬프트가 표시되면 암호를 입력합니다.

8단계: SFTP 폴더 구조를 탐색합니다

연결이 완료되면 sftp> 프롬프트가 표시됩니다.

사용 가능한 Skill 보기

사용 가능한 모든 프로세스 스킬을 나열합니다.
sftp> ls
Accessing Skill Folders 각 스킬(스킬 ID로 식별됨)에 대한 폴더가 표시되며, 여기에 다음 폴더들도 있습니다:
  • Catalogs - Document skill 카탈로그
  • Catalogs-exception - 실패한 카탈로그 가져오기
  • skills-import - Skill 가져오기 디렉터리
6단계에서 확인한 Skill ID를 사용하세요.
sftp> cd {your-skill-id}
sftp> ls
세 개의 폴더가 표시됩니다:
  • Input - 처리를 위한 문서를 업로드하는 폴더
  • Input-exception - 가져오기에 실패한 항목이 이동되는 폴더
  • Output - 처리된 결과가 표시되는 폴더

9단계: 처리를 위해 문서 업로드하기

Input 폴더로 이동하여 문서를 업로드합니다.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

단일 파일 업로드

전체 경로를 지정하여 파일을 업로드합니다:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
또는 먼저 로컬 디렉터리를 변경하세요:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
파일 업로드 및 다운로드

여러 파일 업로드하기

sftp> mput *.jpg
sftp> mput invoice_*.pdf
참고: Input에 업로드한 파일은 성공적으로 처리되면 자동으로 삭제됩니다(보통 20초 이내). 업로드 후 파일이 바로 보이지 않는다면, 이미 Vantage가 해당 파일을 가져가 처리하고 있다는 뜻입니다!

업로드 확인

파일이 아직 Input 폴더에 있는지 확인합니다:
sftp> ls
폴더가 비어 있거나 파일이 없는 경우, 처리가 이미 시작된 것입니다.

10단계: 처리 상태 확인

Input-exception 폴더 확인

파일 가져오기에 실패한 경우 이곳에 표시됩니다.
sftp> cd ..
sftp> cd Input-exception
sftp> ls
폴더가 비어 있으면 모든 파일이 성공적으로 가져와졌다는 뜻입니다.

처리 대기

처리 시간은 다음 요소에 따라 달라집니다:
  • 문서 복잡도
  • 구성된 추출 스킬
  • 현재 시스템 부하
일반적으로 단순한 송장은 30~60초 내에 처리됩니다.

11단계: 처리 완료된 결과 다운로드

처리가 완료되면 결과가 Output 폴더에 저장됩니다.
sftp> cd ..
sftp> cd Output
sftp> ls

출력 구조 이해하기

결과는 다음과 같은 이름 규칙을 따르는 하위 폴더로 구성됩니다:
{original-filename}-{transaction-id}
예:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

결과 폴더 내용 확인하기

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
일반적으로 포함되는 내용:
  • Invoice_US.json - JSON 형식으로 추출된 데이터
  • Invoice_US.csv - CSV 형식으로 추출된 데이터(설정된 경우)
  • 출력 설정에 따라 추가 파일이 포함될 수 있습니다.

결과 다운로드

로컬 다운로드 디렉터리를 설정하세요.
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
단일 파일 다운로드:
sftp> get Invoice_US.json
폴더 내 모든 파일 다운로드:
sftp> mget *
전체 결과 폴더를 재귀적으로 다운로드하기:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

JSON 출력 이해하기

기본 출력은 다음을 포함하는 JSON 파일입니다:
  • 문서 구조 - 레이아웃과 구성
  • 추출된 field 값 - 문서에서 추출된 데이터
  • 신뢰도 점수 - 각 추출 결과의 신뢰 수준
  • 규칙 오류 - 유효성 검사 관련 문제
  • field 메타데이터 - 각 field에 대한 추가 정보
예시 구조:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
자세한 JSON 스키마에 대한 설명은 ABBYY Vantage API 문서를 참조하십시오.

유용한 SFTP 명령어

CommandDescriptionExample
ls원격 파일 목록 표시ls
lls로컬 파일 목록 표시lls
pwd원격 디렉터리 표시pwd
lpwd로컬 디렉터리 표시lpwd
cd folder원격 디렉터리 변경cd Output
lcd folder로컬 디렉터리 변경lcd ~/Downloads
put file단일 파일 업로드put invoice.pdf
mput files여러 파일 업로드mput *.jpg
get file단일 파일 다운로드get result.json
mget files여러 파일 다운로드mget *
get -r folder폴더를 재귀적으로 다운로드get -r results/
exit연결 종료exit

문제 해결

연결 문제

문제: “Connection refused” 또는 시간 초과 오류 해결 방법:
  • 회사 VPN에 연결되어 있는지 확인하세요.
  • 포트 번호가 2022인지, 옵션 -P가 대문자인지 확인하세요.
  • 사용자 이름과 비밀번호가 올바른지 확인하세요.
  • 기본 네트워크 연결을 테스트하세요: ping 172.172.228.138

업로드 문제

문제: 파일이 처리되지 않음 해결 방법:
  • 실패한 가져오기 건에 대해 Input-exception 폴더를 확인합니다.
  • 파일 형식이 지원되는지 확인합니다(PDF, JPG, PNG, TIFF 등).
  • 프로세스 스킬이 게시되어 있는지 확인합니다.
  • 파일 크기 제한을 확인합니다(구성에 따라 다름).

출력 파일 없음

문제: 업로드 후 출력 폴더가 비어 있음 해결 방법:
  • 조금 더 기다리십시오. 처리에는 30–60초 이상 걸릴 수 있습니다.
  • Output이 “Shared folder” 대상으로 구성되어 있는지 확인하십시오.
  • Vantage 웹 인터페이스에서 트랜잭션 로그를 확인하십시오.
  • Extract Activity에 적절한 Document skill이 구성되어 있는지 확인하십시오.

권한 오류

문제: 업로드/다운로드 시 “Permission denied” 오류 발생 해결 방법:
  • Input과 Output에 대해 올바른 자격 증명을 사용하고 있는지 확인합니다.
  • Input 자격 증명으로 허용되는 작업: 업로드, 삭제
  • Output 자격 증명으로 허용되는 작업: 보기, 다운로드, 이름 변경, 삭제
  • 스킬이 게시되어 있고 활성 상태인지 확인합니다.

모범 사례

보안

  • SFTP 자격 증명을 평문으로 공유하지 마십시오
  • 비밀번호를 전송할 때는 보안 채널을 사용하십시오
  • 자격 증명을 주기적으로 교체하십시오
  • SFTP 액세스는 필요한 인원에게만 허용하십시오

파일 관리

  • 날짜 또는 ID가 포함된, 의미를 잘 나타내는 파일 이름을 사용합니다
  • 가능하다면 사용량이 적은 시간대에 파일을 배치 단위로 처리합니다
  • 결과를 신속하게 다운로드하여 보관합니다
  • 오래된 결과 폴더를 정기적으로 정리합니다

모니터링

  • Input-exception 폴더에서 가져오기 실패 건을 정기적으로 확인합니다
  • 병목 지점을 식별하기 위해 처리 시간을 모니터링합니다
  • 결과에서 추출 결과 신뢰도 점수를 검토합니다
  • 치명적 오류에 대한 알림을 설정합니다(가능한 경우)

워크플로우 최적화

  • 유사한 문서 유형을 함께 그룹화하세요
  • 사용 사례에 적합한 Document skill을 구성하세요
  • 운영 환경에 적용하기 전에 샘플 문서로 테스트하세요
  • 팀 참고용으로 SFTP 워크플로우를 문서화하세요

다음 단계

이제 SFTP 기반 문서 처리 파이프라인이 준비되었으므로 다음을 진행해 보세요:
  1. 다양한 문서로 테스트 - 여러 파일 유형과 다양한 형태의 문서를 업로드합니다
  2. 추출 정확도 검토 - JSON 결과와 신뢰도 점수를 확인합니다
  3. 추출 사용자 지정 - Edit Mapping을 사용하여 field 추출을 미세 조정합니다
  4. 업로드 자동화 - 파일 업로드를 자동화하는 스크립트를 작성합니다
  5. 시스템과 통합 - Vantage REST API를 통해 애플리케이션을 연동합니다
  6. 워크플로 확장 - 더 많은 Document skill을 추가하거나 프로세스 스킬을 추가로 생성합니다
고급 구성, API 통합 또는 사용자 지정 워크플로가 필요한 경우 ABBYY Vantage 문서를 참조하세요.

추가 리소스

  • REST API 설명서: 프로그래밍 방식으로 파일을 업로드하고 결과를 가져오는 방법
  • Skill Catalog: 사전 구성된 Document skill을 둘러보기
  • 지원: 기술 지원이 필요하면 ABBYY 지원팀에 문의하세요

요약

다음을 성공적으로 완료했습니다:
  • ✅ ABBYY Vantage에서 프로세스 스킬을 생성했습니다
  • ✅ 입력 및 출력용 SFTP 액세스를 구성했습니다
  • ✅ 문서 추출 스킬을 설정했습니다
  • ✅ SFTP 명령줄을 통해 접속했습니다
  • ✅ 처리할 문서를 업로드했습니다
  • ✅ 추출 결과를 다운로드했습니다
이제 문서 처리 파이프라인이 운영 가능한 상태이며 프로덕션 환경에 투입할 준비가 완료되었습니다!