메인 콘텐츠로 건너뛰기
Document skill을 만든 후, 다음 단계에 따라 스킬을 설정합니다.
  1. 분류기를 학습하고 테스트하는 데 사용할 문서를 업로드합니다(각 파일에는 하나의 문서 이미지만 포함되어야 합니다). 문서를 업로드하려면 Skill Designer에서 Documents 탭으로 이동한 다음 디자이너 중앙, 도구 모음 또는 Actions 창에 있는 Upload documents 버튼을 클릭합니다. 문서를 업로드하는 동안 Skill Designer 상단의 북마크 오른쪽에 진행률 표시기가 표시됩니다. 표시기 툴팁에는 아직 업로드되거나 처리되어야 하는 문서 개수에 대한 정보가 표시됩니다. 문서 이름 왼쪽에 있는 아이콘을 클릭하면 문서 미리 보기 창을 열 수 있습니다. 이 창의 기본 너비는 브라우저 창 너비의 35%입니다. 필요하면 미리 보기 창의 왼쪽 경계를 드래그하여 너비를 브라우저 창 너비의 최대 80%까지 늘릴 수 있습니다. 사용자가 지정한 너비는 브라우저 캐시가 지워질 때까지 유지됩니다.
  2. 학습 문서에서 데이터가 추출되어야 하는 모든 필드에 대해 이미지 상의 위치를 지정하여 레이블을 지정합니다. 필요하다면 검증 규칙과 스킬 Parameter를 추가할 수도 있습니다. 학습 문서의 필드에 레이블을 지정하려면 Skill Designer의 Editor 탭으로 이동합니다. 탭 이름을 클릭하거나, 목록에서 하나 이상의 문서를 선택한 다음 Actions 창에서 Label Fields and Create Business Rules를 클릭해도 됩니다.
  3. 스킬을 학습시키고 추출 정확도를 분석합니다. 오류가 있으면 수정합니다. 스킬 학습을 시작하려면 Actions 창에서 Train 버튼을 클릭합니다. 학습이 완료되면 Train 버튼 옆에 Completed가 표시됩니다. Actions 창에서 Train 버튼 아래의 Cancel을 클릭하여 스킬 학습을 중지할 수 있습니다.
  4. 결과에 만족할 때까지 1단계부터 3단계까지를 반복합니다.
  5. 운영용 스킬을 Skill Catalog에 게시하여 사용할 수 있도록 합니다.
  6. 필요하다면, 스킬에서 추가 스킬을 파생할 수 있습니다. 이러한 파생 스킬은 기본 스킬의 모든 규칙과 필드를 상속합니다. 또한 파생 스킬은 사용자가 수행한 모든 변경 내용을 유지하면서 기본 스킬의 최신 버전으로 원활하게 업데이트할 수 있습니다.

구조화된 문서를 처리하기 위한 Document skill 설정

ABBYY Vantage는 구조화된 문서를 처리하기 위한 머신 러닝 기반 모드를 제공합니다. 구조화된 문서란 각 문서 인스턴스에서 field 위치가 항상 동일한 문서를 의미합니다. 이러한 문서의 예로는 설문지, 신청서, 세금 신고서 양식 등이 있습니다. 이 모드는 IRS Form 1040처럼 연도별로 field의 집합과 위치가 조금씩 다른 여러 가지 변형을 가진 문서도 처리할 수 있습니다. 이러한 각 변형은 개별 구조화된 문서를 나타내며, 각 변형마다 빈 양식을 업로드해야 합니다. 구조화된 문서를 처리하는 스킬을 설정하려면 다음 단계를 따르십시오.
  1. 새로운 Document skill을 생성하고 해당 스킬에 대해 Fixed-form documents 토글을 켭니다. 고정 양식 토글
  2. 문서의 각 변형에 대해 샘플 빈 양식을 하나씩 업로드합니다. 이를 위해 Skill Designer에서 Blank Form 탭으로 이동한 다음, 디자이너 중앙, 도구 모음 또는 Actions 창에 있는 Upload Blank Form 버튼을 클릭합니다. 빈 양식이 없는 경우, 작성이 완료된 양식을 업로드한 뒤 이를 빈 양식으로 표시할 수 있습니다.
Note: 하나의 스킬은 하나의 양식에 대해 최대 10개의 서로 다른 변형(예: 연도별 IRS Form 1040 변형)을 처리할 수 있습니다.
  1. 데이터가 추출되어야 하는 field에 레이블을 지정합니다.
  2. 배경이 인식에 영향을 줄 수 있는 field의 설정에서 Eliminate field background 옵션을 활성화합니다.
  3. Actions 창에서 Train을 클릭합니다.
  4. Test Set 탭을 클릭하고 작성이 완료된 테스트 문서를 업로드합니다. 각 문서에서 모든 field에 레이블이 올바르게 지정되었는지 확인합니다. 어떤 field 위치가 업로드된 빈 양식 샘플 중 어느 것과도 일치하지 않는 경우, 해당 문서 변형에 대한 빈 양식 샘플을 추가합니다.
  5. Actions 창에서 스킬을 테스트합니다. 작업이 완료되면 결과를 검토합니다. 결과가 만족스럽지 않은 경우, 레이블을 조정하고 다시 학습을 수행합니다.
  6. 스킬을 Skill Catalog에 게시하여 사용할 수 있도록 합니다.
고정 양식 탭 구조화된 문서를 처리하는 스킬에 대해 Skill Designer에 표시되는 탭 문서를 처리하는 동안, 문서가 구조화된 문서라기보다는 반구조화된 문서로 처리되는 것이 더 적절하다는 것을 알게 될 수도 있습니다. 이 경우:
  1. Skill Designer에서 스킬 이름 오른쪽에 있는 아이콘을 클릭합니다.
  2. Fixed-form documents 토글을 끕니다.
Note: 레이블이 지정된 모든 field는 그대로 유지됩니다.
  1. 스킬을 다시 학습합니다.
Advanced Designer에서 스킬을 편집하고 Forms activity를 다른 activity와 결합하면, Vantage에서 Fixed-form documents 토글이 비활성화되며 Advanced Designer 외부에서는 더 이상 해당 스킬을 편집할 수 없습니다.

테이블과 반복 그룹 작업

구조화된 문서를 처리할 때, Vantage는 테이블 또는 반복 그룹의 최대 행 수나 그룹 인스턴스 수를 미리 알고 있고, 테이블이나 그룹의 경계가 고정되어 있는 경우 테이블과 반복 그룹을 처리할 수 있습니다. 양식의 모든 변형(버전)에서 발생할 수 있는 모든 행에 레이블을 지정해야 합니다.
참고: 처리 결과에는 데이터가 있는 행만 표시됩니다. 비어 있는 행은 모두 무시됩니다.
그룹의 행 수나 인스턴스 수를 미리 알 수 없는 경우에는 다른 Vantage 기술을 사용해야 합니다. 자세한 내용은 구조화된 문서 처리를 참조하십시오.
Tip: 현재는 텍스트 값을 가진 테이블만 처리할 수 있습니다. 테이블에 체크박스나 바코드가 있는 열이 포함되어 있다면, 대신 반복 그룹을 사용하십시오.

인식 언어 설정

문서를 처리할 때 Vantage는 지정된 언어 목록에서 처리에 사용할 언어를 선택합니다. 새 스킬을 구성할 때 기본적으로 다음 네 가지 언어가 선택됩니다: English, French, German, Spanish. 인식 언어 목록은 Skill Designer에서 스킬 이름 오른쪽에 있는 아이콘을 클릭하여 수정할 수 있습니다. 설정 대화 상자에 표시되는 언어는 알파벳 순으로 정렬됩니다. 선택된 언어는 목록의 맨 위에 표시됩니다. 최소 한 개의 언어를 선택해야 합니다. 설정 대화 상자를 닫으려면 변경 내용을 유지하려면 Save를, 변경 내용을 취소하려면 Cancel을 클릭합니다.
참고: 선택한 언어 수는 문서 처리 속도에 영향을 줄 수 있습니다. Vantage가 문서에서 어떤 언어를 처리하게 될지 확실하다면, 선택한 언어를 해당 언어로만 제한할 것을 권장합니다.
스킬이 이미 학습된 상태라도 스킬의 인식 언어 목록을 수정할 수 있습니다. 변경 사항을 적용하려면 문서를 다시 업로드하고 스킬을 다시 학습시켜야 합니다.

Online Learning 모드 설정

Online Learning은 Document skill과 분류 스킬에서 사용할 수 있습니다. Online Learning 서비스는 문서를 학습 세트에 수집한 다음, 수집된 문서를 사용하여 스킬을 추가로 학습시킵니다. Document Skill Settings에서 사용할 수 있는 Online Learning 모드는 다음과 같습니다:
  • Collect and learn. 기본 옵션입니다.
  • Collect only. Skill Designer에서 학습 없이 문서를 수집해야 하는 경우 사용합니다.
학습을 수행하지 않고 문서만 수집하려면, Skill Designer에서 스킬 이름 오른쪽의 아이콘을 클릭하고 설정 대화 상자에서 Collect only 모드를 선택합니다. 이 모드를 사용하면 스킬을 재학습하기 전에 학습 세트에 추가된 문서를 검토할 수 있습니다. Collect Only Mode

함께 보기