메인 콘텐츠로 건너뛰기
회사 분류를 위해 데이터 카탈로그, 정규 표현식, field 매핑을 구성합니다.

1단계. Activity 추가

Activities 탭에서 문서 처리 플로우에 Classify By Company Activity를 추가합니다.

Step 2. 데이터 카탈로그 선택

Activity Properties 창으로 이동한 다음 Issuer Company 드롭다운 목록에서 사용 가능한 데이터 카탈로그를 선택합니다. 관련된 회사 쌍을 검색하려는 경우 Receiver Company (optional) 드롭다운 목록에서도 데이터 카탈로그를 선택합니다. 다음 중 하나를 수행할 수 있습니다:
  • 이름으로 데이터 카탈로그를 선택합니다. 그러면 선택한 데이터 카탈로그 이름을 그대로 사용한 데이터 카탈로그 Parameter가 자동으로 생성됩니다. 그런 다음 스킬 설정의 Parameters 탭에서 해당 Parameter를 확인할 수 있습니다.
  • 스킬에 이미 존재하는 데이터 카탈로그 Parameter를 선택합니다. 해당 Parameter가 참조하는 데이터 카탈로그 유형이 Classify By Company activity에서 지원되는 경우에만 목록에 Parameter가 표시됩니다. Parameter가 참조하는 데이터 카탈로그의 이름은 괄호 안에 표시됩니다.
  • **Manage Skill Parameters…**를 선택하여 스킬 설정을 열고 새 데이터 카탈로그 Parameter를 생성합니다. 자세한 내용은 Using parameters를 참조하세요.
참고: ABBYY Vantage에서 추가 데이터 카탈로그를 생성할 수 있습니다. 자세한 내용은 Skill Designer Guide의 “Creating data catalogs”를 참조하세요.

3단계. 데이터 카탈로그 업데이트 (선택 사항)

필요한 경우 선택한 데이터 카탈로그를 CSV 파일로 업데이트합니다. 데이터 카탈로그 목록 옆의 추가 옵션 버튼을 클릭한 다음 Update from CSV를 클릭하고, 표시되는 대화 상자에서 CSV 파일을 선택합니다. 또한 Vantage API와 공유 폴더를 사용하여 데이터 카탈로그를 업데이트할 수도 있습니다. 자세한 내용은 Skill Designer Guide의 “Using data catalogs”를 참조하십시오.

4단계. 정규식 및 키워드 구성

회사 데이터를 더 정확하게 검색하려면, 문서에 포함될 수 있는 회사 식별자(예: 세금 식별번호, 국가 세금 식별번호, IBAN)에 대해 정규식과 키워드를 지정할 수 있습니다. 정규식은 특정 검색 알고리즘을 정의하고, 키워드는 문서에서 검색 영역을 좁혀 줍니다. 문서 처리 속도를 높이기 위해 정규식과 키워드를 함께 사용하는 것을 권장합니다. 이렇게 하면 키워드가 발견된 검색 영역 내의 단어에만 정규식이 적용됩니다. 정규식과 키워드를 지정하려면 Activity Settings를 클릭합니다. 표시되는 대화 상자에서 원하는 열에 대해 다음을 수행합니다.
  1. 필드에 정규식을 직접 입력하거나, 편집 아이콘을 클릭하여 Regular Expression Editor에서 정규식을 입력합니다. 또한 정규식을 스킬 Parameter 값으로 설정한 다음, 드롭다운 목록에서 해당 Parameter를 선택할 수도 있습니다.
  2. 필드에 키워드를 직접 입력합니다. 또한 키워드를 스킬 Parameter 값으로 설정한 다음, 드롭다운 목록에서 해당 Parameter를 선택할 수도 있습니다.
  3. Next를 클릭합니다.

5단계: 데이터 카탈로그 열 매핑

데이터 카탈로그 열을 스킬의 해당 field에 매핑합니다. 데이터 추출 시 필수인 field는 회사 식별자 field 하나뿐이며, 나머지 field는 모두 선택 사항입니다. 모든 적절한 field를 매핑한 후 Save를 클릭합니다. Classify By Company 액티비티는 각 유형당 하나의 데이터 카탈로그에만 연결할 수 있습니다. 여러 카탈로그에서 데이터를 조회해야 하는 경우, 문서 처리 흐름에 여러 개의 Classify By Company 액티비티를 추가하고 각각을 다른 데이터 카탈로그에 연결할 수 있습니다.

분류 결과 사용

Classify By Company 활동을 설정한 후, 문서에서 추출된 회사 데이터를 활용합니다. 해당 데이터를 단순히 추출한 뒤 다음 처리 단계로 바로 진행할 수도 있습니다. 발행 회사에 따라 처리 흐름이 크게 달라지는 경우에는, Extraction Rules 활동 또는 IF 활동을 사용하여 회사 데이터를 기반으로 흐름을 분기할 수도 있습니다.