메인 콘텐츠로 건너뛰기
일부 회사의 문서는 특유의 복잡한 구조를 가질 수 있습니다. 이러한 문서에서 데이터를 정확하게 추출하려면 회사별 추출 액티비티를 구성해야 합니다. 이는 하나의 Document skill 내에서 Classify By Company 액티비티를 사용하여 수행할 수 있습니다. 이 액티비티는 데이터 카탈로그를 사용하여 문서를 회사별로 분류합니다.

데이터 카탈로그 사용

데이터 카탈로그는 특정 정보를 포함하는 데이터 집합입니다. 예를 들어, 회사 이름, 주소, 은행 계좌 번호 등과 같은 회사 관련 정보가 될 수 있습니다. 데이터 카탈로그는 공급업체, 수하인, 은행, 해운/운송 회사 등 문서에 포함된 회사를 검색하는 데 사용할 수 있습니다. 데이터 카탈로그는 데이터 카탈로그와 동일한 구조를 가진 CSV 파일의 데이터로 채울 수 있습니다. 데이터 카탈로그 사용에 대한 자세한 내용은 Skill Designer Guide의 Using data catalogs 섹션을 참조하십시오. 문서를 Classify By Company 활동으로 처리하면, 연결된 데이터 카탈로그에서 특정 회사 데이터가 조회됩니다. 그 결과 고유한 회사 식별자가 반환되며, 이 값은 스킬의 해당 field에 기록됩니다. 그런 다음 이 회사 식별자를 사용하여 회사별 문서 처리 알고리즘을 설정합니다. 회사 식별자는 Classify By Company 활동이 동작하는 데 반드시 필요한 유일한 field이지만, 데이터 카탈로그에 저장된 회사 정보를 활용해 더 많은 field를 채워 두면 해당 field에 대해 별도의 추출 활동을 추가로 설정하지 않아도 됩니다. 이를 위해 데이터 카탈로그 열을 스킬의 적절한 field에 매핑해야 합니다. Classify By Company 활동은 연결된 Vantage 서버에서 사용할 수 있는 Document Issuer Companies 유형의 데이터 카탈로그를 사용합니다. 경우에 따라, 관련 회사의 쌍(예: 상품의 공급업체와 구매자)을 문서에서 찾아야 할 수 있습니다. 이 경우 선택 사항으로 두 번째 데이터 카탈로그인 Document Receiver Companies 유형을 추가합니다. 서로 관련이 없는 두 회사를 찾아야 하는 경우에는 이 옵션을 사용하거나 두 개의 Classify By Company 활동을 추가할 수 있습니다.

회사 쌍 찾기

회사 내 각 사업 부서별로 자체 공급업체 데이터베이스를 보유하고 있을 수 있습니다. 하나의 공급업체가 여러 사업 부서와 거래하는 경우, 서로 다른 ID를 가진 여러 레코드가 생성됩니다. 이때는 해당 사업 부서에 대응하는 정확한 공급업체 레코드를 찾아야 합니다. 이를 위해 Document Issuer Companies 데이터 카탈로그에서 Company Correlation ID 열을 채워 넣습니다. 그러면 검색 시 문서 발행자의 correlation ID가 문서 수신자 ID와 일치하는 회사 쌍을 찾게 됩니다. 일부 correlation ID가 비어 있는 경우, correlation ID가 일치하는 쌍이 우선적으로 선택됩니다. 회사 쌍을 검색할 때는 공급업체와 사업 부서 간의 상관관계를 기반으로 가설이 생성됩니다. Classify By Company activity는 문서 이미지의 field 값과 가장 신뢰도 있게 일치하는 문서 수신자 회사 레코드 5개를 선택합니다. 그런 다음 각 레코드에 대해 Company Correlation ID가 Receiver Company ID와 동일한 문서 발행자 회사 레코드 5개를 선택합니다. 데이터 카탈로그에 Company Correlation ID가 Receiver Company ID와 동일한 레코드가 없는 경우, Company Correlation ID가 비어 있는 레코드가 대신 선택됩니다.
중요! 유효한 쌍을 찾으려면 모든 레코드에 올바른 Company Correlation ID를 입력해야 합니다.
그 결과, 가장 잘 일치하는 발행자–수신자 쌍이 선택됩니다. 회사 검출에 대한 자세한 내용은 회사 검출 방식을 참조하세요. 문서 발행자 회사가 모든 문서 수신자와 거래할 수 있는 경우에는 Document Issuer Companies 데이터 카탈로그에서 Company Correlation ID 열을 채울 필요가 없으며, 검색에서는 가능한 모든 회사 쌍을 고려합니다.

데이터 카탈로그 유형

문서 발행 회사 데이터 카탈로그

NameDescription
Issuer Company ID문서 발행자를 탐지하여 얻은 값입니다. 외부 정보 시스템에서 문서 발행 회사를 식별할 때 사용됩니다.

참고: 회사의 모든 사업 부문이 동일한 고객 데이터베이스를 사용하는 경우, 이는 데이터 카탈로그 항목의 고유 식별자입니다. 그렇지 않은 경우, 데이터 카탈로그의 항목은 Issuer Company IDCompany Correlation ID의 조합으로 고유하게 식별됩니다.
Company Correlation ID회사 사업 부문의 식별자입니다.

참고: 회사의 사업 부문들이 서로 다른 고객 데이터베이스를 사용하는 경우, 데이터 카탈로그 항목의 고유 키는 Issuer Company IDCompany Correlation ID의 조합이 되므로 이 데이터 카탈로그 열을 반드시 채워야 합니다. 자세한 내용은 회사 쌍 찾기를 참조하십시오.
Tax ID이 열은 고유 회사 식별자 검색에 사용할 수 있습니다.
National Tax ID이 열은 고유 회사 식별자 검색에 사용할 수 있습니다.
IBAN이 열은 고유 회사 식별자 검색에 사용할 수 있습니다.
Name이 열은 회사 이름 및 주소 검색에 사용할 수 있습니다.
Postal Code이 열은 회사 이름 및 주소 검색에 사용할 수 있습니다.
Street이 열은 회사 이름 및 주소 검색에 사용할 수 있습니다.
City이 열은 회사 이름 및 주소 검색에 사용할 수 있습니다.
State or Province이 열은 회사 식별 과정에서 사용되지 않습니다. 문서 field를 채우는 데만 사용할 수 있습니다.
Country이 열은 회사 식별 과정에서 사용되지 않습니다. 문서 field를 채우는 데만 사용할 수 있습니다.
Bank Account이 열은 회사 식별 과정에서 사용되지 않습니다. 문서 field를 채우는 데만 사용할 수 있습니다.
Bank Code이 열은 회사 식별 과정에서 사용되지 않습니다. 문서 field를 채우는 데만 사용할 수 있습니다.

문서 수신 회사 데이터 카탈로그

NameDescription
Receiver Company ID문서 수신자를 인식하여 얻습니다. 외부 정보 시스템에서 문서 수신자를 식별합니다. 데이터 카탈로그에서 항목의 고유 키입니다.
Tax ID이 열은 회사의 고유 식별자(세금 식별번호 등)를 검색하는 데 사용할 수 있습니다.
Name이 열은 회사 이름과 주소를 검색하는 데 사용할 수 있습니다.
Postal Code이 열은 회사 이름과 주소를 검색하는 데 사용할 수 있습니다.
Street이 열은 회사 이름과 주소를 검색하는 데 사용할 수 있습니다.
City이 열은 회사 이름과 주소를 검색하는 데 사용할 수 있습니다.
State or Province이 열은 회사 식별 과정에서는 사용되지 않습니다. 문서 field를 채우는 데에만 사용됩니다.
Country이 열은 회사 식별 과정에서는 사용되지 않습니다. 문서 field를 채우는 데에만 사용됩니다.