메인 콘텐츠로 건너뛰기
데이터 카탈로그 레코드의 상세 수준과 품질은 회사 식별 정확도에 큰 영향을 미칩니다. 문서 발행자와 수신자 레코드가 문서 이미지에서 추출된 텍스트와 더 잘 일치할수록, 발행자와 수신자 회사를 더 정확하게 식별할 수 있습니다.

정확한 탐지를 위한 모범 사례

탐지 결과의 정확도를 최대한 높이려면 다음 사항을 확인하십시오.
  • 고유 회사 식별자가 입력되어 있어야 합니다. 세금 식별번호, National Tax ID, IBAN과 같은 고유값 열을 채워 두면, 이러한 값은 각 회사마다 고유하므로 올바르게 탐지될 가능성이 크게 높아집니다.
  • 중복 회사 레코드가 없어야 합니다. 중복 레코드를 제거하면 회사를 올바르게 탐지할 가능성이 높아집니다.
  • 무관한 레코드가 없어야 합니다. 데이터 카탈로그에 오래되었거나 유효하지 않은 레코드가 있으면, 서로 다른 field 값 간의 우연한 유사성 때문에 회사가 잘못 탐지될 수 있습니다.
  • 각 회사 레코드의 모든 field가 채워져 있어야 합니다. 회사에 대한 정확한 정보를 가능한 한 많이 입력하십시오. 정보가 정확할수록 회사를 올바르게 탐지할 확률이 높아집니다.

회사 식별 프로세스

회사 식별은 다음 단계로 구성됩니다: 다음 field 값은 고유한 회사 식별자로 간주됩니다.
  • 세금 식별번호
  • 국가 세금 식별번호
  • IBAN
Classify By Company 활동은 키워드와 정규식을 사용하여 위에 나열된 field 값들을 문서 이미지에서 검색합니다. 값이 하나도 지정되지 않은 경우, 이 단계는 건너뜁니다. 문서 이미지에서 감지된 세금 식별번호, 국가 세금 식별번호, IBAN 값은 데이터 카탈로그를 조회하는 데 사용됩니다. 그런 다음 데이터 카탈로그에서 반환된 세금 식별번호, 국가 세금 식별번호, IBAN 값을 이미지에서 감지된 값과 비교하여 일치 여부를 확인합니다(완전 일치 방식 사용). 일치 여부 비교를 위해 값은 다음과 같이 정규화됩니다.
  • 문자는 모두 대문자로 변환됩니다.
  • 공백과 다음 문자는 제거됩니다: ”.”, ”,”, ””, ”/”, ”****“
문서 이미지에서 감지된 전체 텍스트가 데이터 카탈로그를 조회하는 데 사용됩니다. 다음으로 데이터 카탈로그에서 반환된 Name, Street, Postal code, City 값이 이미지에서 감지된 값과 (정확 일치 방식으로) 대조됩니다.
참고: 최상의 검색 결과를 얻으려면 데이터 카탈로그의 해당 열에 값이 모두 입력되어 있는지 확인하십시오. 회사는 세금 식별번호, 국가 세금 식별번호 또는 IBAN으로 식별할 수 없는 경우가 있을 수 있으므로, 회사명과 주소 정보가 특히 중요합니다.

3단계: 가설 생성

1단계와 2단계에서 찾은 회사를 기반으로 일련의 가설이 생성됩니다. Classify By Company 액티비티는 이러한 가설을 평가하고, 문서 이미지에서 감지된 field 값과 가장 신뢰도 높게 일치하는 문서 발행 회사 5개와 문서 수신 회사 5개의 레코드를 선택합니다. 그런 다음 이 레코드들을 사용하여 25개의 쌍을 구성하며, 각 쌍은 별도의 가설로 취급됩니다. 학습된 모델이 이러한 가설을 신뢰도에 따라 평가하여, 가장 잘 일치하는 발행–수신 회사 쌍을 선택합니다.
참고: 문서 수신 회사의 수가 매우 적은 경우(예: 문서 수신 회사가 하나뿐인 경우)에도 Document Receiver Companies 데이터 카탈로그를 사용하는 것이 여전히 권장됩니다. 이렇게 하면 문서 수신 회사가 잘못 감지되어 문서 발행 회사로 인식되는 것을 방지할 수 있습니다.
Document Issuer Companies 데이터 카탈로그에서 발행 회사 ID가 수신 회사 ID에 따라 달라진다고 명시되어 있는 경우, 이 상관관계를 기반으로 가설이 생성됩니다( Looking for a pair of companies 참조).

문서 발행자 및 수취 회사 탐지 결과

문서에서 발행자 및 수취 회사를 탐지하면 다음과 같은 식별자를 얻을 수 있습니다.
  • Document Issuer Companies 데이터 카탈로그의 발행자 회사 식별자
  • Document Receiver Companies 데이터 카탈로그의 수취 회사 식별자
참고: Document Issuer Companies 데이터 카탈로그에서 발행자 회사 ID가 수취 회사 ID에 종속되도록 지정되어 있는 경우(Looking for a pair of companies 참조), 문서 발행자 탐지 결과에는 해당 수취 회사 ID에 대응하는 발행자 회사 ID가 포함됩니다.