메인 콘텐츠로 건너뛰기
분류기를 학습하는 동안 분류 결과에 대한 통계가 수집됩니다. 이러한 통계를 분석하면 분류기의 품질을 어떻게 향상할 수 있는지 파악하는 데 도움이 됩니다. 분류 통계는 Classification Skill Designer의 Result 탭에서 확인할 수 있으며, 분류기를 다시 학습할 때마다 자동으로 업데이트됩니다. Classification Skill Analysis Tabs 이 탭에는 다음과 같은 정보가 포함됩니다.
  • 전체 분류 정확도: 데이터 세트에 포함된 전체 문서 수 대비 올바르게 분류된 문서의 비율입니다.
  • 각 클래스에 대한 분류 정확도: 특정 클래스에 대해 올바르게 분류된 문서의 비율입니다.
  • 각 클래스별 올바르게 분류된 문서 수와 잘못 분류된 문서 수.
  • 분류기를 마지막으로 학습한 일시.
결과 테이블에는 비어 있지 않은 모든 사용자 클래스(No class 제외)가 포함됩니다. 테이블의 클래스는 먼저 분류기 정확도(가장 낮은 것부터 높은 것까지), 그다음 클래스에 속한 문서 수, 마지막으로 이름의 알파벳순으로 정렬됩니다. 테이블의 모든 행을 한 번에 화면에 표시할 수 없는 경우 스크롤바가 표시됩니다. 결과 테이블에서 행을 클릭하면 Documents 탭의 해당 클래스로 이동합니다. Documents 탭에서 클래스 이름을 수정하면 Result 탭에서도 함께 업데이트됩니다. 해당 분류기를 학습한 후 클래스를 삭제하면 이 클래스의 이름은 Result 탭에서 회색으로 표시됩니다. 이 클래스를 포함하는 행은 분류기를 다시 학습할 때에만 결과 테이블에서 제거됩니다.

분류 오류

대부분의 잘못된 분류는 학습 세트를 생성하는 과정에서 발생한 오류로 인해 발생합니다(예: 참조 클래스가 잘못 지정되었거나, 문서 세트에 특정 유형의 페이지 수가 충분하지 않은 경우 등).

잘못 지정된 참조 클래스

이 유형의 오류를 해결하려면, 해당 학습 세트의 문서에 올바른 클래스를 할당한 다음 다음과 같이 분류기를 다시 학습합니다:
  1. Actions 창에서 Review Prediction in Document Set을 클릭하여 Documents 탭으로 이동합니다. 또는 결과 테이블에서 해당 클래스가 표시된 행을 클릭합니다.
  2. 참조 클래스가 잘못 할당된 문서를 선택합니다.
  3. Actions 창에서 올바른 클래스 이름을 클릭합니다.
  4. 참조 클래스가 잘못 할당된 모든 문서에 대해 2번과 3번 단계를 반복합니다.
  5. Actions 창에서 Train 버튼을 클릭합니다.

문서 세트의 페이지 수 부족

분류기의 품질이 낮을 수 있는 원인은 다음과 같습니다.
  • 업로드된 문서 수가 부족함
  • 클래스 간 문서 분포가 크게 불균형함
  • 해당 클래스에서 가장 일반적인 문서 변형에 대한 샘플 수가 부족함
이 경우 누락된 문서를 학습 세트에 추가하여 분류기 품질을 향상시킬 수 있습니다. 각 클래스마다 100개에서 1000개 사이의 문서를 업로드할 것을 권장합니다. 또한 각 클래스별로 가장 일반적인 문서 변형에 대한 샘플 문서를 문서 세트에 포함하되, 서로 대략 1:1 비율이 되도록 할 것을 제안합니다. 새로운 문서를 학습 세트에 추가한 후 각 문서에 클래스를 할당하고 분류기를 재학습하십시오.

혼동되는 클래스

분류 오류는 클래스들의 Parameter가 서로 크게 다르지 않을 때도 발생할 수 있습니다. 이 경우 클래스 개수를 검토하고, 필요하다면 혼동되는 클래스들을 하나의 클래스로 통합해야 합니다. 예를 들어, 10,000 USD 미만의 인보이스용 클래스와 10,000 USD 초과 인보이스용 클래스가 있을 때, 두 클래스의 유의미한 차이가 지불해야 할 합계뿐이라면 서로 혼동될 수 있습니다. 이 경우 이러한 클래스들은 분류 스킬에서 하나의 클래스로 통합해야 하며, 인보이스는 필요하다면 후속 단계에서만 서로 구분해야 합니다(예: 지불해야 할 합계가 이미 인보이스에서 추출된 후).

함께 보기