분류기를 학습하는 동안 분류 결과에 대한 통계가 수집됩니다. 이러한 통계를 분석하면 분류기의 품질을 어떻게 향상할 수 있는지 파악하는 데 도움이 됩니다.분류 통계는 Classification Skill Designer의 Result 탭에서 확인할 수 있으며, 분류기를 다시 학습할 때마다 자동으로 업데이트됩니다.이 탭에는 다음과 같은 정보가 포함됩니다.
전체 분류 정확도: 데이터 세트에 포함된 전체 문서 수 대비 올바르게 분류된 문서의 비율입니다.
각 클래스에 대한 분류 정확도: 특정 클래스에 대해 올바르게 분류된 문서의 비율입니다.
각 클래스별 올바르게 분류된 문서 수와 잘못 분류된 문서 수.
분류기를 마지막으로 학습한 일시.
결과 테이블에는 비어 있지 않은 모든 사용자 클래스(No class 제외)가 포함됩니다. 테이블의 클래스는 먼저 분류기 정확도(가장 낮은 것부터 높은 것까지), 그다음 클래스에 속한 문서 수, 마지막으로 이름의 알파벳순으로 정렬됩니다. 테이블의 모든 행을 한 번에 화면에 표시할 수 없는 경우 스크롤바가 표시됩니다.결과 테이블에서 행을 클릭하면 Documents 탭의 해당 클래스로 이동합니다. Documents 탭에서 클래스 이름을 수정하면 Result 탭에서도 함께 업데이트됩니다. 해당 분류기를 학습한 후 클래스를 삭제하면 이 클래스의 이름은 Result 탭에서 회색으로 표시됩니다. 이 클래스를 포함하는 행은 분류기를 다시 학습할 때에만 결과 테이블에서 제거됩니다.
이 경우 누락된 문서를 학습 세트에 추가하여 분류기 품질을 향상시킬 수 있습니다. 각 클래스마다 100개에서 1000개 사이의 문서를 업로드할 것을 권장합니다. 또한 각 클래스별로 가장 일반적인 문서 변형에 대한 샘플 문서를 문서 세트에 포함하되, 서로 대략 1:1 비율이 되도록 할 것을 제안합니다.새로운 문서를 학습 세트에 추가한 후 각 문서에 클래스를 할당하고 분류기를 재학습하십시오.
분류 오류는 클래스들의 Parameter가 서로 크게 다르지 않을 때도 발생할 수 있습니다. 이 경우 클래스 개수를 검토하고, 필요하다면 혼동되는 클래스들을 하나의 클래스로 통합해야 합니다.예를 들어, 10,000 USD 미만의 인보이스용 클래스와 10,000 USD 초과 인보이스용 클래스가 있을 때, 두 클래스의 유의미한 차이가 지불해야 할 합계뿐이라면 서로 혼동될 수 있습니다.이 경우 이러한 클래스들은 분류 스킬에서 하나의 클래스로 통합해야 하며, 인보이스는 필요하다면 후속 단계에서만 서로 구분해야 합니다(예: 지불해야 할 합계가 이미 인보이스에서 추출된 후).