- Activities 탭에서 문서 처리 흐름에 Segmentation activity를 추가합니다. Segmentation activity는 텍스트 세그먼트에서 field를 추출하는 activity보다 먼저 배치되어야 합니다.
- Activity Properties 창에서 추출할 세그먼트에 해당하는 모든 field를 선택합니다.
Note: Text 유형이면서 데이터 형식이 Text로 설정된 field만 지원됩니다.
- Activity Editor를 클릭합니다. 필요한 경우 Fields 탭에서 문서 라벨링을 추가로 수정합니다.
- Train Activity를 클릭합니다. 학습은 Fast 모드 또는 Thorough 모드에서 수행할 수 있습니다.
- 기본적으로 Fast 모드가 선택됩니다. 이 모드는 문서 세트가 작아도 동작하며 activity를 빠르게 학습합니다.
- Fast 모드의 결과가 만족스럽지 않다면, Deep Learning 모델을 학습하는 Thorough 모드로 전환하는 것을 고려하십시오. 이 모드는 학습 세트에 더 많은 문서를 필요로 하고 학습에 더 오래 걸리지만, 다양한 문서에 대해 더 나은 성능을 발휘할 수 있습니다. 문서 세트에는 최소 50개의 라벨링된 문서가 포함되어야 하지만, 최소 150개의 라벨링된 문서를 사용하는 것을 권장합니다. Thorough 모드로 전환하려면 Train Activity 버튼 옆의 드롭다운 메뉴를 사용합니다.
- 두 모드를 모두 테스트해 보고 문서에 가장 적합한 모드를 선택할 수 있습니다.
Note: Thorough 모드는 영어 문서에서만 동작합니다.
- activity 학습이 완료되면 activity 테스트가 자동으로 시작됩니다. 테스트가 완료되면 Results 탭으로 이동하여 activity의 field 추출 결과를 분석합니다. Results 탭에 표시되는 통계는 스킬의 Results 탭에 표시되는 일반 통계와 동일합니다. 필요한 경우 라벨링을 수정한 후 activity를 다시 학습하십시오.
Note: activity는 라벨링이 확인된 문서만 사용하여 학습 및 테스트할 수 있습니다. 예측 라벨링을 기준으로 참조 라벨링이 자동 생성된 경우, 문서 컨텍스트 메뉴에서 해당 옵션을 사용해 예측 라벨링을 참조로 복사하지 않는 한 문서의 라벨링 상태는 확인되지 않은 상태로 유지됩니다. 각 문서의 라벨링 상태는 Documents 탭에서 확인할 수 있습니다. 문서의 라벨링을 확인하려면 Fields 탭에서 해당 문서를 검토해야 합니다.지원 언어: 영어, 러시아어, 독일어, 프랑스어, 스페인어, 이탈리아어, 포르투갈어(표준), 일본어, 네덜란드어.
