참고: 이 Activity는 Text 타입의 field만 지원합니다.
학습 요구 사항
- 변동성이 높은 문서의 경우 최소 150개의 샘플 문서(변형 유형당 2–3개의 샘플 문서)가 필요합니다.
- 변동성이 낮은 문서의 경우 샘플 문서 1개만으로 학습을 시작할 수 있지만, 변형 유형당 최소 2–3개의 샘플 문서가 필요합니다.
별도의 문서 집합 사용
지원 언어
딥 러닝 Activity 설정
- Activities 탭에서 문서 처리 흐름에 딥 러닝 Activity를 추가합니다. 딥 러닝 Activity는 해당 딥 러닝 Activity에서 소스로 사용할 field를 추출하는 Activity 뒤에 배치해야 합니다.
- Activity Properties 창의 Field 드롭다운 목록에서, field를 추출해야 하는 비정형 텍스트 조각에 해당하는 소스 field를 선택합니다.
- 소스 field에서 추출할 fields를 선택합니다. 소스 field와 동일한 중첩 레벨에 있거나 한 레벨 아래에 있는 fields를 선택할 수 있습니다.
- Activity Editor를 클릭하고 Fields 탭으로 이동한 다음, 소스 field에서 추출해야 할 fields의 영역을 지정하여 문서를 라벨링합니다. Activity Editor에서의 라벨링 프로세스는 일반적인 문서 라벨링 프로세스와 동일하지만 한 가지 예외가 있습니다. 딥 러닝 Activity에서 추출할 fields는 소스 field의 영역 내부에 위치해야 합니다.
- NLP용 딥 러닝 Activity는 샘플 문서 1개만으로도 시작할 수 있지만, 각 variant마다 최소 2~3개의 샘플 문서가 필요합니다.
- 학습 세트에 문서가 1~150개 포함된 경우, Activity 학습을 시작할 수는 있지만, Advanced Designer에서 “We recommend adding atleast 150 documents”라는 경고가 표시됩니다.
- 학습 세트에 문서가 150~10,000개 포함된 경우, 즉시 Activity 학습을 시작할 수 있습니다. 이는 학습 세트에 포함하는 것을 권장하는 문서 수입니다.
- 학습 세트에 문서가 10,000개를 초과하여 포함된 경우, Advanced Designer에서 스킬이 불안정해질 수 있다는 경고가 표시됩니다.
- Train Activity를 클릭하여 Activity를 학습시킵니다.
- Activity 학습이 완료되면 Activity 테스트가 자동으로 시작됩니다. 테스트가 완료된 후 Results 탭으로 이동하여 해당 Activity의 field 추출 결과를 분석합니다. Results 탭에 표시되는 통계는 Results 탭에 표시되는 스킬의 일반 통계와 동일합니다. 필요한 경우 라벨링을 수정한 뒤 Activity를 다시 학습시킵니다.
