Deep Learning 액티비티 설정

Deep Learning 액티비티를 학습용으로 별도의 문서 집합에 대해 수행할 수 있습니다. 그러려면 스킬 이름 옆에 있는 드롭다운 목록에서 Deep Learning 액티비티를 선택합니다. 그런 다음 Upload 버튼 왼쪽의 드롭다운 목록에서 필요한 문서 집합을 선택하거나, 새로 만들려면 **Create Set…**을 클릭합니다. 이 탭에서는 문서에 설명된 대로 문서를 업로드, 삭제 및 회전할 수 있습니다.

1단계. Activity 추가

Activities 탭에서 반정형 문서를 처리하기 위한 Deep Learning Activity를 문서 처리 흐름에 추가합니다.

2단계. field 선택

Activity Properties 창에서 이 activity를 사용해 학습할 field를 선택합니다. 다음 중 하나를 선택할 수 있습니다.

중첩 수준과 관계없이 Text 타입의 field를 최대 50개까지
최대 32개 열로 구성된 테이블 1개

더 많은 field를 학습해야 하는 경우 Deep Learning activity를 추가로 생성하고 이를 사용해 추가 field를 선택할 수 있습니다. 예를 들어, 여러 개의 text field와 테이블을 학습해야 한다면 두 개의 Deep Learning activity를 생성합니다. 다음과 같은 field는 학습할 수 없습니다.

Text 이외 타입의 field
다중 항목 그룹 안에 중첩된 다중 항목 그룹, 테이블 또는 다중 항목 text field
열이 32개를 초과하는 테이블

이러한 field에 대한 추출은 다른 activity(예: Extraction Rules activity)를 사용하여 구성해야 합니다.

3단계: 문서에 레이블 지정하기

Activity Editor를 클릭하고 Fields 탭으로 이동하여 문서에 레이블을 지정합니다. Activity Editor에서의 레이블 지정 절차는 일반적인 문서 레이블링 절차와 동일합니다. 다음 지침을 사용하여 학습용 문서 세트의 크기를 결정합니다.

학습 세트에 최소 10개의 문서만 포함되어 있는 경우에도 딥 러닝 학습을 시작할 수 있지만, 더 높은 정확도를 위해 추가 문서를 업로드하는 것이 좋습니다.
학습 세트에 10개의 문서만 있는 경우에도 모델 학습을 시작할 수 있습니다. 그러나 Advanced Designer에서는 최적의 학습 결과를 위해 500개를 초과하는 레이블링된 문서를 추가할 것을 권장하는 경고가 표시됩니다.
학습 세트에 문서가 500개에서 10,000개 사이인 경우, 해당 Activity의 학습을 즉시 시작할 수 있습니다. 이는 학습 세트에 권장되는 문서 수입니다.
학습 세트에 문서가 10,000개를 초과하는 경우, Advanced Designer에서 Skill이 불안정해질 수 있다는 경고가 표시됩니다.

4단계. Activity 학습 진행

문서를 업로드하고 라벨링을 마쳤다면 Train Activity를 클릭하세요.

단계 5. 학습 진행 상황 모니터링

학습 진행 상황을 평가하려면 Results 탭으로 이동합니다. 필요에 따라 학습 기간을 조정하거나 학습을 중지합니다. 자세한 내용은 활동 학습 모니터링 및 조정을 참조하세요.

학습 후 단계

activity 학습이 완료되면 activity 테스트가 자동으로 시작됩니다. 학습을 중지하면 activity 테스트를 수동으로 시작하라는 메시지가 표시됩니다. 테스트가 완료되면 Results 탭의 Activity Test Results 섹션에서 field 추출 결과를 분석합니다. 이 activity에 대한 통계는 Results 탭에 표시되는 해당 Skill의 일반 통계와 동일합니다. field 추출 품질이 만족스럽지 않다면 다음과 같은 옵션이 있습니다.

학습 세트에 더 많은 문서를 추가하고 학습 프로세스를 재개합니다. 지금까지 얻은 학습 결과는 유지되며, 신경망은 업데이트된 문서 세트를 사용해 추가로 학습됩니다.
라벨링을 조정한 후 학습을 다시 시작합니다. 지금까지 얻은 학습 결과는 폐기되며, 신경망은 처음부터 다시 학습됩니다.
Deep Learning activity의 출력에 대한 조건을 설정할 수 있도록 Extraction Rules activity를 포함하는 Hypothesis Filtering 컨테이너를 생성합니다.

이 activity는 라벨링이 확정된 문서만 사용하여 학습 및 테스트할 수 있습니다. 문서의 참조 라벨링이 예측 라벨링을 기반으로 자동 생성되었고, 문서 컨텍스트 메뉴에서 해당 옵션을 사용해 예측 라벨링을 참조로 복사하지 않은 경우, 해당 문서는 라벨링이 미확정 상태입니다. 각 문서의 라벨링 상태는 Documents 탭에서 확인할 수 있습니다. 문서에 대한 라벨링을 확정하려면 Fields 탭에서 해당 문서를 검토해야 합니다.

Advanced Designer v. 2.3.1부터 Deep Learning activity에 대한 field 제한이 변경되었습니다. Skill에서 50개를 초과하는 field를 추출하는 학습된 Deep Learning activity를 사용하는 경우, 해당 Skill로 계속해서 문서를 처리할 수 있습니다. 그러나 이러한 Skill을 편집을 위해 열면, 기존 Deep Learning activity는 여러 개의 Deep Learning activity로 분할되며, 다시 학습해야 할 수도 있습니다. 또한 문서 처리 워크플로에서 이러한 activity의 경로를 다시 구성해야 합니다.

Advanced Designer

​1단계. Activity 추가

​2단계. field 선택

​3단계: 문서에 레이블 지정하기

​4단계. Activity 학습 진행

​단계 5. 학습 진행 상황 모니터링