혼합 문서 집합에서 데이터 추출하기 (반정형 및 비정형)

Document Skill 생성 단계
- Advanced Designer를 엽니다. 시작 페이지에서 Create Document Skill을 클릭하여 새 스킬을 생성합니다.
- 열린 Documents 탭에서 스킬 설정에 사용할 문서를 업로드합니다. 분류기 설정에 충분한 문서 세트를 확보하려면 각 변형(variant)마다 대략 동일한 수의 문서를 추가합니다.
- 이미지를 업로드한 후 Fields 탭으로 이동하여, 스킬로 추출할 field들을 생성·설정하여 스킬의 field 구조를 구성합니다. Reference 섹션에서 문서에 레이블을 지정합니다.
- Activities 탭으로 이동하여 문서 처리 흐름에 Classify activity를 추가합니다.
- Activity Editor를 열고 Classify activity를 구성합니다. 이를 위해 각 변형에 해당하는 클래스를 생성하고, 이 클래스들을 문서에 할당한 후 activity를 학습시킵니다.
- 다시 Activities 탭으로 돌아가 IF activity를 추가하고, 각 문서 변형을 처리할 개별 activity를 추가하여 처리 흐름에 조건 분기를 설정합니다.
- 생성한 activity들을 구성하고 학습시킵니다.
- Test Skill Using Selected Documents를 클릭하여 스킬을 테스트하고, 결과를 분석합니다.
- 테스트 결과가 충분히 만족스러우면 스킬을 게시합니다.
반정형 문서의 표 셀에서 텍스트 추출

Document Skill 생성 단계
- Advanced Designer를 엽니다. 시작 페이지에서 Create Document Skill을 클릭해 새 스킬을 생성합니다.
- 자동으로 열리는 Documents 탭에서 스킬 설정에 사용할 문서를 업로드합니다.
- 이미지를 업로드한 후 Fields 탭으로 이동하여, 스킬로 추출할 field들을 생성·설정해 스킬의 field 구조를 정의합니다. Reference 섹션에서 문서에 레이블을 지정합니다.
- Activities 탭으로 이동하여 Fast Learning activity를 생성하고, 이 activity에서 추출할 fields를 지정합니다.
- Activity Editor를 열어 Fast Learning activity를 설정하고 학습시킵니다.
- 다시 Activities 탭으로 돌아가 Named Entities (NER) activity를 생성하고, 소스 field와 추출된 개체명을 저장할 fields를 지정합니다. 개체명을 선택한 fields에 매핑합니다.
- 주소를 포함하는 field가 있고 해당 주소를 구성 요소로 분리하려는 경우, Address Parsing activity를 생성하고 소스 field와 추출된 주소 구성 요소를 저장할 fields를 지정합니다. 주소 구성 요소를 선택한 fields에 매핑합니다.
- Test Skill Using Selected Documents를 클릭해 스킬을 테스트하고, 얻은 결과를 분석합니다.
- 테스트 결과가 충분히 만족스러우면 스킬을 게시합니다.

Document Skill 생성 단계
- Advanced Designer를 엽니다. 시작 페이지에서 Create Document Skill을 클릭하여 새 Skill을 생성합니다.
- 자동으로 열리는 Documents 탭에서 Skill 설정에 사용할 문서를 업로드합니다.
- 이미지를 업로드한 후 Fields 탭으로 이동하여 Skill로 추출할 field들을 생성 및 설정하여 Skill의 field 구조를 정의합니다. Reference 섹션에서 문서에 레이블을 지정합니다.
- Activities 탭으로 이동하여 Segmentation activity를 만들고, 일반 텍스트 단락을 저장하는 데 사용할 fields를 지정합니다.
- Activity Editor를 열어 Segmentation activity를 설정하고 학습시킵니다.
- 다시 Activities 탭으로 돌아가 Extraction Rules activity를 생성하고, 문서의 반정형 영역(fragment)에서 추출한 데이터를 저장하는 데 사용할 fields를 지정합니다.
- Activity Editor를 열어 Extraction Rules activity를 설정하고 테스트합니다.
- Test Skill Using Selected Documents를 클릭하여 Skill을 테스트하고 결과를 분석합니다.
- 테스트 결과가 충분히 만족스러우면 Skill을 게시합니다.
