Tip: 비정형 문서 라벨링에 대한 자세한 내용은 Advanced Designer Guide를 참고하십시오.
정형 문서
- 각 field의 영역을 정확하게 지정해야 합니다. field 값만으로는 학습에 충분하지 않습니다.
- field의 영역을 지정할 때는 값만 클릭하지 말고, 플레이스홀더 전체를 지정하십시오.
- field에 값이 없는 경우, 비어 있는 플레이스홀더를 지정하십시오.
- field가 여러 부분으로 구성된 경우, Shift 키를 누른 상태에서 각 부분을 추가하십시오. 모든 부분은 동일한 페이지에 있어야 합니다.
- 고정 양식에 표가 포함되어 있는 경우, 비어 있는 행을 포함하여 모든 행을 지정하십시오.
- 일부 라벨링이 이미 완료된 후 field가 추가된 경우, 이 새로운 field는 학습 세트에 있는 모든 문서에서 라벨링해야 합니다. 모든 문서를 검토하여 해당 field가 나타나는 모든 문서에서 새 field를 라벨링하십시오.
반정형 문서
- 각 field의 영역을 정확히 지정해야 합니다. field 값만으로는 학습에 충분하지 않습니다.
- field의 영역을 지정하려면 해당 field의 값(즉, 그 안에 포함된 단어나 단어들)을 클릭하면 영역이 자동으로 생성됩니다.
- field에 값이 없으면 해당 field에 대한 영역을 생성하지 마십시오.
- 단어의 일부만 영역으로 지정하지 마십시오. 프로그램은 전체 단어를 기준으로만 학습할 수 있습니다.
- field가 여러 부분으로 구성되어 있는 경우 Shift 키를 누른 상태에서 각 부분을 추가하십시오. 이때 모든 부분은 동일한 페이지에 있어야 합니다.
- 반복되는 구조가 있는 경우 먼저 문서를 분석한 후 표 또는 반복 그룹 중 하나를 만드십시오. 문서에 공통 헤더가 있는 표가 있고 값 옆에 어떤 키워드도 없는 경우에는 표를 만드십시오. 데이터의 구조화 정도가 낮고 값 옆에 키워드가 있는 경우에는 Allow multiple items 옵션을 사용한 그룹을 만드십시오. 데이터가 문서마다 다르게 구성되어 있는 경우, 대부분의 문서에 가장 잘 맞는 옵션을 선택하십시오.
- 표를 라벨링할 때는 먼저 첫 번째 행을 지정한 후 Continue table from this row를 클릭하여 전체 표가 올바르게 라벨링되었는지 확인하십시오. 첫 번째 행의 셀을 지정하려면 셀을 하나씩 차례로 클릭하면, 해당 열이 자동으로 생성됩니다. 표 전체가 지정될 때까지 이 작업을 계속하십시오.
Tip: 표가 크고 문서 페이지의 모양이 서로 비슷한 경우, 유사한 페이지는 삭제하고 첫 페이지와 마지막 페이지, 그리고 그 사이의 일부 페이지만 라벨링하면 됩니다.
- 개별 field(예: 주소)든 표 셀(예: “Description”)이든, 다른 field의 영역 안에서 field를 찾도록 프로그램에 지시하지 마십시오. 큰 텍스트 조각에서 데이터를 추출해야 하는 경우에는 Advanced Designer를 사용하십시오.
- 일부 라벨링이 이미 완료된 후에 field를 추가한 경우, 이 새로운 field는 학습 세트에 포함된 모든 문서에서 라벨링되어야 합니다. 모든 문서를 검토하여 새 field가 나타나는 모든 문서에서 해당 field를 라벨링했는지 확인하십시오.
