일반적인 단락 예시 이미지
일반적인 단락 예시 이미지

사용 사례
- 문서에서 추출하려는 개체명이 항상 같은 단락에 위치하는 것이 확실한 경우. 예를 들어, 추출해야 하는 조직(Organization) 이름과 주소가 각 계약서의 첫 번째 단락에 위치해 있다는 것을 알고 있다면, Segmentation 활동을 사용해 첫 번째 단락을 추출한 다음, 이 단락에서 Named Entities (NER) 활동을 사용하여 회사 이름과 주소를 추출할 수 있습니다. 이 방법은 전체 문서에서 개체명을 추출하는 것보다 더 신뢰성이 높은데, 개체가 추출되는 특정 영역을 제어할 수 있기 때문입니다.
- 단락 안의 모든 내용이 중요해 단락 전체를 추출해야 하는 경우. 예를 들어, 계약서의 지급 조건이 포함된 단락이 이에 해당합니다.
작동 방식
- 변동성이 높은 문서의 경우 최소 100개의 샘플 문서가 필요합니다.
- 변동성이 낮은 문서의 경우 최소 20개의 샘플 문서가 필요합니다.
