메인 콘텐츠로 건너뛰기
Extraction Rules Activity는 비정형 문서에서 인식된 텍스트를 기반으로 동작합니다. 이 규칙들은 개체명, 키워드, 정규식을 사용하여 추출해야 하는 field에 대한 조건을 설정합니다.

사용 사례

다음과 같은 경우 이 액티비티를 문서 처리 흐름에 추가합니다:
  • Named Entities (NER) 액티비티를 사용해 동일한 유형의 객체를 여러 개 추출했고, 이제 특정 인스턴스를 찾아야 하는 경우. 예를 들어, 임대 계약서에서 여러 Organization 엔티티가 추출될 수 있습니다. Extraction Rules 액티비티를 사용하여 집주인과 세입자를 구분할 수 있습니다.
  • Deep Learning 액티비티를 사용할 만큼 충분한 문서가 없는 경우. 이 경우 Extraction Rules 액티비티를 생성하고, 키워드, 정규식 또는 기타 비즈니스 로직을 사용하여 필요한 객체를 추출할 수 있습니다.
  • 비표준 유형의 객체를 추출해야 하는 경우. 예를 들어, 날짜만이 아니라 날짜와 시간을 조합한 값을 추출하고자 할 수 있습니다.
  • 동일한 객체와 관련된 여러 field를 그룹화해야 하는 경우. 예를 들어, Extraction Rules 액티비티를 사용하여 각 사람의 이름, 생년월일, 주소를 하나로 묶을 수 있습니다. Named Entities (NER) 액티비티 역시 이름과 주소를 추출할 수 있지만, 주소를 해당 이름과 매칭할 수는 없습니다.

작동 방식

이 activity에서는 자연어 처리(NLP)를 사용하여 텍스트에서 검색 요소를 찾습니다. 검색 요소는 명명된 개체와 키워드 또는 정규식에 일치하는 단어나 구입니다. 다른 activity에서 추출된 field와 함께 검색 요소를 사용하면, field의 위치를 다른 텍스트에 대한 상대적 위치로 지정하는 추출 규칙을 구성하는 구성 요소로 활용할 수 있습니다. 추출 규칙은 UI를 통해 쉽게 생성할 수 있으며, 전용 언어를 사용하여 추가로 사용자 정의할 수 있습니다. 검색 요소는 field에 매핑할 수 있으며, 검색 요소 영역에서 인식된 텍스트는 매핑된 field를 채우는 데 사용됩니다. 자세한 내용은 Extraction Rules activity 설정을 참조하십시오.