반구조화 문서는 일반적으로 동일한 정보를 담고 있지만, 문서마다 field의 위치, 크기, 개수가 달라질 수 있어 데이터 추출이 더 어렵습니다. Vantage는 필요한 데이터를 찾고 추출하기 위해, 특정 요소와 field 사이에 존재하는 공간적 및 논리적 관계를 활용합니다. 반구조화 문서의 예로는 송장, 지급 지시서, 선하증권 등이 있습니다.문서 세트가 구조화 또는 반구조화 문서로 구성되어 있다면, 구조화 문서 처리 및 반구조화 문서 처리 섹션의 시나리오를 참고하십시오.
비정형 문서는 추출해야 할 데이터가 포함된 자유 형식의 텍스트로, 문단과 문장 단위로 구성됩니다. 일부 비정형 문서에서는 하나의 field가 다음 페이지로 이어질 수 있습니다. 비정형 문서의 예로는 계약서, 이메일, 연구 논문 등이 있습니다.문서 세트가 비정형 문서로 구성되어 있다면, 비정형 문서 처리 섹션에 소개된 시나리오를 참조하세요.