메인 콘텐츠로 건너뛰기
다음 방법 중 하나로 텍스트 field를 추가할 수 있습니다.
  • 문서 이미지에서 field 값(마우스를 올리면 초록색으로 강조 표시됨)을 클릭하거나 field 값 주변에 사각형 영역을 지정하여 field 영역을 설정합니다. 그러면 새 field가 데이터 폼에 나타납니다. 데이터 폼에서 해당 field를 더블 클릭하거나 field 속성에서 클릭하여 field 이름을 수정할 수 있습니다. 이름 전체를 선택하려면 세 번 클릭합니다. field 속성을 열려면 필드 옵션 버튼을 클릭합니다.
  • 도구 모음에서 필드 추가를 클릭한 다음 이미지에서 field 영역을 지정하여 데이터 폼에 새 field를 추가합니다. 그러면 선택한 영역 안에서 감지된 데이터가 데이터 폼에서 해당 field 값으로 지정됩니다.
또한 데이터 폼에서 해당 field를 선택한 다음 문서 이미지에서 위치를 클릭하여, 기존 field에 새 텍스트 field 영역을 추가할 수도 있습니다. 하나의 field에 여러 단어가 포함되어야 하는 경우 전체 field 영역을 지정하여 여러 단어를 선택합니다.

여러 영역이 있는 텍스트 field 추가

일부 텍스트 field는 다음과 같은 이유로 하나의 문서에서 여러 영역이 필요할 수 있습니다.
  • 일부 field 값은 한 줄의 텍스트에서 시작해 다른 줄에서 끝날 수 있습니다.
  • 일부 field 값은 한 페이지에서 시작해 다른 페이지에서 끝날 수 있습니다.
여러 영역이 있는 텍스트 field를 추가하려면 다음을 수행합니다.
  • 위에서 설명한 방법을 사용해 field를 추가합니다.
  • Shift 키를 누른 상태에서 추가된 field에 대해 다른 영역을 선택합니다.
텍스트 field의 영역은 다음과 같이 지정할 수도 있습니다.
  • 서로 다른 페이지에서
  • field의 다른 영역 내부에서(이 경우 내부 영역은 더 어두운 색으로 표시되며, 포커스가 있으면 노란색으로 강조 표시됩니다).

텍스트 field의 일반 속성

  • Field name. 특정 Skill 내에서 field의 고유한 이름입니다. field name에는 마침표, 쉼표, 슬래시, 콜론, 별표, 물음표, 따옴표, 작은따옴표, “보다 작음” 기호, “보다 큼” 기호, 세로 막대와 같은 특수 문자를 포함할 수 없습니다. field name의 최대 길이는 90자입니다.
  • Data type. field가 포함하는 데이터의 유형입니다. 이는 인식 정확도에 영향을 미치는 매우 중요한 텍스트 field 매개 변수입니다. 각 데이터 유형에는 field 값에 대한 고유한 제한 사항이 있어, 문자에 대해 가능한 값을 좁혀 주어 데이터 추출을 더 정확하게 만듭니다.
Data typeDescription
Text라틴 및 키릴 문자, 숫자, 상형문자, 특수 문자를 포함할 수 있습니다.
Date모든 형식의 날짜와 시간입니다. 다음 문자를 구분 기호로 사용할 수 있습니다: 점 (.), 공백 ( ), 하이픈 (-), 백슬래시 (), 슬래시 (/).
Number숫자, 소수점 구분 기호, 퍼센트 문자(%)를 포함할 수 있습니다. 다음 문자를 소수점 구분 기호로 사용할 수 있습니다: 점 (.), 쉼표 (,), 하이픈 (-), 등호 (=), 공백 ( ). 다음 문자를 천 단위 구분 기호로 사용할 수 있습니다: 점 (.), 쉼표 (,), 작은따옴표 (’), 공백 ( ).
Money숫자 값과 통화 기호를 모두 포함합니다. 통화 기호는 금액 앞이나 뒤에 올 수 있습니다.
예: 소문자 “l”(L), 대문자 “I”(i), 숫자 “1”은 서로 비슷하게 보일 수 있습니다. Number 또는 Currency Amount field에서 이와 비슷하게 보이는 문자가 감지되면, 해당 유형의 field에는 문자를 포함할 수 없으므로 “1”로 인식됩니다.
  • Allow multiple items. field가 반복되는지 여부를 지정합니다. 반복 field의 인스턴스는 동일한 유형의 여러 객체를 참조할 수 있습니다. 예를 들어 자녀 이름이나 계좌 번호 등이 이에 해당합니다.
  • Required field. field 값을 비워 둘 수 없음을 지정합니다. 이 속성을 활성화하면 페이지에 유효성 검사 규칙이 추가됩니다. 추출 후 field가 비어 있으면, 문서는 오류와 함께 수동 검토로 전송됩니다.
  • Key field. field 값이 문서를 검색하는 데 사용되는지 여부를 지정합니다.
  • Dimension field. field 값이 Skill Monitor에서 Skill 트랜잭션에 대한 세부 정보를 가져오는 데 사용되는지 여부를 지정합니다.

텍스트 모양

이 속성 그룹은 field에 포함될 것으로 예상되는 문자들의 표시 형태를 정의합니다.
  • 텍스트 원본. field에 인쇄 문자만 허용할지, 손글씨 문자만 허용할지, 또는 둘 다 허용할지를 지정합니다. 문서에서 사각형 영역을 지정해 field를 추가하는 경우, 이 속성 값은 해당 영역에서 감지된 문자 유형에 따라 설정됩니다. Add Field를 클릭하여 field를 추가하는 경우, 이 속성 값은 기본적으로 Printed로 설정됩니다.
손글씨 텍스트 인식이 지원되는 모든 언어 목록은 여기에서 확인할 수 있습니다.
참고: 새 Document skill에서는 기본적으로 손글씨 인식이 활성화되어 있습니다. 이를 비활성화하거나 다시 활성화하려면, skill 이름 오른쪽의 skill 설정 아이콘을 클릭한 다음 Languages 탭으로 이동하여 Text Appearance 섹션에서 Handwritten 옵션을 선택하십시오.
  • field 배경 제거. 이 옵션은 field에 테두리, 개별 문자용 상자, 또는 플레이스홀더 텍스트가 있는 경우 인식 정확도를 향상시키는 데 사용할 수 있습니다. 이 옵션을 활성화하면, 배경 인식을 위한 템플릿으로 사용할 빈 양식 문서를 업로드하고, 그 빈 양식에서 해당 field를 지정해야 합니다. 빈 양식 문서는 Document Set에 표시되며 아이콘으로 구분됩니다.
  • 특수 글꼴. field에 특정 글꼴로 입력된 텍스트가 포함될 것으로 예상되는 경우, 이 옵션을 사용하여 글꼴 종류를 선택하면 인식 정확도를 높일 수 있습니다. 여러 글꼴을 함께 선택할 수도 있습니다.

지원되는 폰트

FontDescriptionFont sample
Fax일반적으로 팩스 기기에서 사용되는 폰트입니다.Fax 폰트
Gothic고딕체로 인쇄된 텍스트에 사용되는 폰트입니다.Gothic 폰트
Index우편번호(Zip 코드) 스타일로 쓰인 숫자만 포함하는 특수 문자 집합입니다.Index 폰트
Matrix printer도트 매트릭스 프린터로 인쇄된 텍스트에 사용되는 폰트입니다.Matrix 폰트
MICR CMC-7특수한 MICR 바코드 폰트(CMC-7)입니다.CMC-7 폰트
MICR E-13B자기 잉크로 인쇄되는 숫자 전용 문자 집합입니다. MICR(Magnetic Ink Character Recognition) 문자는 개인 수표를 포함한 다양한 문서에서 볼 수 있습니다.E-13B 폰트
OCR-AOptical Character Recognition (OCR)을 위해 설계된 고정폭 폰트입니다. 주로 은행, 신용카드 회사 및 유사한 업계에서 널리 사용됩니다.OCR-A 폰트
OCR-BOptical Character Recognition을 위해 설계된 폰트입니다.OCR-B 폰트
Receipt인식기는 영수증에 일반적으로 사용되는, 대체로 고정폭 또는 일반 폰트로 인쇄된 저품질 텍스트가 올 것으로 예상합니다.Receipt 폰트
Typewriter타자기로 작성된 텍스트에 사용되는 폰트입니다.Typewriter 폰트

텍스트 field의 추가 속성

추가 속성은 해당 field에 지정된 데이터 유형에 따라 달라집니다.

Text

Value 설정 그룹:
  • Maximum length. field에 허용되는 최대 문자 수입니다. 추출된 값의 문자 수가 이 길이를 초과하면 오류 메시지가 표시됩니다. 프로세스에 수동 검토 단계가 있는 경우 문서는 수동 검토로 전송됩니다.
  • Regular expression. 이 옵션을 사용하면 정규식(즉, field 값 구조에 대한 형식적 설명)을 추가할 수 있습니다. 정규식을 사용해 설정된 field에는 데이터 폼에 지정된 대로 문자, 숫자 및 기타 문자를 포함할 수 있습니다.
정규식을 사용하면 텍스트에서 패턴을 찾아 유효한 문자 집합을 제한함으로써 추출 정확도를 높일 수 있습니다. 예를 들어, 텍스트 field에 숫자만 포함되어야 하는 경우, field의 구조가 숫자만 포함하도록 설명하는 정규식을 지정할 수 있습니다. 이 경우 field를 인식할 때 프로그램은 각 문자를 숫자로 인식하려고 시도합니다. 또한 특정 전화번호 형식에 대한 정규식(예제 1)을 지정하거나, field에 2개의 단어가 포함되어 있고 그 중 하나가 숫자인지(예: 50 lbs, 예제 2) 검증할 수 있습니다: 예제 1 (1-(234)-567-8900 또는 2 (987) 654 3211과 같은 전화번호의 경우)
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
예시 2 (50lb/50lbs/50Lb/50Lbs/50 lb/50 lbs 등 무게값의 경우)
/^[\d]*(\s)?(L|l)b(s)?$/
참고: 정규식은 PDF 문서의 텍스트 인식 결과에 영향을 주지 않습니다.

Date

Value may include 설정 그룹:
  • Time. Date field에 시간이 함께 포함될 수 있는 경우 이 옵션을 선택합니다. 시간이 허용되지 않으면 인식 중에 추출되지 않습니다.
  • Day of week. 이 옵션을 사용하면 Date field에서 요일을 지정할 수 있습니다. 요일 값이 허용되지 않으면 인식 중에 추출되지 않습니다.
  • Month by name. 이 옵션을 사용하면 월을 문자(단어)로 지정할 수 있습니다.
Acceptable order of components 설정 그룹에서는 다음 옵션 중에서 Day-Month-Year, Month-Day-Year, Year-Month-Day 형식으로 적절한 날짜 형식을 선택할 수 있습니다. 여러 서로 다른 형식을 한 번에 지정할 수도 있습니다. 감지된 날짜 형식이 지정한 날짜 형식과 일치하지 않으면, 문서는 오류와 함께 수동 검토로 전송됩니다. Acceptable date 설정 그룹에서는 유효한 날짜 범위를 지정할 수 있습니다. 문서가 처리된 날짜를 기준으로, 그 이전과 이후의 개월 수를 선택하여 유효한 범위를 지정할 수 있습니다. 개월 수는 정수로 지정해야 합니다. 지정된 날짜가 설정한 범위 내에 있는지 확인하는 규칙이 사용됩니다. 범위를 벗어난 경우, 규칙이 오류를 표시하고 문서는 수동 검토로 전송됩니다.

Number

Value 설정 그룹에서는 감지된 값이 어떤 종류의 숫자인지(정수 또는 소수)와 이 field 에서 인식될 수 있는 숫자 형식을 지정할 수 있습니다. 이 field 의 값이 지정된 요구 사항을 충족하지 못하면 문서는 수동 검토로 보내집니다.
  • Integers only 는 값이 정수만 될 수 있음을 지정합니다. 이 옵션이 활성화된 상태에서 field 에서 구분 기호가 포함된 숫자가 감지되면, 해당 구분 기호는 천 단위 구분 기호로 처리됩니다.
  • Fractional part may contain more than two digits. 추출된 값의 소수 부분이 두 자리보다 많을 것으로 예상되는 경우 이 옵션을 활성화합니다. 다음 문자를 소수점 구분 기호로 사용할 수 있습니다: 점(.), 쉼표(,), 하이픈(-), 등호(=), 공백( ).
  • May have negative values. 이 옵션을 사용하면 추출된 값이 음수가 될 수 있습니다. 음수 값은 마이너스 기호 또는 괄호로 표시될 수 있습니다.
  • May include ’%’ symbol. 이 옵션을 사용하면 추출된 값 앞이나 뒤에 퍼센트 문자(%)를 포함할 수 있습니다.
Number must be within interval 설정 그룹에서는 값이 유효하려면 반드시 속해야 하는 구간을 지정할 수 있습니다. 구간 범위는 최댓값과 최솟값을 지정하여 설정합니다. 이러한 값은 정수와 소수 모두 사용할 수 있으며, 음수 값도 지정할 수 있습니다. 그런 다음 규칙을 사용하여 값이 지정된 범위 내에 있는지 확인합니다. 범위를 벗어나면 규칙에서 오류를 표시하고 문서를 수동 검토로 보냅니다.

Money

Money 속성은 Number 속성과 동일하지만, Money field에는 퍼센트 기호(%)를 포함할 수 없다는 점만 예외입니다.

함께 보기