- 문서 이미지에서 field 값(마우스를 올리면 초록색으로 강조 표시됨)을 클릭하거나 field 값 주변에 사각형 영역을 지정하여 field 영역을 설정합니다. 그러면 새 field가 데이터 폼에 나타납니다. 데이터 폼에서 해당 field를 더블 클릭하거나 field 속성에서 클릭하여 field 이름을 수정할 수 있습니다. 이름 전체를 선택하려면 세 번 클릭합니다. field 속성을 열려면 필드 옵션 버튼을 클릭합니다.
- 도구 모음에서 필드 추가를 클릭한 다음 이미지에서 field 영역을 지정하여 데이터 폼에 새 field를 추가합니다. 그러면 선택한 영역 안에서 감지된 데이터가 데이터 폼에서 해당 field 값으로 지정됩니다.
여러 영역이 있는 텍스트 field 추가
- 일부 field 값은 한 줄의 텍스트에서 시작해 다른 줄에서 끝날 수 있습니다.
- 일부 field 값은 한 페이지에서 시작해 다른 페이지에서 끝날 수 있습니다.
- 위에서 설명한 방법을 사용해 field를 추가합니다.
- Shift 키를 누른 상태에서 추가된 field에 대해 다른 영역을 선택합니다.
- 서로 다른 페이지에서
- field의 다른 영역 내부에서(이 경우 내부 영역은 더 어두운 색으로 표시되며, 포커스가 있으면 노란색으로 강조 표시됩니다).
텍스트 field의 일반 속성
- Field name. 특정 Skill 내에서 field의 고유한 이름입니다. field name에는 마침표, 쉼표, 슬래시, 콜론, 별표, 물음표, 따옴표, 작은따옴표, “보다 작음” 기호, “보다 큼” 기호, 세로 막대와 같은 특수 문자를 포함할 수 없습니다. field name의 최대 길이는 90자입니다.
- Data type. field가 포함하는 데이터의 유형입니다. 이는 인식 정확도에 영향을 미치는 매우 중요한 텍스트 field 매개 변수입니다. 각 데이터 유형에는 field 값에 대한 고유한 제한 사항이 있어, 문자에 대해 가능한 값을 좁혀 주어 데이터 추출을 더 정확하게 만듭니다.
| Data type | Description |
|---|---|
| Text | 라틴 및 키릴 문자, 숫자, 상형문자, 특수 문자를 포함할 수 있습니다. |
| Date | 모든 형식의 날짜와 시간입니다. 다음 문자를 구분 기호로 사용할 수 있습니다: 점 (.), 공백 ( ), 하이픈 (-), 백슬래시 (), 슬래시 (/). |
| Number | 숫자, 소수점 구분 기호, 퍼센트 문자(%)를 포함할 수 있습니다. 다음 문자를 소수점 구분 기호로 사용할 수 있습니다: 점 (.), 쉼표 (,), 하이픈 (-), 등호 (=), 공백 ( ). 다음 문자를 천 단위 구분 기호로 사용할 수 있습니다: 점 (.), 쉼표 (,), 작은따옴표 (’), 공백 ( ). |
| Money | 숫자 값과 통화 기호를 모두 포함합니다. 통화 기호는 금액 앞이나 뒤에 올 수 있습니다. |
- Allow multiple items. field가 반복되는지 여부를 지정합니다. 반복 field의 인스턴스는 동일한 유형의 여러 객체를 참조할 수 있습니다. 예를 들어 자녀 이름이나 계좌 번호 등이 이에 해당합니다.
- Required field. field 값을 비워 둘 수 없음을 지정합니다. 이 속성을 활성화하면 페이지에 유효성 검사 규칙이 추가됩니다. 추출 후 field가 비어 있으면, 문서는 오류와 함께 수동 검토로 전송됩니다.
- Key field. field 값이 문서를 검색하는 데 사용되는지 여부를 지정합니다.
- Dimension field. field 값이 Skill Monitor에서 Skill 트랜잭션에 대한 세부 정보를 가져오는 데 사용되는지 여부를 지정합니다.
텍스트 모양
- 텍스트 원본. field에 인쇄 문자만 허용할지, 손글씨 문자만 허용할지, 또는 둘 다 허용할지를 지정합니다. 문서에서 사각형 영역을 지정해 field를 추가하는 경우, 이 속성 값은 해당 영역에서 감지된 문자 유형에 따라 설정됩니다. Add Field를 클릭하여 field를 추가하는 경우, 이 속성 값은 기본적으로 Printed로 설정됩니다.
참고: 새 Document skill에서는 기본적으로 손글씨 인식이 활성화되어 있습니다. 이를 비활성화하거나 다시 활성화하려면, skill 이름 오른쪽의 skill 설정 아이콘을 클릭한 다음 Languages 탭으로 이동하여 Text Appearance 섹션에서 Handwritten 옵션을 선택하십시오.
- field 배경 제거. 이 옵션은 field에 테두리, 개별 문자용 상자, 또는 플레이스홀더 텍스트가 있는 경우 인식 정확도를 향상시키는 데 사용할 수 있습니다. 이 옵션을 활성화하면, 배경 인식을 위한 템플릿으로 사용할 빈 양식 문서를 업로드하고, 그 빈 양식에서 해당 field를 지정해야 합니다. 빈 양식 문서는 Document Set에 표시되며 아이콘으로 구분됩니다.
- 특수 글꼴. field에 특정 글꼴로 입력된 텍스트가 포함될 것으로 예상되는 경우, 이 옵션을 사용하여 글꼴 종류를 선택하면 인식 정확도를 높일 수 있습니다. 여러 글꼴을 함께 선택할 수도 있습니다.
지원되는 폰트
| Font | Description | Font sample |
|---|---|---|
| Fax | 일반적으로 팩스 기기에서 사용되는 폰트입니다. | ![]() |
| Gothic | 고딕체로 인쇄된 텍스트에 사용되는 폰트입니다. | ![]() |
| Index | 우편번호(Zip 코드) 스타일로 쓰인 숫자만 포함하는 특수 문자 집합입니다. | ![]() |
| Matrix printer | 도트 매트릭스 프린터로 인쇄된 텍스트에 사용되는 폰트입니다. | ![]() |
| MICR CMC-7 | 특수한 MICR 바코드 폰트(CMC-7)입니다. | ![]() |
| MICR E-13B | 자기 잉크로 인쇄되는 숫자 전용 문자 집합입니다. MICR(Magnetic Ink Character Recognition) 문자는 개인 수표를 포함한 다양한 문서에서 볼 수 있습니다. | ![]() |
| OCR-A | Optical Character Recognition (OCR)을 위해 설계된 고정폭 폰트입니다. 주로 은행, 신용카드 회사 및 유사한 업계에서 널리 사용됩니다. | ![]() |
| OCR-B | Optical Character Recognition을 위해 설계된 폰트입니다. | ![]() |
| Receipt | 인식기는 영수증에 일반적으로 사용되는, 대체로 고정폭 또는 일반 폰트로 인쇄된 저품질 텍스트가 올 것으로 예상합니다. | ![]() |
| Typewriter | 타자기로 작성된 텍스트에 사용되는 폰트입니다. | ![]() |
텍스트 field의 추가 속성
Text
- Maximum length. field에 허용되는 최대 문자 수입니다. 추출된 값의 문자 수가 이 길이를 초과하면 오류 메시지가 표시됩니다. 프로세스에 수동 검토 단계가 있는 경우 문서는 수동 검토로 전송됩니다.
- Regular expression. 이 옵션을 사용하면 정규식(즉, field 값 구조에 대한 형식적 설명)을 추가할 수 있습니다. 정규식을 사용해 설정된 field에는 데이터 폼에 지정된 대로 문자, 숫자 및 기타 문자를 포함할 수 있습니다.
참고: 정규식은 PDF 문서의 텍스트 인식 결과에 영향을 주지 않습니다.
Date
- Time. Date field에 시간이 함께 포함될 수 있는 경우 이 옵션을 선택합니다. 시간이 허용되지 않으면 인식 중에 추출되지 않습니다.
- Day of week. 이 옵션을 사용하면 Date field에서 요일을 지정할 수 있습니다. 요일 값이 허용되지 않으면 인식 중에 추출되지 않습니다.
- Month by name. 이 옵션을 사용하면 월을 문자(단어)로 지정할 수 있습니다.
Number
- Integers only 는 값이 정수만 될 수 있음을 지정합니다. 이 옵션이 활성화된 상태에서 field 에서 구분 기호가 포함된 숫자가 감지되면, 해당 구분 기호는 천 단위 구분 기호로 처리됩니다.
- Fractional part may contain more than two digits. 추출된 값의 소수 부분이 두 자리보다 많을 것으로 예상되는 경우 이 옵션을 활성화합니다. 다음 문자를 소수점 구분 기호로 사용할 수 있습니다: 점(.), 쉼표(,), 하이픈(-), 등호(=), 공백( ).
- May have negative values. 이 옵션을 사용하면 추출된 값이 음수가 될 수 있습니다. 음수 값은 마이너스 기호 또는 괄호로 표시될 수 있습니다.
- May include ’%’ symbol. 이 옵션을 사용하면 추출된 값 앞이나 뒤에 퍼센트 문자(%)를 포함할 수 있습니다.










