- 데이터 폼에서 field 옆에 있는 버튼을 클릭합니다.
- Field options 대화 상자에서 드롭다운 목록에서 원하는 데이터 유형을 선택합니다.

날짜 정규화
- 날짜의 경우 YYYY-MM-DD: 연도, 월, 일이 이 순서로 옵니다.
- 시간의 경우 HH:MM:SS: 시, 분, 초가 이 순서로 옵니다.
정규화된 날짜의 예
| 추출된 데이터 | 정규화된 데이터 |
|---|---|
| 15.06.2023 | 2023-06-15 |
| 2023/06/15 22:17 | 2023-06-15 22:17:00 |
| 06-15-2023 | 2023-06-15 |
| 02/11/2022 | 2022-02-11 또는 2022-11-02 참고: 해당 날짜 필드에 대해 Day-Month-Year 형식과 Month-Day-Year 형식이 모두 활성화되어 있는 경우, Vantage가 날짜를 모호함 없이 정규화하지 못할 수 있습니다. 이 경우 두 가지 가능한 날짜 중에서 선택하라는 메시지가 표시됩니다. |
| Saturday, December 3rd, 2022 | 2022-12-03 |
| The second of May 2022 | 2022-05-02 |
참고: 날짜가 영어로, 그리고 숫자가 아닌 단어로 표기된 경우에는 Skill 설정에서 영어가 선택되어 있을 때에만 정규화됩니다.Vantage가 다음과 같은 이유로 날짜를 정규화하지 못할 수 있습니다.
- 날짜가 불완전한 경우. 예: “4:39 am” (시간 값은 날짜와 함께 추출된 경우에만 정규화됩니다).
- 정확한 날짜 대신 시간을 나타내는 부사 표현이 사용된 경우. 예: “last month”, “a few days ago”.
- 날짜나 시간 옆에 불필요한 단어나 문자가 함께 나타나는 경우. 예: “2016/06/15 22”.
- 일반적이지 않은 날짜 표기가 사용된 경우. 예: “14 Jumada Al-Awwal 1445”.
숫자 정규화
정규화된 숫자 예시
| 추출된 데이터 | 정규화된 데이터 |
|---|---|
| 12,345,678 | 12345678 |
| -12,345.678 | -12345.678 |
| 12.0000 | 12 |
| 1.000 | 1000 또는 1 Tip: 점 뒤 부분에 세 자리 숫자가 있는 경우, 점이 천 단위 구분자인지, 아니면 정수부와 소수부를 나누는 소수점인지를 판단해 두 가능한 값 중 하나를 선택해야 합니다. |
| 12,345.678 % | 12345.678 |
| 1,23,45,67,890 (Indian numbering system) | 1234567890 |
| twenty-first | 21 |
- 숫자 옆에 추가 단어 또는 문자가 함께 나타나는 경우. 예: “EURO12,345.678” 또는 “5 kilos”.
- 소수부와 정수부, 또는 소수점과 천 단위 구분자 사이의 자릿수 개수가 불규칙한 경우. 예: “123,456,7890”. 이 경우, 소수 부분은 최대 3자리까지만 포함할 수 있습니다. 또한 “123,456,789”가 추출되면 정규화된 값은 “123456789”가 되고, “123,456,78”이 추출되면 정규화된 값은 “123456.78”이 됩니다.
- 비정규(불규칙한) 숫자 표기가 사용된 경우.
금액 정규화
정규화된 금액 예시
| Extracted data | Normalized data |
|---|---|
| 12,345.678 EURO | EURO 12345.678 |
| 12,345.678 ¥ | ¥ 12345.678 |
| 13,87E | E 13.87 |
| 13 euro 87 | euro 13.87 |
| fifty dollars | dollars 50 |
| ₹1,23,455 | ₹ 123455 |
참고: 금액이 영어로, 숫자가 아닌 영어 단어로 작성되어 있고 Skill 설정에서 영어가 선택된 경우에만 정규화됩니다.예를 들어 “12 ttt”처럼 통화를 나타내는 잘못된 단어가 사용된 경우, Vantage가 금액을 정규화하지 못할 수 있습니다.
