- データ フォームで、field の横にあるボタンをクリックします。
- Field options ダイアログ ボックスで、ドロップダウン リストから目的のデータ型を選択します。

日付の正規化
- 日付: YYYY-MM-DD(年-月-日の順)
- 時刻: HH:MM:SS(時-分-秒の順)
正規化された日付の例
| 抽出データ | 正規化データ |
|---|---|
| 15.06.2023 | 2023-06-15 |
| 2023/06/15 22:17 | 2023-06-15 22:17:00 |
| 06-15-2023 | 2023-06-15 |
| 02/11/2022 | 2022-02-11 または 2022-11-02 注: 該当の日付に対して Day-Month-Year と Month-Day-Year の両方の形式が有効な場合、Vantage では一意に正規化できないことがあります。この場合、2 つの候補日付から選択するよう促されます。 |
| Saturday, December 3rd, 2022 | 2022-12-03 |
| The second of May 2022 | 2022-05-02 |
注: 英語で記述され、かつ Skill 設定で英語が選択されている場合にのみ、単語で書かれた日付は正規化されます。Vantage が日付を正規化できない場合がある理由:
- 日付が不完全である(例: “4:39 am”。時刻は日付と一緒に抽出された場合にのみ正規化されます)。
- 正確な日付の代わりに時間を表す語が使われている(例: “last month”、“a few days ago”)。
- 日付や時刻の直前直後に余分な語や文字が含まれている(例: “2016/06/15 22”)。
- 一般的でない日付表記が使われている(例: “14 Jumada Al-Awwal 1445”)。
数値の正規化
string を解析し、以下の表に示す標準化形式に変換します。このとき、整数部と小数部の区切りにはドット (.) を使用します。
正規化された数値の例
| 抽出されたデータ | 正規化されたデータ |
|---|---|
| 12,345,678 | 12345678 |
| -12,345.678 | -12345.678 |
| 12.0000 | 12 |
| 1.000 | 1000 または 1 Tip: 小数点の後が 3 桁の場合、その点が千位の区切りか、小数点かを判断し、どちらか一方の値を選択する必要があります。 |
| 12,345.678 % | 12345.678 |
| 1,23,45,67,890 (Indian numbering system) | 1234567890 |
| twenty-first | 21 |
- 数値の直前・直後に余分な語や文字がある場合(例: “EURO12,345.678”、“5 kilos”)。
- 整数部と小数部、または小数点と千位区切りの間の桁数が不規則な場合(例: “123,456,7890”)。この場合、小数部は 3 桁以下である必要があります。さらに、“123,456,789” が抽出された場合、正規化値は “123456789”、“123,456,78” が抽出された場合、正規化値は “123456.78” になります。
- 不規則な数値表記が使用されている場合。
金額の正規化
正規化された金額の例
| 抽出データ | 正規化データ |
|---|---|
| 12,345.678 EURO | EURO 12345.678 |
| 12,345.678 ¥ | ¥ 12345.678 |
| 13,87E | E 13.87 |
| 13 euro 87 | euro 13.87 |
| fifty dollars | dollars 50 |
| ₹1,23,455 | ₹ 123455 |
注: 金額が英語の単語で表記されている場合、英語で書かれており、かつ Skill 設定で英語が選択されているときにのみ正規化されます。Vantage は、通貨を示す語が不正な場合(例: “12 ttt”)、金額を正規化できないことがあります。
