- Group(群組)和 Repeating Group(重複群組)元素,它們本身沒有任何屬性。
- 輸入欄位元素,這些元素來自於位於「Extraction Rules」活動之前的其他活動,只提供 Get region from 選項,用於在不同輸入欄位之間切換。
要搜尋的內容
人名、組織、地址、地點、日期、期間、金額
- Entities:實體類型。若您變更類型,搜尋元素旁的圖示會自動更新。
- Instances:實例數量。您可以擷取第一個實例,或擷取所有找到的實例。
來自字典的值
- 文字來源:一個 TXT 檔案,其中包含要搜尋的單字或片語清單,每一行一個變化形式。
- 使用詞形變化:啟用此選項以搜尋所有詞形變化。
- 出現次數:實例數量。可以擷取第一個出現的實例或所有偵測到的實例。
來自正規表示式的值
- 正規表示式:定義搜尋條件的正規表示式。程式使用 PCRE2 正規表示式語法。
- 搜尋字詞的一部分:啟用此選項即可在相符項目與其餘文字之間沒有空格分隔時,仍能找到相符結果。
- 實例:出現的次數。可以擷取第一個或所有偵測到的實例。
文字
- Text source:要尋找的字詞或片語清單,每行一種變體。
- Use morphology:啟用此選項以搜尋所有詞形變化。
- Allowed errors:在文字仍視為找到的情況下,允許不同字元的百分比或數量。這在發生辨識錯誤時可能會有所幫助。
Note: 若啟用 Use morphology 選項,則此選項將無法使用。
- Instances:出現的次數。您可以擷取第一個出現位置,或擷取所有偵測到的出現位置。
搜尋範圍
- 搜尋位置:搜尋元素位於 整份文件 之內,或位於另一個搜尋元素之內。
- 之後:搜尋元素在已辨識文字中位於另一個搜尋元素之後。
- 在同一句中搜尋:開啟此選項以在同一句中找到該元素。
- 之前:搜尋元素在已辨識文字中位於另一個搜尋元素之前。
- 在同一句中搜尋:開啟此選項以在同一句中找到該元素。
