跳轉到主要內容
對於「Extraction Rules」活動中的大多數搜尋元素,Properties 窗格分為兩個區段:What to search forWhere to search。例外情況為:
  • Group(群組)和 Repeating Group(重複群組)元素,它們本身沒有任何屬性。
  • 輸入欄位元素,這些元素來自於位於「Extraction Rules」活動之前的其他活動,只提供 Get region from 選項,用於在不同輸入欄位之間切換。

要搜尋的內容

要搜尋的內容 區段包含各個元素專屬的屬性。

人名、組織、地址、地點、日期、期間、金額

對於所有用於搜尋具名實體的搜尋元素,您可以指定以下屬性:
  • Entities:實體類型。若您變更類型,搜尋元素旁的圖示會自動更新。
  • Instances:實例數量。您可以擷取第一個實例,或擷取所有找到的實例。

來自字典的值

對於字典詞組,請指定:
  • 文字來源:一個 TXT 檔案,其中包含要搜尋的單字或片語清單,每一行一個變化形式。
  • 使用詞形變化:啟用此選項以搜尋所有詞形變化。
  • 出現次數:實例數量。可以擷取第一個出現的實例或所有偵測到的實例。

來自正規表示式的值

對於正規表示式,請指定:
  • 正規表示式:定義搜尋條件的正規表示式。程式使用 PCRE2 正規表示式語法。
  • 搜尋字詞的一部分:啟用此選項即可在相符項目與其餘文字之間沒有空格分隔時,仍能找到相符結果。
  • 實例:出現的次數。可以擷取第一個或所有偵測到的實例。

文字

若要建立文字搜尋元素,請按一下編輯圖示並輸入要尋找的字詞或片語清單,或按一下文件影像,從文件中加入已辨識的文字。 Value from Dictionary 搜尋元素不同,這裡的關鍵字會直接列出,而不是存於 TXT 檔案中,並且您也可以選擇允許部分辨識錯誤。
  • Text source:要尋找的字詞或片語清單,每行一種變體。
  • Use morphology:啟用此選項以搜尋所有詞形變化。
  • Allowed errors:在文字仍視為找到的情況下,允許不同字元的百分比或數量。這在發生辨識錯誤時可能會有所幫助。
Note: 若啟用 Use morphology 選項,則此選項將無法使用。
  • Instances:出現的次數。您可以擷取第一個出現位置,或擷取所有偵測到的出現位置。
搜尋範圍 區段對所有元素而言都相同。在這個區段中,您可以縮小程式尋找搜尋元素的範圍。在以下設定中,您可以使用位於清單中當前元素之上的搜尋元素:
  • 搜尋位置:搜尋元素位於 整份文件 之內,或位於另一個搜尋元素之內。
範例: 在文件前言中尋找組織名稱。
  • 之後:搜尋元素在已辨識文字中位於另一個搜尋元素之後。
    • 在同一句中搜尋:開啟此選項以在同一句中找到該元素。
範例: 在同一句中在組織名稱之後尋找其角色。
  • 之前:搜尋元素在已辨識文字中位於另一個搜尋元素之前。
    • 在同一句中搜尋:開啟此選項以在同一句中找到該元素。
例如,如果您要尋找某人的出生日期,可以先建立一個包含「born」關鍵字的輔助搜尋元素,然後指定 Date 實體位於此關鍵字之後的某處,且位於同一句中。 您可以新增多個 之後之前 元素,以進一步精確搜尋條件。