跳轉到主要內容
此物件提供可用來處理單一已辨識文字段落的方法和屬性。 在 ABBYY FineReader Engine 物件模型中,段落是基本的文字單位。使用者可透過此物件取得:
  • 已辨識文字 (請使用 Text 屬性)
  • 各種段落參數 (ExtendedParams、ListParams、ParagraphStyle 屬性)
  • 段落中各行與單字的集合 (Lines 和 Words 屬性)
  • 單一字元的參數 (GetCharParamsSetCharParamsGetDropCapCharParams 方法)
  • 書籤 (BookmarkUserBookmark 屬性)
  • 段落邊界的座標 (Left、Top、Right、Bottom 屬性) 不適用於條碼段落。
  • ABBYY FineReader Engine 中的書籤可以是內部 (技術性) 實體,也可以是名稱以關鍵字 (前綴) 編碼的自訂實體。這些關鍵字及其詞彙可能會因所使用技術的版本而異。

屬性

,read-only

回傳 Engine 物件。

, read-only

以 Unicode 字串形式提供段落已辨識文字的存取。您可透過此屬性取得已辨識文字。此字串可能包含下列特殊字元:

  • 0x2028 — 換行符號
  • L’\n’ — 段落換行符號
  • 0xFFFC — 物件替換字元 (表示文字中嵌入的圖片)
  • 0x0009 — 定位字元。
  • 0x005E — 揚抑符 (^) ,由 ABBYY FineReader Engine 用作無法辨識字元的替代符號
  • 0x00AC — 軟連字號
若段落的書寫方向為從右至左 (例如希伯來文) ,段落文字為一個字串,其中包含按閱讀順序排列的段落字元。例如,希伯來文 Hebrew 將以字串 ”Hebrew_backtofront” 的形式回傳。

請注意,已辨識文字可能與原始內容略有差異。部分輸入符號可能會被替換為特殊字元。例如,「…」符號可能會被替換為定位字元。因此,已辨識文字中的符號數量可能與原始內容有所不同。若要存取未經符號替換的原始單字,請使用.

,read-only

提供段落單字集合的存取。

與 Text 屬性不同,若段落的書寫方向為從右至左 (例如希伯來文) ,段落中的單字為一個字串,其中包含從左至右排列的單字字元。例如,希伯來文單字 Hebrew 將以字串 ”Hebrew” 的形式回傳。

,read-only

提供段落行集合的存取。此屬性回傳一個常數物件。

, read-only

回傳段落中的書籤數量。

, read-only

透過書籤在段落內部書籤集合中的索引,提供任何類型 (技術性或使用者自訂) 書籤的存取。透過此屬性存取的書籤,其名稱包含前綴。

,read-only

回傳 Hyperlink 物件的參考,該物件 描述該位置的超連結。若沒有超連結, 此屬性會設為 0。

,唯讀

提供對段落中所有定位點的存取。

, 唯讀

可依據使用者書籤在段落書籤內部集合中的索引存取該書籤。透過 此屬性存取的書籤,其名稱不含前綴。

, 唯讀

回傳段落中的使用者書籤數量。

, 唯讀

此屬性包含段落中的字元數。此值與透過 Text 屬性取得的 字串字元數相同。

段落結尾的段落分隔符號會包含在 Text 屬性中,並計入 Length 屬性。

提供對 ParagraphParams 物件公開之 Paragraph 物件參數的存取。

,唯讀

提供對該段落所屬清單參數的存取。若段落不在清單中, IListParams::List 屬性會回傳 NULL。

提供對段落樣式參數的存取。這些參數僅在文件合成後才能存取。

此屬性會回傳常數物件。

提供對段落首字下沉字元數的存取。段落前 DropCapCharsCount 個符號 會視為首字下沉。編輯段落時此屬性不會變更,因此其值可能大於 段落長度。

, 唯讀

儲存該位置字元所屬欄位的編號。

, 唯讀

儲存段落在影像上位置的底部邊界座標。

此屬性不適用於條碼段落。

,唯讀的

儲存段落左邊界的座標,反映該段落在影像中的位置。

此屬性不適用於條碼的段落。

,唯讀的

儲存段落右邊界的座標,反映該段落在影像中的位置。

此屬性不適用於條碼的段落。

,唯讀的

儲存段落上邊界的座標,反映該段落在影像中的位置。

此屬性不適用於條碼的段落。

方法

名稱說明
DeleteBookmark從段落中刪除指定名稱的書籤,不限類型 (技術或使用者) 。
GetBookmarkRange依書籤名稱找出構成該書籤之字串的起始字元索引與長度。
GetCharParams提供單一字元參數的存取。
GetDropCapCharParams提供段落首字下沉字元參數的存取。
GetHyperlinkRange分析單一超連結字元,並找出構成該超連結之字串的起始字元索引與長度。
GetWordRecognitionVariants回傳段落文字中目前位置之單字識別候選結果的集合。
Insert將字串插入段落文字中。
InsertParagraphBreak將段落分成兩個部分。
InsertTab在選定的文字位置插入定位點。
InsertText將指定文字插入段落文字中。
NextGroup尋找段落中下一個其所選參數與搜尋起始字元不同的字元。此方法可用來找出段落中所有粗體或斜體單字、所有識別不確定的字元等。
Range從段落文字中回傳子字串。
Remove從段落文字中刪除指定範圍。
SetBookmark為段落中的字串設定使用者書籤。
SetCharParams為一組字元設定參數。
SetHyperlink為段落中的字串設定超連結。
Paragraph 物件圖

輸出參數

此物件是下列方法的輸出參數:

輸入參數

此物件是 Paragraphs 物件的 IndexOf 方法之輸入參數。

範例

FREngine.IBlock block;
int suspiciousCharsCount = 0;
// 逐一查看文字區塊中的段落,並計算可疑字元的數量
FREngine.ITextBlock textBlock = block.GetAsTextBlock();
int paragraphsCount = textBlock.Text.Paragraphs.Count;
for (int iPar = 0; iPar < paragraphsCount; iPar++)
{
 FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
 string text = par.Text;
 FREngine.ICharParams charParams = engine.CreateCharParams();
 for (int iChar = 0; iChar < text.Length; iChar++)
 {
  par.GetCharParams(iChar, charParams);
  if (charParams.IsSuspicious)
  {
   suspiciousCharsCount++;
  }
 }
}
此物件可用於下列程式碼範例:

另請參閱

Paragraphs 使用文字 使用屬性