跳转到主要内容
此对象可让您在借助 Engine 对象的 InjectTextLayer 方法创建可搜索 PDF 文件时,调整对输入的“纯图像”或“图像加文本”PDF 文件的处理参数。新创建的此类型对象,其属性会设置为合理的默认值 (参见属性说明) 。

属性

,read-only

返回 Engine 对象。

指定在处理输出 PDF 文件期间出现问题时,是否更改其外观。

此属性默认为 FALSE,即每当文档无效时,将返回 FREN_E_PDFA_CONVERSION_FAILED 返回代码,且文档处理将被取消。
如果此属性为 TRUE,则会显示有关更改输出外观的警告。请使用回调来管理文档处理。

指定输出 PDF 文件的 PDF/A 标准合规级别。

此属性默认为 PCM_None,即输出文件将从原始文档继承 PDF/A 标准合规级别。

指定在注入文本层期间是否执行文档处理。

此属性默认为 TRUE。如果此属性为 FALSE,则原始文档将在不注入文本层的情况下进行转换。

指定是否对原始文档执行倾斜和方向校正。将此属性设置为 TRUE 时,最终文档将包含校正后的图像。

仅当PagePreprocessingParams对象的CorrectOrientationMode属性未设置为 COM_No 时,此属性才可用。否则,倾斜和方向将不会被校正。

此属性默认为 FALSE。

指定生成的 PDF 文档是否应添加标签。

带标签的 PDF 是结构化 PDF 的一种特殊形式,允许提取页面内容并用于多种用途,例如文本和图形的重排、转换为 HTML 和 XML 等文件格式,以及为视觉障碍人士提供无障碍访问。

导出的 PDF 可能包含以下标签:

  • <DIV> (分区元素)
  • <P> (段落)
  • <SPAN> (条目元素)
  • <L> (列表元素、列表项元素、列表项正文元素等)
  • <Caption> (标题/说明)
  • <Figure> (图像)
  • <Link> (外部链接)
  • <InternalLink> (内部链接)
  • <Lbl> (编号和标记)
  • <RunningTitle> (页眉/页脚标题)
  • <Note> (注释条目元素)
  • <Footnote> (脚注文本元素)
  • <Reference> (参考条目元素) 。

此外,包含不同语言的段落将被拆分为带有 <SPAN> 标签的文本片段,每个 <SPAN> 标签包含单一语言的文本。

此属性必须设置为 TRUE:
  • 如果 PDFAComplianceMode 属性设置为 PCM_Pdfa_1a、PCM_Pdfa_2a 或 PCM_Pdfa_3a, 因为 PDF/A-1a、PDF/A-2a 和 PDF/A-3a 始终带有标签。
  • 如果 PDFAComplianceMode 属性默认设置为 PCM_None,但 PCM_Pdfa_1a、 PCM_Pdfa_2a 或 PCM_Pdfa_3a 作为输入参数传入。

此属性的默认值为 FALSE。但是,如果源 PDF 文件已带有标签,则此属性的值将被忽略,生成的 PDF 文件将始终带有标签。

输出参数

该对象是 Engine 对象中 CreateTextLayerInjectionParams 方法的输出参数。

输入参数

此对象会作为输入参数传递给 Engine 对象的 InjectTextLayer 方法。

另请参阅

使用配置文件