预定义配置文件
适用于从文档中提取数据并以结构化格式呈现。所有对象 (包括表格、图片、复选标记和手写内容) 均连同其位置和属性一并保存。此配置文件最适合对提取的数据进行后续处理或与其他应用程序集成。 | |
适用于将文档转换为可编辑格式 (例如 RTF、DOCX) 。相关设置已针对准确性进行优化:
| |
适用于将文档转换为可编辑格式 (例如 RTF、DOCX) 。相关设置已针对处理速度进行优化:
| |
适用于创建电子档案(转换为 PDF、PDF/A,以及使用 MRC 的 PDF 和 PDF/A) 。相关设置已针对准确性进行优化:
| |
适用于创建电子档案(转换为 PDF、PDF/A,以及使用 MRC 的 PDF 和 PDF/A) 。相关设置已针对处理速度进行优化:
| |
适用于从文档中提取文本。相关设置已针对准确性进行优化:
文本按照人类阅读的顺序提取,从而确保在使用自然语言处理 (NLP) 引擎进行训练和处理时数据的一致性。 | |
适用于从文档中提取文本。相关设置已针对处理速度进行优化:
文本按照人类阅读的顺序提取,从而确保在使用自然语言处理 (NLP) 引擎进行训练和处理时数据的一致性。 | |
适用于识别短文本片段。当前,该配置文件使用默认设置。 | |
适用于条形码提取。仅提取条形码 (不检测文本、图片或表格) 。相关设置已针对准确性进行优化。 出于兼容性考虑,您也可以通过 BarcodeRecognition 名称访问此配置文件。 | |
适用于条形码提取。仅提取条形码 (不检测文本、图片或表格) 。相关设置已针对处理速度进行优化。 | |
适用于创建高压缩 PDF 文件,将整个文档以图片形式保存。使用以下设置:
| |
适用于识别名片。使用以下设置:
| |
适用于从机器可读区域提取数据(MRZ)。使用以下设置:
| |
适用于识别技术图纸。该配置文件充分考虑了工程图的大尺寸和复杂性,以及图像中可能存在多种文本方向的情况。该配置文件旨在将此类图像转换为可搜索的 PDF 格式。使用以下设置:
| |
将所有处理参数设置为默认值。 |
- 使用 Linux 版 FRE 的用户可以在发行包的 Bin Libraries 文件夹中找到预定义配置文件。
- 使用 macOS 版 FRE 的用户可以在发行包的 /PredefinedProfiles 文件夹中找到预定义配置文件。
- 要借助 FREngineDistribution.csv 文件确定应用程序运行所需的资源文件集,请参阅与所选场景对应的页面。
用户配置文件
- 布尔属性值用字符串表示:true 或 false。
- 枚举属性值用常量名称表示。
- string 属性值直接写出,不加引号。
- PrepareImageMode
- ImageProcessingParams
- DocumentProcessingParams
- PageProcessingParams
- PagePreprocessingParams
- PageAnalysisParams
- TableAnalysisParams
- TextLayerInjectionParams
- BarcodeParams
- ObjectsExtractionParams
- RecognizerParams1
- SortingBlocksParams
- SynthesisParamsForPage
- SynthesisParamsForDocument
- DocumentStructureDetectionParams
- FontFormattingDetectionParams
- JpegExtendedParams
- TiffExtendedParams
- PngExtendedParams
- EmptyPageDetectionParams
- RTFExportParams
- HTMLExportParams
- XLExportParams
- TextExportParams
- PPTExportParams
- XMLExportParams
- AltoExportParams
- JsonExportParams
- EBookExportParams
- XPSExportParams
- PDFExportParams
- PDFExportFeatures
- PDFEncryptionInfo
- PaperSizeParams2
- PictureExportParams2
- DocumentContentInfoWritingParams3
- PDFPictureCompressionParams
- PDFMRCParams
- MrzJsonExportParams
- MrzXmlExportParams
- ComparisonParams
- PageMargins4
DocumentContentInfoWritingParams 对象的属性,请直接在其父对象的相应部分中指定这些参数。对于 PDF 格式,其父对象是 PDFExportFeatures 对象;对于其他格式,则是相应的导出参数对象。因此,您可以为不同的导出格式指定不同的内容信息设置。例如,如果您不想将文档作者信息写入输出的 PDF 文件,请在配置文件中插入以下几行:
