此方法会打开指定的图像文件,对其执行预处理、版面分析、识别、页面和文档合成,并将识别出的文本导出为所选输出格式。RecognizeImageFile 方法可处理多页图像,并将识别结果导出到单个文件。
HRESULT RecognizeImageFile(
BSTR ImageFileName,
IPrepareImageMode PrepareMode,
IDocumentProcessingParams* DocumentProcessingParams,
FileExportFormatEnum ExportFormat,
IUnknown* ExportParams,
IImagePasswordCallback* PasswordCallback,
BSTR OutputFileName
);
void RecognizeImageFile(
string ImageFileName,
IPrepareImageMode PrepareMode,
IDocumentProcessingParams DocumentProcessingParams,
FileExportFormatEnum ExportFormat,
object ExportParams,
IImagePasswordCallback PasswordCallback,
string OutputFileName
);
Sub RecognizeImageFile( _
ImageFileName As String, _
PrepareMode As IPrepareImageMode, _
DocumentProcessingParams As IDocumentProcessingParams, _
ExportFormat As IFileExportFormatEnum, _
ExportParams As Object, _
PasswordCallback As IImagePasswordCallback, _
OutputFileName As String _
)
ImageFileName
[in] 包含要识别的图像文件的完整路径。如果该文件不是 ABBYY FineReader Engine 的内部格式,则会使用 PrepareImageMode 属性的默认值对其进行预处理;或者,如果已加载 profile,则使用此配置文件中设置的参数。
PrepareMode
[in] 此变量引用 PrepareImageMode 对象,该对象存储将图像转换为内部格式所需的参数。此参数可以为 0,此时使用图像预处理模式的默认参数;或者,如果已加载 profile,则使用此配置文件中设置的参数。
DocumentProcessingParams
[in] 引用 DocumentProcessingParams 对象,该对象存储所有处理参数。此参数可以为 0。在这种情况下,将使用默认参数处理文档 (所有处理参数都设为默认值,识别语言为英语) ;或者,如果已加载 profile,则使用此配置文件中设置的参数。
ExportFormat
[in] 此 FileExportFormatEnum 类型的变量指定导出识别文本时输出文件的格式。
ExportParams
[in] 通过此输入参数传入与文件格式对应类型的导出参数对象。例如,如果要创建 RTF 文件,请创建 RTFExportParams 对象,在其中设置所需参数,然后将其作为 exporterParams 输入参数传递给此方法。此参数是可选的,可以为 0,此时将使用默认导出参数;或者,如果已加载 profile,则使用此配置文件中设置的参数。
在 Linux 中,如果你使用的是以进程外方式加载的 ABBYY FineReader Engine,你必须为此参数传递 NULL。
PasswordCallback
[in] 引用由用户实现的 ImagePasswordCallback 类型对象的接口,该接口用于处理访问 PDF 格式图像时可能出现的密码请求。此参数是可选的,可以为 0;在这种情况下,无法处理受密码保护的文件。
OutputFileName
[in] 包含要导出识别文本的输出文件的完整路径。如果该位置已存在文件,则会在不提示的情况下将其覆盖,或者根据导出模式将识别文本追加到文件末尾。
如果识别过程被用户中断,此方法将返回 E_ABORT。如果模式训练被用户中断,此方法将返回 FREN_E_PATTERN_TRAINING_ABORTED。它还会返回 ABBYY FineReader Engine 函数的标准返回码。
对于 Linux 和 Windows:根据 IEngine::MultiProcessingParams 属性的值,ABBYY FineReader Engine 可以将多页文档的处理任务分配到各个 CPU 内核。
Engine
IImagePasswordCallback
使用配置文件