Pular para o conteúdo principal
As constantes da enumeração SourceContentReuseModeEnum descrevem os modos disponíveis para reutilizar o arquivo PDF de origem e o conteúdo dos documentos do Office.
Documentos do Office não têm suporte no macOS.
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

Elementos

NomeDescrição
CRM_AutoO ABBYY FineReader Engine seleciona automaticamente o modo adequado para processar arquivos PDF ou documentos do Office. Se o resultado desse modo não atender às expectativas, ou se o tipo de documento e o modo de reutilização correspondente forem conhecidos antecipadamente, o modo poderá ser selecionado manualmente.
CRM_ContentAndPicturesO ABBYY FineReader Engine seleciona automaticamente o modo de uso do texto e das imagens para cada parte de cada página do arquivo PDF de origem ou documento do Office. Isso significa que tanto o conteúdo do arquivo de origem quanto as imagens rasterizadas são utilizados no processamento. Se o texto do arquivo de origem for considerado adequado, ele será usado; caso contrário, será usado o texto obtido da rasterização dessa parte.
CRM_ContentOnlyO ABBYY FineReader Engine usa tanto o texto quanto as imagens do arquivo PDF de origem ou documento do Office. <Warning> O uso do conteúdo textual do arquivo de origem acelera o processamento, mas se você escolher este modo e não houver uma camada de texto, ocorrerá um erro. </Warning> Recomendamos usar este modo para arquivos de origem com texto visível codificado em Unicode, ASCII ou outro padrão de codificação de caracteres, e com configurações corretas de fontes e tamanhos. Se o arquivo de origem for de outro tipo, use CRM_Auto, CRM_ContentAndPictures ou CRM_DoNotReuse. <Warning> Este modo não está disponível ao processar documentos em paralelo (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) em memória. </Warning>
CRM_DoNotReuseO ABBYY FineReader Engine rasteriza as páginas do arquivo PDF de origem ou documento do Office e as processa. O conteúdo do arquivo de origem é ignorado.
Use o método IsPdfWithTextualContent para verificar se o arquivo contém uma camada de texto.

Observações

O reconhecimento do conteúdo do documento é realizado em conjunto com o processo de determinação do tipo de modelo de palavra (consulte IWord::ModelType). Esse processo depende do modo de reutilização de conteúdo selecionado:
  • CRM_DoNotReuse — o tipo de modelo de palavra é sempre determinado.
  • CRM_Auto, CRM_ContentAndPictures — a determinação do tipo de modelo de palavra depende do uso do reconhecimento do conteúdo do documento.
  • CRM_ContentOnly — o tipo de modelo de palavra nunca é determinado.

Usado em

IObjectsExtractionParams::SourceContentReuseMode