Saltar al contenido principal
Las constantes de enumeración de SourceContentReuseModeEnum describen los modos disponibles para reutilizar el contenido del archivo PDF de origen y del documento ofimático.
Los documentos ofimáticos no son compatibles con macOS.
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

Elementos

NombreDescripción
CRM_AutoABBYY FineReader Engine selecciona automáticamente el modo adecuado para procesar archivos PDF o documentos ofimáticos. Si el resultado de este modo no cumple las expectativas, o si el tipo de documento y el modo de reutilización correspondiente se conocen de antemano, el modo puede seleccionarse manualmente.
CRM_ContentAndPicturesABBYY FineReader Engine selecciona automáticamente el modo de uso del texto y las imágenes para las distintas partes de cada página del archivo PDF o documento ofimático de origen. Esto significa que, para el procesamiento, se utilizan tanto el contenido del archivo de origen como las imágenes rasterizadas. Si el texto del archivo de origen se considera adecuado, se usa; de lo contrario, se usa el texto del ráster de esa parte.
CRM_ContentOnlyABBYY FineReader Engine utiliza tanto el texto como las imágenes del archivo PDF o documento ofimático de origen. <Warning> El uso del contenido de texto del archivo de origen acelerará el procesamiento, pero si elige este modo y no hay ninguna capa de texto, se producirá un error. </Warning> Recomendamos usar este modo con archivos de origen que tengan texto visible, codificado en Unicode, ASCII u otro estándar de codificación de caracteres, y con una configuración correcta de fuentes y tamaños. Si el archivo de origen es de otro tipo, use CRM_Auto, CRM_ContentAndPictures o CRM_DoNotReuse. <Warning> Este modo no está disponible cuando se procesan documentos en paralelo (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) en memoria. </Warning>
CRM_DoNotReuseABBYY FineReader Engine rasteriza las páginas del archivo PDF o documento ofimático de origen y las procesa. El contenido del archivo de origen se ignora.
Use el método IsPdfWithTextualContent para averiguar si el archivo contiene una capa de texto.

Observaciones

El reconocimiento del contenido del documento se realiza al mismo tiempo que se determina el tipo de modelo de palabra (consulte IWord::ModelType). Este proceso depende del modo de reutilización del contenido seleccionado:
  • CRM_DoNotReuse — siempre se determina el tipo de modelo de palabra.
  • CRM_Auto, CRM_ContentAndPictures — la determinación del tipo de modelo de palabra depende de si se usa el reconocimiento del contenido del documento.
  • CRM_ContentOnly — no se determina nunca el tipo de modelo de palabra.

Se utiliza en

IObjectsExtractionParams::SourceContentReuseMode