Vai al contenuto principale
Le costanti dell’enumerazione SourceContentReuseModeEnum descrivono le modalità disponibili per il riutilizzo dei contenuti del file PDF sorgente e dei documenti Office.
I documenti Office non sono supportati su macOS.
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

Elementi

NomeDescrizione
CRM_AutoABBYY FineReader Engine seleziona automaticamente la modalità appropriata per l’elaborazione di file PDF o documenti Office. Se il risultato di questa modalità non soddisfa le aspettative, oppure se il tipo di documento e la corrispondente modalità di riutilizzo sono noti in anticipo, è possibile selezionare la modalità manualmente.
CRM_ContentAndPicturesABBYY FineReader Engine seleziona automaticamente la modalità di utilizzo del testo e delle immagini per le singole parti di ogni pagina del file PDF sorgente o del documento Office. Vengono utilizzati sia il contenuto del file sorgente sia le immagini rasterizzate. Se il testo del file sorgente è ritenuto di buona qualità, viene utilizzato direttamente; in caso contrario, viene utilizzato il testo ottenuto dalla rasterizzazione della parte corrispondente.
CRM_ContentOnlyABBYY FineReader Engine utilizza sia il testo che le immagini del file PDF sorgente o del documento Office. <Warning> L’utilizzo del contenuto testuale del file sorgente velocizza l’elaborazione, ma se si sceglie questa modalità in assenza di un livello di testo, si verificherà un errore. </Warning> Si consiglia di utilizzare questa modalità per i file sorgente con testo visibile codificato in Unicode, ASCII o un altro standard di codifica dei caratteri, con impostazioni corrette di font e dimensioni. Se il file sorgente è di tipo diverso, utilizzare CRM_Auto, CRM_ContentAndPictures o CRM_DoNotReuse. <Warning> Questa modalità non è disponibile durante l’elaborazione parallela dei documenti (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) in memoria. </Warning>
CRM_DoNotReuseABBYY FineReader Engine rasterizza le pagine del file PDF sorgente o del documento Office e le elabora. Il contenuto del file sorgente viene ignorato.
Utilizzare il metodo IsPdfWithTextualContent per verificare se il file contiene un livello di testo.

Osservazioni

Il riconoscimento dei contenuti del documento viene effettuato unitamente al processo di determinazione del tipo di modello Word (vedi IWord::ModelType). Questo processo dipende dalla modalità selezionata di riutilizzo dei contenuti:
  • CRM_DoNotReuse — il tipo di modello Word viene sempre determinato.
  • CRM_Auto, CRM_ContentAndPictures — la determinazione del tipo di modello Word dipende dall’utilizzo del riconoscimento dei contenuti del documento.
  • CRM_ContentOnly — il tipo di modello Word non viene mai determinato.

Utilizzato in

IObjectsExtractionParams::SourceContentReuseMode