Zum Hauptinhalt springen
Die Aufzählungskonstanten von SourceContentReuseModeEnum beschreiben die verfügbaren Modi für die Wiederverwendung von Inhalten aus PDF-Quelldateien und Office-Dokumenten.
Office-Dokumente werden unter macOS nicht unterstützt.
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

Elemente

NameBeschreibung
CRM_AutoABBYY FineReader Engine wählt automatisch den geeigneten Modus für die Verarbeitung von PDF-Dateien oder Office-Dokumenten aus. Wenn das Ergebnis dieses Modus nicht den Erwartungen entspricht oder der Dokumenttyp und der entsprechende Wiederverwendungsmodus im Voraus bekannt sind, kann der Modus manuell ausgewählt werden.
CRM_ContentAndPicturesABBYY FineReader Engine wählt automatisch den Modus für die Nutzung von Text und Bildern in den einzelnen Bereichen jeder Seite der PDF-Quelldatei oder des Office-Dokuments aus. Das bedeutet, dass sowohl der Inhalt der Quelldatei als auch gerasterte Bilder für die Verarbeitung verwendet werden. Wenn der Text aus der Quelldatei als ausreichend gut eingestuft wird, wird er verwendet; andernfalls wird der Text aus dem Rasterbild dieses Bereichs verwendet.
CRM_ContentOnlyABBYY FineReader Engine verwendet sowohl den Text als auch die Bilder der PDF-Quelldatei oder des Office-Dokuments. <Warning> Die Verwendung des Textinhalts der Quelldatei beschleunigt die Verarbeitung. Wenn Sie diesen Modus jedoch auswählen und keine Textebene vorhanden ist, tritt ein Fehler auf. </Warning> Wir empfehlen, diesen Modus für Quelldateien mit sichtbarem Text zu verwenden, der in Unicode, ASCII oder einem anderen Standard zur Zeichenkodierung codiert ist und korrekte Schriftart- und Größeneinstellungen aufweist. Wenn Ihre Quelldatei von einem anderen Typ ist, verwenden Sie CRM_Auto, CRM_ContentAndPictures oder CRM_DoNotReuse. <Warning> Dieser Modus ist nicht verfügbar, wenn die Dokumente parallel im Speicher verarbeitet werden (MultiProcessingParams::MultiProcessingMode = MPM_Parallel). </Warning>
CRM_DoNotReuseABBYY FineReader Engine rastert die Seiten der PDF-Quelldatei oder des Office-Dokuments und verarbeitet sie. Der Inhalt der Quelldatei wird ignoriert.
Verwenden Sie die Methode IsPdfWithTextualContent, um festzustellen, ob die Datei eine Textebene enthält.

Bemerkungen

Die Erkennung von Dokumentinhalten erfolgt zusammen mit der Bestimmung des Typs des Wortmodells (siehe IWord::ModelType). Dieser Prozess hängt vom ausgewählten Modus für die Wiederverwendung von Inhalten ab:
  • CRM_DoNotReuse — der Typ des Wortmodells wird immer bestimmt.
  • CRM_Auto, CRM_ContentAndPictures — die Bestimmung des Typs des Wortmodells hängt davon ab, ob die Erkennung von Dokumentinhalten verwendet wird.
  • CRM_ContentOnly — der Typ des Wortmodells wird nie bestimmt.

Verwendet in

IObjectsExtractionParams::SourceContentReuseMode