메인 콘텐츠로 건너뛰기
SourceContentReuseModeEnum 열거형 상수는 원본 PDF 파일과 Office 문서 콘텐츠를 재사용할 때 사용할 수 있는 모드를 설명합니다.
Office 문서는 macOS에서 지원되지 않습니다.
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

요소

NameDescription
CRM_AutoABBYY FineReader Engine는 PDF 파일 또는 Office 문서를 처리할 때 적절한 모드를 자동으로 선택합니다. 이 모드의 처리 결과가 기대에 미치지 않거나, 문서 유형과 그에 맞는 재사용 모드를 미리 알고 있는 경우에는 모드를 수동으로 선택할 수 있습니다.
CRM_ContentAndPicturesABBYY FineReader Engine는 원본 PDF 파일 또는 Office 문서의 각 페이지 영역에 대해 텍스트와 이미지 사용 방식을 자동으로 선택합니다. 즉, 처리 시 원본 파일 콘텐츠와 래스터화된 이미지가 모두 사용됩니다. 원본 파일의 텍스트 품질이 양호하다고 판단되면 해당 텍스트를 사용하고, 그렇지 않으면 해당 영역의 래스터 이미지에서 추출한 텍스트를 사용합니다.
CRM_ContentOnlyABBYY FineReader Engine는 원본 PDF 파일 또는 Office 문서의 텍스트와 이미지를 모두 사용합니다. <Warning> 원본 파일의 텍스트 콘텐츠를 사용하면 처리 속도가 빨라지지만, 이 모드를 선택했는데 텍스트 레이어가 없으면 오류가 발생합니다. </Warning> 표시되는 텍스트가 있고, 해당 텍스트가 Unicode, ASCII 또는 다른 문자 인코딩 표준으로 인코딩되어 있으며 글꼴과 크기 설정이 올바른 원본 파일에는 이 모드를 사용하는 것이 좋습니다. 원본 파일이 다른 유형이면 CRM_Auto, CRM_ContentAndPictures 또는 CRM_DoNotReuse를 사용하십시오. <Warning> 이 모드는 메모리에서 문서를 병렬로 처리할 때(MultiProcessingParams::MultiProcessingMode = MPM_Parallel)는 사용할 수 없습니다. </Warning>
CRM_DoNotReuseABBYY FineReader Engine는 원본 PDF 파일 또는 Office 문서의 페이지를 래스터화한 후 처리합니다. 원본 파일의 콘텐츠는 무시됩니다.
파일에 텍스트 레이어가 포함되어 있는지 확인하려면 IsPdfWithTextualContent 메서드를 사용하십시오.

비고

문서 콘텐츠 인식은 단어 모델의 유형을 결정하는 과정과 함께 수행됩니다(IWord::ModelType 참조). 이 과정은 선택한 콘텐츠 재사용 모드에 따라 달라집니다.
  • CRM_DoNotReuse — 단어 모델의 유형이 항상 결정됩니다.
  • CRM_Auto, CRM_ContentAndPictures — 단어 모델의 유형 결정 여부는 문서 콘텐츠 인식 사용 여부에 따라 달라집니다.
  • CRM_ContentOnly — 단어 모델의 유형은 전혀 결정되지 않습니다.

사용 위치

IObjectsExtractionParams::SourceContentReuseMode