ABBYY FineReader Engine은 엔진을 세부적으로 조정할 수 있는 다양한 매개변수를 지원합니다. 대부분의 경우 모든 값을 직접 설정할 필요는 없습니다. 새 객체의 속성은 생성 시 적절한 기본값으로 설정되며, 주요 사용 시나리오를 위해 충분히 검증된 미리 정의된 프로필도 제공합니다.
시나리오가 더 구체적이고, 최적의 처리 속도와 품질을 위한 설정을 결정했다면 사용자 프로필을 만드세요. 이미지 전처리, 분석, 인식, 합성, 내보내기와 관련된 모든 매개변수는 프로필을 통해 변경할 수 있습니다. 예를 들어 애플리케이션이 인식 결과를 TXT(서식 없는 일반 텍스트)로 내보내는 경우, 많은 레이아웃 관련 속성은 중요하지 않으므로 비활성화할 수 있습니다.
엔진 객체의 LoadPredefinedProfile/LoadProfile 메서드를 사용해 프로필을 로드하면, 새로 생성되는 객체의 속성은 해당 프로필에 지정된 기본값으로 설정됩니다.
ABBYY FineReader Engine은 주요 사용 시나리오를 위해 설계된 미리 정의된 프로필 세트를 제공합니다. 대부분의 프로필은 두 가지 형태로 제공됩니다. 하나는 최상의 결과 문서 품질에 맞게 최적화된 형태이고, 다른 하나는 가장 빠른 처리 속도에 맞게 최적화된 형태입니다. 미리 정의된 모든 프로필의 전체 사양은 미리 정의된 프로필 사양을 참조하세요.
| |
|---|
| 문서에서데이터를 추출하여 구조화된 형식으로 표현하는 데 적합합니다. 표, 그림, 체크 표시, 필기 등 모든 객체가 위치 및 속성과 함께 저장됩니다. 이 프로필은 추출된 데이터를 추가 처리하거나 다른 애플리케이션과 통합하는 데 최적입니다. |
| 문서를 편집 가능한 형식(예: RTF, DOCX)으로변환하는 데 적합합니다. 설정이 정확도에 최적화되어 있습니다: - 최고 품질. 글꼴 스타일 감지 및 문서 논리 구조의 완전한 합성을 활성화합니다.
|
| 문서를 편집 가능한 형식(예: RTF, DOCX)으로변환하는 데 적합합니다. 설정이 처리 속도에 최적화되어 있습니다: - 최고 품질. 글꼴 스타일 감지 및 문서 논리 구조의 완전한 합성을 활성화합니다.
- 이미지 방향이 보정되지 않습니다.
- 문서 분석 프로세스 속도가 향상됩니다.
|
| 전자 아카이브생성(PDF, PDF/A, MRC 적용 PDF 및 PDF/A로 변환)에 적합합니다. 설정이 정확도에 최적화되어 있습니다: - 이미지에 포함된 텍스트를 포함하여 이미지에서 최대한 많은 텍스트를 감지하는 기능을 활성화합니다.
- 문서 논리 구조의 완전한 합성은 수행되지 않습니다.
이 프로필은 문서를 RTF, DOCX 또는 텍스트 전용 PDF로 변환하는 용도로는 사용할 수 없습니다. 해당 목적에는 문서 변환 프로필을 사용하십시오. |
| 전자 아카이브생성(PDF, PDF/A, MRC 적용 PDF 및 PDF/A로 변환)에 적합합니다. 설정이 처리 속도에 최적화되어 있습니다: - 이미지에 포함된 텍스트를 포함하여 이미지에서 최대한 많은 텍스트를 감지하는 기능을 활성화합니다.
- 기울기 보정이 수행되지 않습니다.
- 문서 논리 구조의 완전한 합성은 수행되지 않습니다.
- 문서 분석 및 인식 프로세스 속도가 향상됩니다.
이 프로필은 문서를 RTF, DOCX 또는 텍스트 전용 PDF로 변환하는 용도로는 사용할 수 없습니다. 해당 목적에는 문서 변환 프로필을 사용하십시오. |
| 문서에서텍스트를 추출하는 데 적합합니다. 설정이 정확도에 최적화되어 있습니다: - 저품질의 작은 텍스트 영역을 포함하여 이미지의 모든 텍스트를 감지하는 기능을 활성화합니다(그림 및 표는 감지되지 않음).
- 문서 논리 구조의 완전한 합성은 수행되지 않습니다.
텍스트는 사람이 읽는 순서와 동일한 순서로 추출되므로, 자연어 처리(NLP) 엔진을 활용한 학습 및 처리 시 데이터 일관성이 보장됩니다. 이 프로필은 문서를 RTF, DOCX 또는 텍스트 전용 PDF로 변환하는 용도로는 사용할 수 없습니다. 해당 목적에는 문서 변환 프로필을 사용하십시오. |
| 문서에서텍스트를 추출하는 데 적합합니다. 설정이 처리 속도에 최적화되어 있습니다: - 저품질의 작은 텍스트 영역을 포함하여 이미지의 모든 텍스트를 감지하는 기능을 활성화합니다(그림 및 표는 감지되지 않음).
- 문서 논리 구조의 완전한 합성은 수행되지 않습니다.
- 문서 분석 및 인식 프로세스 속도가 향상됩니다.
텍스트는 사람이 읽는 순서와 동일한 순서로 추출되므로, 자연어 처리(NLP) 엔진을 활용한 학습 및 처리 시 데이터 일관성이 보장됩니다. 이 프로파일은 문서를 RTF, DOCX 또는 텍스트 전용 PDF로 변환하는 용도로는 사용할 수 없습니다. 해당 목적에는 문서 변환 프로파일을 사용하십시오. |
| 짧은텍스트 조각 인식에 적합합니다. 현재 이 프로파일은 기본 설정을 사용합니다. |
| 바코드 추출에 적합합니다. 바코드만 추출하며 텍스트, 그림 또는 표는 감지되지 않습니다. 정확도에 최적화된 설정이 적용되어 있습니다. 호환성을 위해 이 프로파일은
BarcodeRecognition 이름으로도 액세스할 수 있습니다. |
| 바코드 추출에 적합합니다. 바코드만 추출하며 텍스트, 그림 또는 표는 감지되지 않습니다. 처리 속도에 최적화된 설정이 적용되어 있습니다. |
| 전체 문서를 이미지로 저장한 고압축 PDF 파일을 생성하는 데 적합합니다. 다음 설정이 사용됩니다: - 문서 인식 및 문서의 논리적 구조 합성이 수행되지 않습니다.
- 기울기 보정이 수행되지 않습니다.
- PDF 내보내기는 결과 파일의 크기를 최소화하도록 최적화되어 있습니다.
- 전체 문서가 이미지로 저장됩니다 (PEM_ImageOnly모드).
|
| 명함 인식에 적합합니다. 다음 설정이 사용됩니다: - 명함만 감지합니다.
- 저품질의 작은 텍스트 영역을 포함하여 이미지의 모든 텍스트를 감지합니다 (그림 및 표는 감지되지 않음).
- 해상도 보정이 수행됩니다.
- 문서의 논리적 구조에 대한 전체 합성이 수행되지 않습니다.
|
| 기계 판독 영역(MRZ)에서 데이터를 추출하는 데 적합합니다. 다음 설정이 사용됩니다: - 이미지의 모든 텍스트를 감지하고 추출합니다 (그림, 벡터 그래픽 및 표는 감지되지 않음).
- 해상도 및 기하학적 보정이 자동으로 수행됩니다.
|
| 기술 도면 인식에 적합합니다. 엔지니어링 다이어그램의 큰 크기와 복잡성, 그리고 이미지 내 다양한 텍스트 방향을 고려합니다. 이 프로파일은 해당 이미지를 검색 가능한 PDF 형식으로 변환하기 위한 용도입니다. 다음 설정이 사용됩니다: - 수직 방향의 텍스트 블록을 포함하여 이미지의 모든 텍스트를 감지합니다.
- 문서의 논리적 구조에 대한 전체 합성이 수행되지 않습니다.
이 프로파일은 문서를 RTF, DOCX 또는 텍스트 전용 PDF로 변환하는 용도로는 사용할 수 없습니다. 해당 목적에는 문서 변환 프로파일을 사용하십시오. |
| 모든 처리 매개변수를 기본값으로 설정합니다. |
이러한 프로필과 함께 제공되는 설정은 엔진 객체의 LoadPredefinedProfile 메서드를 사용하여 불러올 수 있습니다. 프로필을 불러온 후 새로 생성되는 객체에는 프로필에 지정된 새 기본값이 적용됩니다.
- Linux용 FRE 사용자는 배포 패키지의 Bin Libraries 폴더에서 미리 정의된 프로필 파일을 찾을 수 있습니다.
- macOS용 FRE 사용자는 배포 패키지의 /PredefinedProfiles 폴더에서 미리 정의된 프로필 파일을 찾을 수 있습니다.
- FREngineDistribution.csv 파일을 사용해 애플리케이션이 작동하는 데 필요한 리소스 파일 집합을 확인하려면, 선택한 시나리오에 해당하는 페이지를 참조하십시오.
사용자 지정 사용자 프로필을 만들 수도 있습니다. 프로필 파일의 구문은 *.ini 파일의 구문과 비슷합니다. 줄을 세미콜론으로 시작하면 주석을 추가할 수 있습니다.
섹션에는 대괄호로 묶인 객체 이름이 들어가고, 키에는 해당 속성과 새 값이 들어갑니다. UserData라는 특수 섹션에는 사용자가 정의한 임의의 키를 포함할 수 있습니다. 형식이 서로 다른 속성은 다음 형식으로 작성할 수 있습니다.
- 부울 속성 값은
true 또는 false 문자열로 표시됩니다.
- 열거형 속성 값은 상수 이름으로 표시됩니다.
- 문자열 속성 값은 따옴표 없이 작성됩니다.
예를 들면 다음과 같습니다:
[PrepareImageMode]
RasterizeFreeText = false
[PDFExportParams]
TextExportMode = PEM_ImageOnText
; 이것은 주석입니다
[RecognizerParams]
TextLanguage = English,Russian
[TextExportParams]
TabSeparator = \t
엔진 객체의 LoadProfile 메서드를 사용하면 사용자 프로필 파일을 로드할 수 있습니다. 사용자 프로필이 로드되면 새로 생성되는 객체의 속성은 프로필에 지정된 값으로 설정됩니다. 프로필에서 매개변수를 로드하는 것은 프로그램 코드에서 해당 속성을 설정하는 것과 비슷하지만, 애플리케이션 로직을 단순화할 수 있습니다. 입력값으로 빈 string을 사용해 LoadProfile을 호출하면 표준 기본값이 사용됩니다.
해당 객체를 생성할 때 속성의 새 값이 올바른지, 그리고 라이선스에 부합하는지가 확인됩니다.
프로필 파일은 다음 객체의 모든 속성을 다시 지정하는 데 사용할 수 있습니다:
1 RecognizerParams 객체의 UserPatternsFile 속성은 구분자로 해당 슬래시 문자를 사용한 패턴 파일의 전체 경로만 허용한다는 점에 유의하세요. 경로 값은 따옴표로 묶지 않아야 합니다. 예를 들어 Windows에서는 다음과 같습니다:
[RecognizerParams]
UserPatternsFile = C:\folder\file.ptn
Linux의 경우: /home/user/Documents/Patterns/, macOS의 경우: /Users/user/Documents/
2 PictureExportParams 또는 PaperSizeParams 객체의 속성을 설정하려면, 매개변수를 PictureExportParams 또는 PaperSizeParams 섹션이 아니라 내보내기 파라미터 객체의 해당 섹션에 직접 지정합니다. 이렇게 하면 내보내기 형식별로 서로 다른 설정을 사용할 수 있습니다. 예를 들어, RTF 파일에 회색조 그림 형식을 지정하려면 다음과 같이 합니다:
[RTFExportParams]
GrayPictureFormats = GPF_Png
3 DocumentContentInfoWritingParams 객체의 속성을 설정하려면 해당 매개변수를 상위 객체의 섹션에 직접 지정합니다. PDF 형식의 경우 상위 객체는 PDFExportFeatures 객체이고, 다른 형식의 경우에는 해당 내보내기 매개변수 객체입니다. 따라서 내보내기 형식별로 서로 다른 콘텐츠 정보 설정을 지정할 수 있습니다. 예를 들어, 출력 PDF 파일에 문서 작성자 정보를 기록하지 않으려면 프로필에 다음 줄을 삽입합니다.
[PDFExportFeatures]
WriteAuthor = false
4 PageMargins 객체의 속성을 설정하려면 부모 객체의 해당 섹션에 매개변수를 직접 지정합니다. 페이지 여백 값을 지정하기 전에 UseCustomPageMargins 속성을 TRUE로 설정해 먼저 지정해야 합니다:
[RTFExportParams]
UseCustomPageMargins = true
PageMargins.Left = 5000
PageMargins.Right = 5000
PageMargins.Top = 5000
PageMargins.Bottom = 5000
미리 정의된 프로필과 사용자 프로필 함께 사용하기
미리 정의된 프로필 하나와 사용자 프로필 하나를 동시에 로드할 수 있습니다. 사용자 프로필은 미리 정의된 프로필보다 우선 적용됩니다. 즉, 사용자 프로필에서 미리 정의된 프로필과 동일한 매개변수를 설정한 경우에는 사용자 프로필의 값이 사용됩니다.
미리 정의된 프로필을 하나 더 로드하면 새 프로필이 이전 미리 정의된 프로필을 대체합니다. 마찬가지로 새 사용자 프로필은 이전 사용자 프로필을 대체합니다. 프로필을 로드하면 현재 인식 세션이 초기화된다는 점에 유의하세요(IEngine::CleanRecognizerSession 메서드를 호출하는 것과 동일함).
전처리, 분석, 인식 및 합성의 매개변수 조정
내보내기 매개변수 조정