메인 콘텐츠로 건너뛰기
PDF 형식은 데이터 저장을 위해 전자 아카이브에서 자주 사용됩니다. 활용도가 높고 이미지와 텍스트를 모두 유지할 수 있어 널리 선호되는 형식입니다. ABBYY에서 개발한 기술을 사용하면 인식된 텍스트를 PDF 및 PDF/A 형식으로 저장할 수 있습니다. 아카이빙의 주요 목표 중 하나는 데이터 품질 저하 없이 파일 크기를 최대한 줄이는 것입니다. PDF 및 PDF/A 파일의 크기를 최소화하기 위해 MRC(Mixed Raster Content)라는 특수 압축 기술이 사용됩니다.

Linux 및 Windows용 PDF 입력

지능형 PDF 처리

ABBYY FineReader Engine은 원본 PDF 파일의 다음과 같은 내부 정보를 분석합니다.

  • 주석,
  • 메타데이터,
  • 텍스트 객체,
  • 글꼴 사전
  • 콘텐츠 스트림

SDK는 효율적이고 정확한 텍스트 선택을 통해 PDF 변환 성능과 속도를 향상시킵니다. PDF 파일에 텍스트가 포함되어 있으면 OCR 엔진은 텍스트 레이어의 무결성을 검사한 후, 텍스트를 추출할지 아니면 블록별로 OCR을 적용할지를 결정합니다.

내부 PDF 정보 추출

내부 PDF 링크, 하이퍼링크와 함께 제목, 작성자, 주제, 키워드 등의 문서 속성을 추출합니다.

입력 PDF 문서에 적용된 제한 사항은 문서 가져오기 및 처리에 영향을 줍니다. 예를 들어, 텍스트 복사가 허용되지 않으면 해당 PDF 문서는 처리되지 않습니다. 처리할 PDF 파일이 복사 방지 설정으로 보호되어 있지 않은지 확인하십시오.

PDF 출력

PDF 보안 및 암호화 지원

ABBYY FineReader Engine 12는 다양한 PDF 보안 설정을 지원하므로, 높은 수준의 보안을 요구하는 정부 기관 및 기타 조직에도 폭넓게 활용할 수 있습니다.

  • 문서에 대한 무단 액세스를 방지하기 위한 “파일 열기” 암호 설정.
  • 권한 암호를 지정하여 인쇄, 편집, 파일 내용 추출과 같은 특정 작업을 제한.
  • 최신 암호화 표준 지원.

intro_KeyFeatures_PDFConversion

태그된 PDF 형식으로 출력

태그된 PDF는 다양한 페이지 또는 화면 너비에 맞게 “리플로우”할 수 있습니다. 휴대용 장치(PDA)나 시각 장애인이 주로 사용하는 스크린 리더와 함께 사용하기에 적합합니다.

페이지 크기

PDF 변환 중 출력 파일의 모든 페이지에 대한 크기를 설정할 수 있습니다.

메타데이터 내보내기

ABBYY FineReader Engine 12는 메타데이터(북마크, 하이퍼링크, 상호 참조 등) 내보내기를 지원합니다.

PDF/A 형식으로 변환

페이지 기반 문서를 장기간 보존하기 위한 표준으로 권장되는 PDF/A 형식으로 변환할 수 있습니다.

ABBYY 기술을 사용하면 서로 다른 준수 수준의 PDF/A 형식(PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/A-2b, PDF/A-2u, PDF/A-3a, PDF/A-3b, PDF/A-3u)으로 문서를 저장할 수 있습니다.

PDF/A-1a 형식의 특징은 다음과 같습니다. 문서 서식, 논리 구조 및 일반적인 외관을 가장 잘 유지하며, 다양한 크기의 디스플레이에서도 문서 외관을 유지할 수 있습니다(이를 위해 문서 내용이 특정 방식으로 구성됨).

PDF/A-1b 형식은 문서의 외관만 재현하는 데 사용됩니다.

PDF/A-2a, PDF/A-2b 및 PDF/A-2u 형식은 JPEG 2000 이미지 압축, 투명도 및 레이어를 지원합니다. 차이점은 PDF/A-2u에서는 모든 텍스트에 Unicode 매핑이 적용된다는 점입니다.

PDF/A-3a, PDF/A-3b 및 PDF/A-3u 형식은 모든 형식의 문서(예: Excel, Word, HTML, CAD, XML)를 PDF 문서에 첨부할 수 있도록 지원합니다.

PDF/UA 형식으로 변환

ABBYY FineReader Engine 12는 PDF/UA 표준을 준수하는 PDF 내보내기를 지원합니다. PDF/UA 형식은 태그된 PDF와 보조 기술을 지원합니다.

CJK를 PDF로 내보내기

중국어(간체 및 번체), 일본어, 한국어 문서를 PDF 형식으로 변환할 수 있습니다.

PDF (PDF/A) MRC 압축

PDF 및 PDF/A 파일 크기를 최소화하기 위해 MRC(Mixed Raster Content)라는 특수 압축 기술이 사용됩니다. intro_KeyFeatures_PDFConversion2 문서 이미지 파일은 일반적으로 배경 때문에 용량이 매우 크며, 배경이 파일 크기의 최대 90%를 차지하는 경우도 많습니다. 하지만 결과 문서에서는 이러한 배경이 불필요할 수 있습니다. 중요한 것은 텍스트와 그림입니다. MRC 압축 기술을 사용하면 컬러 배경을 찾아 삭제하거나 매우 높은 수준으로 압축할 수 있습니다. 이렇게 하면 흰색 배경 위에 텍스트와 그림만 남게 되어 파일 크기가 줄어듭니다. 그림 객체(도표, 그래프, 로고, 사진, 그림, 스탬프, 서명 등)도 약간 압축되지만, 품질이 떨어지지 않는 범위에서만 압축됩니다. MRC 기술은 문서에서 서로 비슷한 문자의 윤곽을 분석하고, 평균 문자 템플릿을 만든 다음 개별 문자 대신 이를 사용합니다. 그 결과 텍스트의 일부 결함이 보정되고 문자 윤곽이 더욱 정교해져 가독성이 향상됩니다. 그 결과, 이전보다 더 보기 좋으면서도 더 작은 이미지를 얻을 수 있습니다. 결과 문서에는 눈에 거슬리지 않는 단조로운 배경과 선명한 텍스트 및 그림이 포함됩니다. 이러한 문서의 “재구성”은 조명 불량, 초점이 맞지 않은 사진, 잘못된 스캔/촬영 매개변수, 어두운 비도포 용지 또는 문서 노후화 등으로 인해 저품질 이미지를 다뤄야 할 때 유용할 수 있습니다. 이러한 요인들로 인해 이미지에는 어두운 배경과 불필요한 질감이 생깁니다. 텍스트는 흐릿하게 보이고 읽기 어려워집니다. MRC 기술을 사용하면 문서의 외관을 개선하면서 파일 크기를 JPEG보다 최대 8~10배까지 줄일 수 있습니다.

쉽고 간편한 PDF 변환

ABBYY FineReader Engine은 개발자가 각자의 요구에 맞는 최적의 PDF 변환 모드를 선택할 수 있도록 특수 도구를 제공합니다.
PDF 내보내기 시나리오설명
MaxQuality결과 파일의 품질을 최고 수준으로 얻을 수 있도록 PDF(PDF/A) 내보내기를 최적화합니다.
BalancedPDF(PDF/A) 내보내기는 결과 파일의 품질, 파일 크기, 처리 시간 사이의 균형을 맞춥니다.
MinSize결과 파일의 크기를 최소화할 수 있도록 PDF(PDF/A) 내보내기를 최적화합니다.
MaxSpeed처리 속도를 최대한 높일 수 있도록 PDF(PDF/A) 내보내기를 최적화합니다.

참고 항목

주요 기능