메인 콘텐츠로 건너뛰기

문서 비교

새로운 “문서 비교” 모듈문서의 무결성을 빠르게 검증할 수 있도록, ABBYY FineReader Engine의 새로운 “문서 비교” 모듈은 동일한 문서의 두 버전 간 콘텐츠 차이를 감지할 수 있습니다.
이중 언어 문서 비교새로운 “문서 비교” 모듈 옵션은 이러한 문서의 이중 언어 특성과 복잡한 Layout을 자동으로 감지하고, 각 열(즉, 각 언어 버전)을 개별적으로 비교할 수 있는 기능을 제공합니다.

Linux 및 Windows에서 Office 형식 파일 입력

Office 문서 처리

FineReader Engine은 다양한 이미지 형식뿐 아니라, 이제 Office 문서 형식으로 작성된 입력 문서도 처리할 수 있습니다.

  • 텍스트 문서: .doc, .docx, .rtf, .htm / .html, .txt, .odt
  • 표: .xls, .xlsx, .ods
  • 프레젠테이션: .ppt, .pptx, .odp

메모리에서 Office 문서 열기

Microsoft Office 및 Apache OpenOffice 파일을 메모리에서 직접 여는 새로운 방법을 사용하면 문서 가져오기 단계의 속도를 높일 수 있으므로, 전체 문서 처리 속도도 향상됩니다.

MRZ 캡처

기계 판독 영역(MRZ) 데이터 캡처이 새로운 기능을 사용하면 신분증의 기계 판독 영역(MRZ)에서 데이터를 자동으로 추출하고, 고객 온보딩 또는 본인 확인 과정에서 개인 데이터를 더 빠르게 입력하고 검증할 수 있습니다.

개선된 일본어 OCR

탁월한 인식 정확도ABBYY Fine Reader 엔진의 새 버전으로 일본어 OCR이 크게 향상되어, 대부분의 솔루션으로는 이전까지 달성할 수 없었던 새로운 수준의 인식 정확도를 구현했습니다.

향상된 아랍어 OCR

저품질 이미지의 아랍어 엔드투엔드 인식범용 기술로는 오류가 많고 신뢰도가 낮은 결과가 나오는 저품질 이미지의 아랍어 OCR

향상된 한국어 OCR

한국어용 딥러닝 언어 모델한국어로 학습된 모델은 인식 후보 가운데 가장 적합한 단어 형태를 선택하거나, 인식 문맥(앞뒤 단어)을 바탕으로 새로운 형태를 생성하기도 합니다.
새로운 신경망 기반 OCR 기술

OCR 기술의 개선 사항

OCR 기술에 신경망 접근 방식을 도입해 ABBYY FineReader Engine의 손글씨 및 손으로 쓴 라틴 문자 처리 기능이 향상되었습니다.

  • 일관되고 정확한 단어 형태 선택을 위한 언어 모델
  • 다국어 문서 처리를 위한 라틴 문자 엔드투엔드 인식

머신 러닝 바코드 인식 기술

이 신경망 아키텍처는 바코드의 대략적인 영역을 감지하고 분류한 뒤, 가능성이 가장 높은 바코드 유형이 포함된 영역을 출력하는 새로운 바코드 인식 모델을 도입합니다.

새로운 인식 모드

새 Accurate 모드를 사용하면 인식 속도가 다소 느려지는 대신 출력 문서의 품질을 최대한 높일 수 있습니다. 이 모드는 품질이 낮거나 사진으로 생성된 송장, 계약서, 영수증 및 ID 카드에 가장 적합합니다.

도장 및 서명 근처 텍스트의 OCR 품질 개선

도장 및 서명 근처 텍스트 감지계약서에 도장이나 서명이 포함된 경우, 그 주변의 텍스트를 도장 및 서명과 분리해 인식하여 문서 처리 품질을 향상합니다.

새로운 라이선싱 옵션

Network 및 Standalone 환경에서 Online License 사용FineReader Engine 12용 Developer’s Help에 SDK 라이선스 부여의 다양한 방법에 대한 정보가 추가되어, 각 라이선싱 옵션 유형을 이해하기 쉬운 비교 표로 설명합니다.
유예 기간 사용새로운 옵션을 사용하면 고객은 만료일 이후에도 일정 기간 동안 ABBYY FineReader Engine 라이선스를 사용할 수 있으므로 라이선스 유효 기간을 연장할 수 있습니다.

Linux 및 macOS 버전의 ICR 및 OMR 기술

손글씨 텍스트 및 체크 표시 인식ABBYY FineReader Engine 12를 사용하면 손글씨, 정자로 쓴 문자, 그리고 다양한 유형의 체크 표시를 인식할 수 있습니다. ICR 및 OMR 기술이 구현되어 있어 손글씨 문서에서 데이터를 추출하고 새로운 데이터 추출 솔루션을 개발할 수 있습니다.
클라우드 환경에서 엔진을 실행하는 기능
새로운 배포 옵션새로운 라이선스 유형을 통해 가상 및 클라우드 환경에 배포할 수 있으므로 더 폭넓은 솔루션을 제공할 수 있습니다. 라이선스 메커니즘은 인터넷 연결이 필요하며 프록시 서버를 지원합니다. <Note> Linux 및 Windows용 FineReader Engine에 적용됩니다. </Note>
Windows용 FRE의 .NET Core 래퍼
새로운 개발 프레임워크컨테이너 및 기타 네이티브 환경을 활용하는 널리 사용되는 소프트웨어 개발 및 배포 방식에서 개발 팀의 효율성을 높이기 위해 ABBYY FineReader Engine은 이제 사전 빌드된 .NET Core 6 래퍼를 제공합니다.
ABBYY FineReader Engine의 새로운 라이브러리
NeoML 라이브러리 사용NeoML은 머신 러닝 모델을 구축, 학습, 배포할 수 있는 오픈 소스 엔드투엔드 머신 러닝 프레임워크입니다. 이 프레임워크는 이미지 전처리, 분류, 문서 Layout 분석, OCR, 구조화된 문서와 비정형 문서에서의 데이터 추출을 포함한 컴퓨터 비전 및 자연어 처리 작업에 사용됩니다.
PDF 처리용 내장 PDFiumPDFium은 PDF 표준을 준수하는 크로스 플랫폼 네이티브 라이브러리로, 처리, 구문 분석, 렌더링, 출력 생성 등 PDF와 관련된 모든 작업을 제어합니다.
향상된 문서 분류
NLP 및 머신 러닝을 사용한 문서 분류ABBYY FineReader Engine 12를 사용하면 들어오는 문서를 서로 다른 범주로 자동 분류할 수 있습니다. 머신 러닝, OCR 및 자연어 처리 기술을 사용해 대표 문서를 기반으로 이미지 기반 및 텍스트 기반 분류기를 학습시킵니다. 이렇게 얻은 정보는 이후 분류 단계에서 사용됩니다.
텍스트 기반 분류기: 향상된 학습 데이터 보안텍스트 기반 분류기를 학습시키고 최적화하려면 각 문서 범주를 나타내는 문서를 가져와야 합니다. 이러한 문서에 포함된 데이터를 보호하기 위해 적용된 해싱 알고리즘은 샘플 문서로부터 정보를 복구할 수 없도록 합니다.
향상된 분류 데모 샘플ABBYY FineReader Engine은 PDF, 스캔하거나 촬영한 문서 이미지뿐만 아니라 Office 형식의 문서도 처리할 수 있습니다. 이러한 기능을 분류 프로세스에 반영하기 위해 제공되는 사전 컴파일된 데모 샘플이 향상되어 이제 PDF 및 이미지 형식에 더해 Office 문서도 가져올 수 있습니다.

명령줄 인터페이스(CLI)용 코드 샘플

바로 사용할 수 있는 코드 샘플이 코드 샘플을 사용하면 개발자는 ABBYY FineReader Engine 라이브러리를 효율적으로 활용하고, 명령줄 기반 애플리케이션에 문서 처리 기능을 통합할 수 있습니다.
PDF 메타데이터 추출기 구현
디지털 생성 PDF 파일 처리AuxInfo는 PDF 파일의 메타데이터 정보를 제공하는 PDFium의 보조 객체입니다. ABBYY R&D PDFTools 팀은 PDFium과 함께 작동하는 자체 AuxInfo 객체를 구현했습니다.

개선된 PDF 처리

”혼합” 콘텐츠가 포함된 PDF 관련
개선 사항

ABBYY FineReader Engine은 이미지 전용 페이지와 디지털 원본 페이지가 함께 포함된 PDF 문서를 처리하기 위한 새로운 기능을 제공합니다:

  • PDF 처리의 품질과 속도를 높여 주는 적응형 인식
  • 출력 형식에서 품질이 좋은 텍스트 레이어를 유지하기 위한 텍스트 레이어 품질 분류기
  • PDF 내 디지털 서명 존재 여부 표시
  • 혼합 콘텐츠가 포함된 문서를 처리하기 위한 새로운 콘텐츠 재사용 모드

PDF에서 추가 콘텐츠 활용

PDF 콘텐츠를 보다 유연하게 구성할 수 있도록 ABBYY FineReader Engine은 새로운 옵션을 제공합니다:

  • PDF 포트폴리오를 열어 그 안의 콘텐츠 처리
  • 출력 PDF에 사용자 지정 이미지를 추가하고 배치 위치 관리
추가 언어 지원
페르시아어 OCRABBYY FineReader Engine은 업데이트되고 개선된 페르시아어 인식 옵션을 제공하여 이란, 아프가니스탄 및 기타 여러 중동 국가의 문서를 더욱 효과적으로 처리할 수 있도록 합니다.
조지아어 OCR조지아어가 새로운 OCR 언어로 추가되었습니다.
간단한 수학 수식용 OCR간단한 수학 수식의 문자를 추출할 수 있어, 텍스트 안에 단순한 한 줄짜리 수학 수식이 포함된 과학 문서를 더 정확하게 인식할 수 있습니다.
버마어 OCR 기술 미리 보기향후 기능을 선보이기 위해 버마어 OCR이 기술 미리 보기로 추가되었습니다.
아랍어 및 일본어 날짜 인식을 위한 특수 언어FineReader Engine for Windows는 field 인식을 위한 특수 언어를 지원합니다. 새 버전에서는 아랍어와 일본어 날짜 인식이 개선되었습니다.
벵골어 OCR 기술 미리 보기잠재적인 기능을 보여 주기 위해 벵골어 OCR이 기술 미리 보기로 추가되었습니다.

향상된 문서 Layout 재현

향상된 표 재구성ABBYY FineReader Engine 12를 사용하면 문서에서 추출한 표가 이전보다 훨씬 더 정확하게 서식을 유지합니다.
균형 잡힌 열 감지 및 재현문서에 균형 잡힌 텍스트 열(예: 계약서, 학술 논문, 기사 등)이 포함된 경우, 이제 원래 구조가 그대로 유지되어 문서 처리가 한층 간소화됩니다.
새로운 “단일 열” 문서 모델새 알고리즘의 주요 개선 사항은 표와 차트의 감지 및 분석입니다.
향상된 표 구조 분석개선된 문서 변환 메커니즘을 통해 ABBYY FineReader Engine은 “Accounting” 형식의 숫자 열이 있는 표도 감지할 수 있습니다.

더 빠른 처리를 위한 내부 프로세스 최적화

ILayout 객체 반복의 새로운 방식메인 프로세스 외부에서 문서를 처리한 후 얻은 ILayout 객체를 더 빠르게 반복 처리할 수 있는 새로운 방식입니다. <Note> FineReader Engine for Linux and Windows에 적용됩니다. </Note>

Windows용 FRE의 새로운 스캔 옵션

향상된 스캔 기능

ABBYY FineReader Engine 12는 다양한 장치 기반 스캔 기능을 제공합니다.

  • 문서에서 빈 페이지 자동 삭제
  • 페이지 자동 자르기
  • 기울어짐 자동 보정
  • 컬러 자동 감지
온라인 설명서
온라인에서 제공되는 설명서기본 제공 설명서 외에도 이제 ABBYY FineReader Engine의 기능과 지원 범위에 대한 “just in time” 정보를 제공하는 온라인 버전을 사용할 수 있습니다.

Windows용 FRE의 최신 .NET Framework 버전

.NET COM Interop 래퍼 지원

이제 배포 패키지에 다음 .NET Framework 버전용 .NET COM Interop 래퍼가 포함됩니다.

  • 3.5 SP1
  • 4.6
  • 4.7
  • 4.8
새로운 내보내기 형식
JSONJSON(JavaScript Object Notation)은 속성-값 쌍과 배열 데이터 형식으로 이루어진 데이터 객체를 전송하기 위한 개방형의 언어 독립적 파일 형식입니다. 이제 FineReader Engine은 OCR 결과를 JSON 형식으로 내보낼 수 있습니다.
새로운 ALTO 버전ALTO(Analyzed Layout and Text Object)는 책이나 신문의 페이지와 같은 물리적 텍스트 리소스의 Layout과 콘텐츠를 설명하는 기술 메타데이터를 정의하는 XML 스키마입니다. FineReader Engine 12는 이 스키마의 최신 버전(4.0, 4.1, 4.2)을 지원합니다.
PDF/A-2b 및 PDF/A-3bPDF/A는 전자 문서의 아카이빙 및 장기 보존에 특화된 Portable Document Format(PDF)의 ISO 표준 버전입니다. 이제 FineReader Engine은 모든 PDF/A 적합성 수준을 지원합니다.

전체 기능