문서 비교
| 새로운 “문서 비교” 모듈 | 문서의 무결성을 빠르게 검증할 수 있도록, ABBYY FineReader Engine의 새로운 “문서 비교” 모듈은 동일한 문서의 두 버전 간 콘텐츠 차이를 감지할 수 있습니다. |
|---|---|
| 이중 언어 문서 비교 | 새로운 “문서 비교” 모듈 옵션은 이러한 문서의 이중 언어 특성과 복잡한 Layout을 자동으로 감지하고, 각 열(즉, 각 언어 버전)을 개별적으로 비교할 수 있는 기능을 제공합니다. |
Linux 및 Windows에서 Office 형식 파일 입력
Office 문서 처리 | FineReader Engine은 다양한 이미지 형식뿐 아니라, 이제 Office 문서 형식으로 작성된 입력 문서도 처리할 수 있습니다.
|
메모리에서 Office 문서 열기 | Microsoft Office 및 Apache OpenOffice 파일을 메모리에서 직접 여는 새로운 방법을 사용하면 문서 가져오기 단계의 속도를 높일 수 있으므로, 전체 문서 처리 속도도 향상됩니다. |
MRZ 캡처
| 기계 판독 영역(MRZ) 데이터 캡처 | 이 새로운 기능을 사용하면 신분증의 기계 판독 영역(MRZ)에서 데이터를 자동으로 추출하고, 고객 온보딩 또는 본인 확인 과정에서 개인 데이터를 더 빠르게 입력하고 검증할 수 있습니다. |
|---|
개선된 일본어 OCR
| 탁월한 인식 정확도 | ABBYY Fine Reader 엔진의 새 버전으로 일본어 OCR이 크게 향상되어, 대부분의 솔루션으로는 이전까지 달성할 수 없었던 새로운 수준의 인식 정확도를 구현했습니다. |
|---|
향상된 아랍어 OCR
| 저품질 이미지의 아랍어 엔드투엔드 인식 | 범용 기술로는 오류가 많고 신뢰도가 낮은 결과가 나오는 저품질 이미지의 아랍어 OCR |
|---|
향상된 한국어 OCR
| 한국어용 딥러닝 언어 모델 | 한국어로 학습된 모델은 인식 후보 가운데 가장 적합한 단어 형태를 선택하거나, 인식 문맥(앞뒤 단어)을 바탕으로 새로운 형태를 생성하기도 합니다. |
|---|
OCR 기술의 개선 사항 | OCR 기술에 신경망 접근 방식을 도입해 ABBYY FineReader Engine의 손글씨 및 손으로 쓴 라틴 문자 처리 기능이 향상되었습니다.
|
머신 러닝 바코드 인식 기술 | 이 신경망 아키텍처는 바코드의 대략적인 영역을 감지하고 분류한 뒤, 가능성이 가장 높은 바코드 유형이 포함된 영역을 출력하는 새로운 바코드 인식 모델을 도입합니다. |
새로운 인식 모드 | 새 Accurate 모드를 사용하면 인식 속도가 다소 느려지는 대신 출력 문서의 품질을 최대한 높일 수 있습니다. 이 모드는 품질이 낮거나 사진으로 생성된 송장, 계약서, 영수증 및 ID 카드에 가장 적합합니다. |
도장 및 서명 근처 텍스트의 OCR 품질 개선
| 도장 및 서명 근처 텍스트 감지 | 계약서에 도장이나 서명이 포함된 경우, 그 주변의 텍스트를 도장 및 서명과 분리해 인식하여 문서 처리 품질을 향상합니다. |
|---|
새로운 라이선싱 옵션
| Network 및 Standalone 환경에서 Online License 사용 | FineReader Engine 12용 Developer’s Help에 SDK 라이선스 부여의 다양한 방법에 대한 정보가 추가되어, 각 라이선싱 옵션 유형을 이해하기 쉬운 비교 표로 설명합니다. |
|---|---|
| 유예 기간 사용 | 새로운 옵션을 사용하면 고객은 만료일 이후에도 일정 기간 동안 ABBYY FineReader Engine 라이선스를 사용할 수 있으므로 라이선스 유효 기간을 연장할 수 있습니다. |
Linux 및 macOS 버전의 ICR 및 OMR 기술
| 손글씨 텍스트 및 체크 표시 인식 | ABBYY FineReader Engine 12를 사용하면 손글씨, 정자로 쓴 문자, 그리고 다양한 유형의 체크 표시를 인식할 수 있습니다. ICR 및 OMR 기술이 구현되어 있어 손글씨 문서에서 데이터를 추출하고 새로운 데이터 추출 솔루션을 개발할 수 있습니다. |
|---|
| 새로운 배포 옵션 | 새로운 라이선스 유형을 통해 가상 및 클라우드 환경에 배포할 수 있으므로 더 폭넓은 솔루션을 제공할 수 있습니다. 라이선스 메커니즘은 인터넷 연결이 필요하며 프록시 서버를 지원합니다. <Note> Linux 및 Windows용 FineReader Engine에 적용됩니다. </Note> |
|---|
| 새로운 개발 프레임워크 | 컨테이너 및 기타 네이티브 환경을 활용하는 널리 사용되는 소프트웨어 개발 및 배포 방식에서 개발 팀의 효율성을 높이기 위해 ABBYY FineReader Engine은 이제 사전 빌드된 .NET Core 6 래퍼를 제공합니다. |
|---|
| NeoML 라이브러리 사용 | NeoML은 머신 러닝 모델을 구축, 학습, 배포할 수 있는 오픈 소스 엔드투엔드 머신 러닝 프레임워크입니다. 이 프레임워크는 이미지 전처리, 분류, 문서 Layout 분석, OCR, 구조화된 문서와 비정형 문서에서의 데이터 추출을 포함한 컴퓨터 비전 및 자연어 처리 작업에 사용됩니다. |
|---|---|
| PDF 처리용 내장 PDFium | PDFium은 PDF 표준을 준수하는 크로스 플랫폼 네이티브 라이브러리로, 처리, 구문 분석, 렌더링, 출력 생성 등 PDF와 관련된 모든 작업을 제어합니다. |
| NLP 및 머신 러닝을 사용한 문서 분류 | ABBYY FineReader Engine 12를 사용하면 들어오는 문서를 서로 다른 범주로 자동 분류할 수 있습니다. 머신 러닝, OCR 및 자연어 처리 기술을 사용해 대표 문서를 기반으로 이미지 기반 및 텍스트 기반 분류기를 학습시킵니다. 이렇게 얻은 정보는 이후 분류 단계에서 사용됩니다. |
|---|---|
| 텍스트 기반 분류기: 향상된 학습 데이터 보안 | 텍스트 기반 분류기를 학습시키고 최적화하려면 각 문서 범주를 나타내는 문서를 가져와야 합니다. 이러한 문서에 포함된 데이터를 보호하기 위해 적용된 해싱 알고리즘은 샘플 문서로부터 정보를 복구할 수 없도록 합니다. |
| 향상된 분류 데모 샘플 | ABBYY FineReader Engine은 PDF, 스캔하거나 촬영한 문서 이미지뿐만 아니라 Office 형식의 문서도 처리할 수 있습니다. 이러한 기능을 분류 프로세스에 반영하기 위해 제공되는 사전 컴파일된 데모 샘플이 향상되어 이제 PDF 및 이미지 형식에 더해 Office 문서도 가져올 수 있습니다. |
명령줄 인터페이스(CLI)용 코드 샘플
| 바로 사용할 수 있는 코드 샘플 | 이 코드 샘플을 사용하면 개발자는 ABBYY FineReader Engine 라이브러리를 효율적으로 활용하고, 명령줄 기반 애플리케이션에 문서 처리 기능을 통합할 수 있습니다. |
|---|
| 디지털 생성 PDF 파일 처리 | AuxInfo는 PDF 파일의 메타데이터 정보를 제공하는 PDFium의 보조 객체입니다. ABBYY R&D PDFTools 팀은 PDFium과 함께 작동하는 자체 AuxInfo 객체를 구현했습니다. |
|---|
개선된 PDF 처리
”혼합” 콘텐츠가 포함된 PDF 관련 | ABBYY FineReader Engine은 이미지 전용 페이지와 디지털 원본 페이지가 함께 포함된 PDF 문서를 처리하기 위한 새로운 기능을 제공합니다:
|
PDF에서 추가 콘텐츠 활용 | PDF 콘텐츠를 보다 유연하게 구성할 수 있도록 ABBYY FineReader Engine은 새로운 옵션을 제공합니다:
|
| 페르시아어 OCR | ABBYY FineReader Engine은 업데이트되고 개선된 페르시아어 인식 옵션을 제공하여 이란, 아프가니스탄 및 기타 여러 중동 국가의 문서를 더욱 효과적으로 처리할 수 있도록 합니다. |
|---|---|
| 조지아어 OCR | 조지아어가 새로운 OCR 언어로 추가되었습니다. |
| 간단한 수학 수식용 OCR | 간단한 수학 수식의 문자를 추출할 수 있어, 텍스트 안에 단순한 한 줄짜리 수학 수식이 포함된 과학 문서를 더 정확하게 인식할 수 있습니다. |
| 버마어 OCR 기술 미리 보기 | 향후 기능을 선보이기 위해 버마어 OCR이 기술 미리 보기로 추가되었습니다. |
| 아랍어 및 일본어 날짜 인식을 위한 특수 언어 | FineReader Engine for Windows는 field 인식을 위한 특수 언어를 지원합니다. 새 버전에서는 아랍어와 일본어 날짜 인식이 개선되었습니다. |
| 벵골어 OCR 기술 미리 보기 | 잠재적인 기능을 보여 주기 위해 벵골어 OCR이 기술 미리 보기로 추가되었습니다. |
향상된 문서 Layout 재현
| 향상된 표 재구성 | ABBYY FineReader Engine 12를 사용하면 문서에서 추출한 표가 이전보다 훨씬 더 정확하게 서식을 유지합니다. |
|---|---|
| 균형 잡힌 열 감지 및 재현 | 문서에 균형 잡힌 텍스트 열(예: 계약서, 학술 논문, 기사 등)이 포함된 경우, 이제 원래 구조가 그대로 유지되어 문서 처리가 한층 간소화됩니다. |
| 새로운 “단일 열” 문서 모델 | 새 알고리즘의 주요 개선 사항은 표와 차트의 감지 및 분석입니다. |
| 향상된 표 구조 분석 | 개선된 문서 변환 메커니즘을 통해 ABBYY FineReader Engine은 “Accounting” 형식의 숫자 열이 있는 표도 감지할 수 있습니다. |
더 빠른 처리를 위한 내부 프로세스 최적화
| ILayout 객체 반복의 새로운 방식 | 메인 프로세스 외부에서 문서를 처리한 후 얻은 ILayout 객체를 더 빠르게 반복 처리할 수 있는 새로운 방식입니다. <Note> FineReader Engine for Linux and Windows에 적용됩니다. </Note> |
|---|
Windows용 FRE의 새로운 스캔 옵션
향상된 스캔 기능 | ABBYY FineReader Engine 12는 다양한 장치 기반 스캔 기능을 제공합니다.
|
| 온라인에서 제공되는 설명서 | 기본 제공 설명서 외에도 이제 ABBYY FineReader Engine의 기능과 지원 범위에 대한 “just in time” 정보를 제공하는 온라인 버전을 사용할 수 있습니다. |
|---|
Windows용 FRE의 최신 .NET Framework 버전
.NET COM Interop 래퍼 지원 | 이제 배포 패키지에 다음 .NET Framework 버전용 .NET COM Interop 래퍼가 포함됩니다.
|
| JSON | JSON(JavaScript Object Notation)은 속성-값 쌍과 배열 데이터 형식으로 이루어진 데이터 객체를 전송하기 위한 개방형의 언어 독립적 파일 형식입니다. 이제 FineReader Engine은 OCR 결과를 JSON 형식으로 내보낼 수 있습니다. |
|---|---|
| 새로운 ALTO 버전 | ALTO(Analyzed Layout and Text Object)는 책이나 신문의 페이지와 같은 물리적 텍스트 리소스의 Layout과 콘텐츠를 설명하는 기술 메타데이터를 정의하는 XML 스키마입니다. FineReader Engine 12는 이 스키마의 최신 버전(4.0, 4.1, 4.2)을 지원합니다. |
| PDF/A-2b 및 PDF/A-3b | PDF/A는 전자 문서의 아카이빙 및 장기 보존에 특화된 Portable Document Format(PDF)의 ISO 표준 버전입니다. 이제 FineReader Engine은 모든 PDF/A 적합성 수준을 지원합니다. |
