릴리스 7
보안 수정 사항
미리 정의된 프로필
이미지 열기 및 전처리
- 이미지 준비 속도를 높이려면 문서 유형(IPrepareImageMode::DocumentType)을 미리 알고 있을 때 이를 설정해 문서 분류기를 실행하지 않아도 됩니다.
- 새로운 입력 형식: HEIF, SVG, WebP.
- 다양한 방향의 짧은 텍스트가 많이 포함된 엔지니어링 도면용 문서 유형(DocumentTypeEnum::DT_TechnicalDrawing).
내보내기
- 이제 문서에서 추출한 데이터를 JSON 형식으로 내보낼 수 있습니다(JsonExportParams).
OCR 및 ICR 개선 사항
- 이제 레이아웃 분석 중 체크 표시를 감지할 수 있습니다(IPageAnalysisParams::DetectCheckmarks)
- 복잡한 레이아웃과 표가 포함된 문서를 위한 특수 분석 모드(IPageAnalysisParams::AnalysisMode)
- 새 설정을 사용하면 스탬프를 이미지로 저장할 수 있습니다(IPageAnalysisParams::DetectStamps)
- 영어, 스페인어, 프랑스어, 독일어, 일본어에서 정자체뿐 아니라 손글씨도 인식됩니다(IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- 문자 인식 정확도를 추정하는 새로운 확률 기반 속성(IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Windows 코드 샘플
- .NET Core용 새로운 HelloBCR 샘플
- .NET Core용 새로운 DataExtraction 샘플
릴리스 5
새롭고 향상된 언어 인식
- 벵골어 인식
- Windows에서의 Arabic_Amount 특수 언어 인식
OCR 및 ICR 개선 사항
- 이제 추가 매개변수를 사용해 명함 합성을 수행할 수 있습니다(IFRPage::SynthesizeBusinessCardEx, ISynthesisParamsForPage::BusinessCardSynthesisParams)
- 이제 새로운 Accurate 인식 모드를 사용할 수 있습니다(IRecognizerParams::Mode)
- 우편용을 제외한 바코드의 존재 여부를 확인하는 새 속성(IBarcodeParams::EnableBarcodesCheck)
- 이제 BT_AutodetectWithoutPostal 상수를 사용해 우편용을 제외한 바코드 유형을 감지할 수 있습니다(BarcodeTypeEnum)
- 이제 ABBYY FineReader Engine에서 일본 우편 고객 코드를 인식합니다(BarcodeTypeEnum, Barcode Types)
이미지 열기 및 전처리
- 이제 이전에 지원된 ABBYY FineReader Engine 버전에서 저장한 문서를 로드할 수 있습니다(IFRDocument::ConvertFromOldVersion)
- 문서에 디지털 서명이 있는지 여부에 대한 정보를 확인할 수 있습니다(IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- 이제 텍스트 레이어의 신뢰성을 검사할 수 있습니다(IFRDocument::CheckTextLayer)
- 디지털 방식으로 생성된 PDF 파일 처리의 기본 모드가 개선되었습니다(SourceContentReuseModeEnum::CRM_Auto)
- 이제 출력 PDF 파일의 표시 방식을 변경할 수 있습니다(ITextLayerInjectionParams::AllowChangePDFAView)
- 이제 PDF Portfolio 유형의 파일을 식별하고 열 수 있습니다(IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
내보내기
- 이제 ALTO 내보내기에서 ALTO 버전 4.0, 4.1, 4.2를 지원합니다(AltoVersionEnum)
- 출력 PDF 파일에 글꼴을 포함하는 새로운 모드가 추가되었습니다(FontEmbeddingModeEnum)
- 사용자 지정 그림을 출력 PDF에 추가할 수 있는 새 인터페이스가 추가되었습니다(IPDFPictures, IPDFPicture)
- 이제 Linux 및 macOS에서 문서를 XLS 및 XPS 형식으로 내보낼 수 있습니다(XLExportParams, XPSExportParams)
코드 샘플
- .NET Core용 새 Hello 샘플
기타 개선 사항
- 문서 객체에 할당된 메모리 크기 정보를 확인할 수 있습니다(IFRDocument::AllocatedSize)
- Linux 및 Windows에서 Online License를 해제하기 위한 새로운 옵션이 추가되었습니다(IEngine::ReleaseOnlineLicense, License Manager utility의 “Release Online Licenses…”)
- 이제 Windows용 ABBYY FineReader Engine installer는 Windows Installer XML Toolset(WiX)를 사용합니다
- Windows에서 보조 정보 저장에 사용되는 폴더를 변경할 수 있는 새로운 LICENSEDATADIR 옵션이 추가되었습니다(Installing the ABBYY FineReader Engine Library in Automatic Mode)
- 이제 Windows에서 ABBYY FineReader Engine 12를 Azure Services 내에서 실행할 수 있습니다
- 이제 처리된 페이지 수 제한 라이선스의 갱신 날짜를 확인할 수 있습니다(ILicense::VolumeRefreshingDate)
- Linux에서 루트가 아닌 사용자로 Licensing Service를 실행하는 방법을 설명하는 새 하위 섹션이 추가되었습니다(Installing the Licensing Service)
릴리스 4
특수 기능
- 두 문서 또는 두 페이지를 비교할 수 있습니다(IComparator::CompareDocuments, IComparator::ComparePages)
- Document Comparison API 메서드를 사용하면 텍스트 변경 사항을 감지하고(IChange::GetAsTextChange) 비교 결과를 XML 또는 DOCX 형식으로 내보낼 수 있습니다(IComparisonResult::Export)
- Windows에서 ABBYY ScanDifFinder SDK를 사용하는 코드를 ABBYY FineReader Engine에 구현된 Document Comparison API로 업그레이드할 수 있습니다(Migration Guide from ScanDifFinder SDK to Document Comparison API)
OCR 및 ICR 개선 사항
- 새로 지원하는 우편 바코드: KIX, Royal Mail 4-State, Australian Post 4-State (BarcodeTypeEnum, 바코드 유형)
이미지 열기 및 전처리
- 문서 Layout은 스트림에 저장하거나 스트림에서 읽을 수 있으며(ILayout::SaveToStream, IEngine::CreateLayoutFromStream), 바이트 배열로도 저장할 수 있습니다(ILayout::SaveToArray)
내보내기
- PDF로 내보내기에서는 페이지 방향 설정(IPDFExportFeatures::PageOrientation)을 지원합니다
- RTF로 내보내기에서는 페이지 여백 조정(IRTFExportParams::PageMargins)과 내용이 페이지에 맞지 않을 경우 페이지 크기 확대(IRTFExportParams::IncreasePaperSizeToFitContent)를 지원합니다
- XLSX로 내보내기에서는 출력 문서에 이미지를 포함하는 기능(IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)을 지원합니다
코드 샘플
- 새로운 Document Comparison Windows 데모 도구와 Document Comparison 샘플이 추가되었습니다. 이를 통해 한 문서 또는 페이지를 다른 문서나 페이지와 비교하는 방법을 확인할 수 있습니다.
- Linux 및 Windows용 CommandLineInterface 샘플이 업데이트되었습니다.
- macOS용 새로운 CommandLineInterface 샘플이 추가되었습니다. 이 샘플은 ABBYY FineReader Engine의 명령줄 인터페이스를 제공합니다.
- macOS용 새로운 SAFEARRAY_Hello 샘플이 추가되었습니다. 이 샘플은 SAFEARRAY 형식을 사용한 문서 처리를 보여 줍니다.
기타 개선 사항
Linux 및 Windows
- Online License는 하나의 워크스테이션에서 사용할 수 있는 CPU 코어 수를 제한합니다.
- 이제 Online License를 사용하려면 Licensing Service가 설치된 컴퓨터에서 GoDaddy Trusted Root Certification Authority를 사용해야 합니다.
- Linux용 무인 설치 매개변수 목록이 업데이트되었습니다.
릴리스 3
특수 기능
- 이제 문서 이미지에서 MRZ를 추출할 수 있습니다(IFRPage::ExtractMrz)
- MRZ에서 추출한 데이터에는 문서와 소지자에 대한 정보가 포함된 field와 라인(MrzField, MrzData, MrzLine)이 포함되며, XML 파일 또는 JSON 파일로 내보낼 수 있습니다
새롭고 개선된 언어 인식
- 조지아어 인식
- 수학 수식 언어 인식
이미지 열기 및 전처리
- 이제 Linux 및 Windows에서 이미지를 여는 것과 동일한 방법으로 디지털 원본 문서를 열 수 있으며, 해당 문서는 변환되어 내용이 로드됩니다(OfficeConversionSettings, OfficeConverters)
- 이미지 전처리 중 이진화 임곗값을 설정할 수 있습니다(IPrepareImageMode::BinarizationThreshold)
- Linux 및 Windows에서 입력 이미지를 변환하기 전에 메모리에서 문서 페이지를 처리하는 모드를 설정할 수 있습니다(IBatchProcessor::PageFlushingPolicy)
내보내기
- 이제 생성 날짜와 수정 날짜를 확인하고 변경할 수 있습니다. 또한 출력 문서에 날짜를 기록하는 방식을 설정할 수 있습니다(DocumentContentInfo::CreationDate, DocumentContentInfo::ModificationDate, DocumentContentInfoWritingParams::WriteCreationDate, DocumentContentInfoWritingParams::WriteModificationDate). 올바른 형식의 날짜만 문서에 기록할 수 있습니다. 내보내기 중 오류가 발생하면 날짜를 올바른 형식으로 지정하거나 기록 방식을 변경한 다음 export 메서드를 다시 호출하십시오(Handling Errors During PDF/XPS Export)
- 출력 문서에서 원본 시간 형식 지원(TimeZoneTypeEnum)
코드 샘플
- Linux 및 Windows용 새로운 MRZExtraction 샘플. 이 샘플은 기계 판독 영역(MRZ)에서 데이터를 추출하는 방법을 보여줍니다.
- 메서드 호출에 너무 오랜 시간이 걸릴 경우 처리를 중단하는 타이머를 구현하는 방법을 보여주는 새로운 Windows 코드 샘플
- 이미지 문서의 필기 텍스트를 인식하는 방법을 보여주는 Linux용 새로운 ICR 샘플
기타 개선 사항
- 이제 데이터 블록을 위치 기준으로 정렬할 수 있습니다(ILayout::SortedBlocks)
- 이제 ABBYY FineReader Engine Distribution Kit에서 End User License Agreement 파일을 제공됩니다
Linux 및 Windows
- 이제 Linux용 ABBYY FineReader Engine에서 Amazon Linux AMI를 지원합니다
- Online License는 별도의 설정이 필요하지 않지만, 라이선스를 프록시 서버를 통해 사용하려면 관련 매개변수를 설정해야 합니다
- 이제 제한된 수의 연결에 대해서도 Online License를 사용할 수 있으며, 이 연결 수는 라이선스의 автоном 작동 시간이 종료된 후 변경할 수 있습니다
- 이제 ABBYY FineReader Engine 12를 Docker 컨테이너 내에서 실행할 수 있습니다
- 지원되는 Java Development Kit 목록은 System Requirements에 나와 있습니다
- 이제 모듈을 로드하기 전에 ABBYY FineReader Engine의 빌드 번호를 확인할 수 있습니다. 이 정보는 ABBYY FineReader Engine Distribution Kit에 포함된 JAR 파일 이름에서 확인할 수 있습니다
릴리스 2
특수 기능
- 업데이트된 분류 기술은 이미지 특징, 인식된 텍스트의 특성 또는 이미지와 텍스트 특성의 조합을 기준으로 분류를 지원합니다(ClassifierTypeEnum)
- 이제 문서와 페이지 모두에 대해 분류를 사용할 수 있습니다(IClassificationEngine::CreateObjectFromDocument, IClassificationEngine::CreateObjectFromPage)
- 새 분류 모델은 k-겹 교차 검증 기법을 사용해 학습할 수 있으며(ValidationParams), 모델 성능에 대한 자세한 정보도 제공합니다(ValidationResult)
새로 추가되고 개선된 언어 인식
- 버마어 인식
- 일부 라틴 문자나 그리스 문자가 포함된 일본어 텍스트를 더 정확하게 인식할 수 있도록 일본어(현대) 언어가 개선되었습니다. 이제 Business Card Recognition에서도 사용할 수 있습니다
- 페르시아어 OCR 업데이트
OCR 및 ICR 개선 사항
- 모든 문자 인식 변형에 대한 좌표 정보가 제공됩니다 (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
이미지 열기 및 전처리
- 이제 전처리 중에 이미지를 문서 경계에 맞게 자동으로 자를 수 있습니다 (IPagePreprocessingParams::CropImage)
- 인식 품질을 향상시키기 위해 노이즈 감소 필터를 적용할 수 있습니다 (IImageDocument::ApplySigmaFilter)
- 이미지에서 기준점으로 사용되는 검은 사각형을 찾을 수 있습니다 (IImageDocument::FindBlackSquares)
내보내기
- PDF 버전 2.0 내보내기를 지원합니다
- 텍스트 레이어 삽입은 태그된 PDF 파일을 지원하며, Windows에서는 PDF/A 표준 준수도 지원합니다
- Windows의 PDF 내보내기는 RC4 외에도 AES-256 암호화와 PDF/A-2b 및 PDF/A-3b 준수를 지원합니다(IPDFExportParams::PDFAComplianceMode)
- Linux의 PDF 내보내기는 RC4와 AES-128 외에도 AES-256 암호화(IPDFEncryptionInfo::EncryptionAlgorithm)와 PDF/A-2b 및 PDF/A-3b 준수를 지원합니다(IPDFExportParams::PDFAComplianceMode)
- ZUGFeRD 준수 PDF를 완벽하게 지원: IPDFExportFeatures::EnableZugferdCompliance를 TRUE로 설정하여 내보낸 문서는 이제 공식 ZUGFeRD 유효성 검사기를 통과합니다
- Excel로 내보내기는 오른쪽에서 왼쪽으로 진행되는 워크시트 방향을 지원합니다(IXLExportParams::CreateRtlSheets)
- 이제 ALTO로 내보낼 때 ALTO 버전 3.1을 지원합니다(IAltoExportParams::AltoVersion)
- RTF 내보내기에서는 구분자 필터링을 비활성화하여 출력에 더 많은 구분자를 유지할 수 있습니다(IRTFExportParams::FilterSeparators)
- DOCX 점선 구분자 지원 개선
- HTML 5.0 지원(HTMLFormatModeEnum의 HFM_Format50 상수)
- PDF/UA 준수 문서 지원(IPDFExportFeatures::EnablePDFUACompliance)
- TXT로 내보내기용 고급 Layout 에뮬레이션 모드(ITextExportParams::LayoutRetentionMode)
스캐닝 API (Windows)
- 이제 용지 크기와 스캔 컬러 모드를 자동으로 감지할 수 있습니다(ScanPaperSizeEnum::SPS_Auto, ScanColorModeEnum::SCM_Auto)
- 스캐너가 이러한 기능을 지원하는 경우, 스캔하는 동안 빈 페이지를 건너뛰고 이미지 기울어짐을 자동으로 보정할 수 있습니다(IScanSourceSettings::DiscardBlankPages, IScanSourceSettings::CorrectSkew)
코드 샘플
- 모든 유형의 문서를 분류하는 Classification (Windows) 및 Classification (Linux 및 macOS) 새 코드 샘플
- Java용 Windows EnginesPool 샘플 업데이트
- C++ 및 Java용 새 Linux 코드 샘플 Hello (Outproc) 및 Multithreading. 이 샘플은 엔진이 별도 프로세스에 외부 프로세스 서버로 로드된 상태에서 이미지를 처리하는 방법을 보여 줍니다
- 새 Linux SAFEARRAY_Hello 샘플. 이 샘플은 SAFEARRAY 형식을 사용한 문서 처리를 보여 줍니다
Linux 및 Windows 관련 기타 개선 사항
- Windows에서 멀티스레드 Java 애플리케이션에서 FineReader Engine을 사용하는 더 쉬운 방법 (Java 래퍼에 EnginesPool 구현 추가)
- Online License를 포함한 모든 라이선스 유형에 대해 엔진 로드 절차가 통합되어, 라이선스 유형을 전환할 때 코드를 다시 작성할 필요가 없습니다. InitializeEngine 및 IEngineLoader::InitializeEngine을 참조하세요. (Windows)
- 이제 Linux에서 C++로 멀티스레드 애플리케이션을 구현할 수 있습니다
