메인 콘텐츠로 건너뛰기

왜 이미지를 개선해야 할까요?

이미지 품질 개선 작업에는 두 가지 측면이 있습니다. 한편으로는 OCR에 더 적합하도록 이미지 품질을 개선해야 합니다. intro_KeyFeatures_ImageProcessing1 다른 한편으로는 이미지의 외관도 개선해야 합니다. 이는 예를 들어 문서 이미지를 아카이브에 저장할 때 필요합니다. intro_KeyFeatures_ImageProcessing2 ABBYY 기술은 문서 분석 및 인식에 중점을 두고 있으므로, 이 시스템에는 적응형 이진화, 왜곡 보정, 텍스트 줄 정렬, 맞은편 페이지 분할 등 강력한 이미지 전처리 기술이 포함되어 있습니다. 정확한 OCR 결과를 얻기 위해 타사 도구는 필요하지 않습니다. ABBYY는 OCR에 최적화된 완전한 전처리 기술 세트를 제공합니다.

이미지 전처리

이미지를 수신하면 ABBYY FineReader Engine은 이후 인식 또는 보관 작업을 위해 문서 이미지의 품질을 개선하는 다양한 이미지 전처리 기능을 수행합니다:

이 문서 이미징 기능은 문서 페이지의 스캔 방향을 알 수 없거나 방향이 제각각일 수 있는 대량 이미지 입력 환경에서 특히 중요합니다. 시스템은 각 페이지의 방향을 자동으로 감지하고 필요한 경우 이를 보정합니다.

이 기능은 책의 왼쪽 및 오른쪽 페이지를 펼친 상태(더블 스프레드)로 스캔할 때 사용됩니다. 페이지를 두 개로 분할하여 각각이 책의 한 페이지에 대응하도록 하면 인식 품질이 향상됩니다. 이후 각 페이지에 대해 인식 및 레이아웃 분석이 개별적으로 수행되며, 필요한 경우 기울기 보정도 함께 적용됩니다.

이 기능은 이미지 기울기 보정이 필요한 스캔 문서에 적용되는 필수 문서 이미징 기능입니다. 기준 테두리나 선이 없어도 동작합니다. 새로운 ABBYY FineReader Engine 12는 검은색 사각형 쌍, 선, 텍스트 줄 등 다양한 방법으로 이미지 기울기를 보정할 수 있습니다.

스캔하거나 촬영한 책에서 텍스트를 캡처할 때 텍스트 줄이 고르지 않아 OCR 처리가 어려울 수 있습니다. ABBYY 기술은 정확한 텍스트 인식을 위해 기울기를 보정하고 텍스트 줄을 직선으로 펴는 특수 알고리즘을 제공합니다.

품질이 낮거나 보통 수준의 문서를 스캔하면 점이나 반점이 많이 포함된 노이즈가 심한 이미지가 생성될 수 있습니다. 이러한 반점이 문자나 숫자 근처에 나타나면 OCR 품질에 영향을 줄 수 있습니다. 이 기능은 해당 노이즈를 제거합니다. 제거할 반점의 크기는 사용자가 직접 지정할 수 있습니다. 이미지 전체는 물론 이미지 내 개별 블록(또는 영역)에도 적용할 수 있습니다.

이 기술은 디지털 사진을 자동으로 식별하고 디지털 카메라 촬영 시 흔히 발생하는 왜곡을 보정합니다. 시스템은 왜곡된 텍스트 줄, 사다리꼴 3D 왜곡, 초점 불량, 번짐, 두꺼운 책의 맞쪽 페이지 어두운 영역, 빛 반사, ISO 노이즈 등 디지털 이미지에서 흔히 나타나는 결함을 인식합니다. 이러한 결함은 시스템이 자동으로 보정하므로 사용자가 별도의 타사 애플리케이션을 사용할 필요가 없습니다.

intro_KeyFeatures_ImageProcessing3

텍스처 필터링 기술은 컬러 및 텍스처와 같은 배경 “노이즈”를 제거하여 신문 용지, 컬러 문서, 팩스, 복사본 등 판독하기 어려운 문서의 인식 정확도를 높입니다.

intro_KeyFeatures_ImageProcessing4

이미지를 흑백으로 변환하고 노이즈, 배경, 텍스처를 제거하여 선명한 텍스트를 얻는 프로세스입니다. 이 프로세스는 최상의 OCR 품질을 보장하며, 각 영역에 필요한 파라미터를 개별적으로 식별합니다. 얇은 신문지의 경우 뒷면에 인쇄된 텍스트가 스캔 이미지에 비쳐 보일 수 있는데, 적응형 이진화는 이러한 텍스트를 제거합니다.

혁신적인 적응형 이진화 기술은 인식 과정에서 각 이미지 영역의 밝기 임계값을 동적으로 조정합니다. 개별 인식 파라미터를 적용하여 회색조 또는 컬러 가변 대비 배경과 텍스처가 있는 문서에서도 정확한 인식 결과를 제공합니다.

매우 작은 점을 사용하여 회색조 이미지를 이진화하는 방법입니다. 문서가 더 많은 음영을 가진 것처럼 보이게 하여 문서의 시각적 품질을 향상시킵니다.

이진 이미지용 필터

이미지 확대/축소

낮은 해상도(120 dpi 미만)로 스캔된 문서나 작은 글꼴(10 pt 미만)이 포함된 문서의 경우, 더 나은 OCR 품질을 위해 이미지를 디지털 방식으로 확대할 수 있습니다.

참고 자료

주요 기능