2019/08/23

, ,

PhotoZoom Pro로 스캔한 이미지의 가독성과 OCR 인식률 높이기

PhotoZoom Pro로 스캔한 이미지의 가독성과 OCR 인식률 높이기

이미지 확대/축소를 도와주는 전문 프로그램

예전에 「300dpi 스캔 이미지를 600dpi로 업샘플링하여 가독성 높이기」라는 방법을 소개했었다. 이것은 300DPI 스캔이 600DPI 스캔보다 속도 면에서는 빠르지만, 스캔 결과물의 가독성이 600DPI보다 떨어진다는 단점을 포토샵 보정으로 어느 정도 해결할 수 있다는 점을 소개하고 있다. 하지만, 여러 사정으로 포토샵을 사용할 수 없는 사람에게 같은 효과를 줄 수 있는 괜찮은 프로그램이 있어 소개하고자 한다. 바로 BenVista PhotoZoom Pro이라는 이미지 확대 및 축소 전문 프로그램이다.

PhotoZoom Pro를 이용하면 이미지 편집 프로그램에 익숙하지 않은 초보자라도 몇 번의 클릭만으로 손쉽게 300dpi 문서를 600dpi로 업샘플링할 수 있다. 그뿐만 아니라 PhotoZoom Pro는 이미지를 확대 및 축소하는 과정에서 생길 수 있는 왜곡이나 손실을 바로잡기 위한 S-Spline Max 같은 독창적인 알고리즘을 지원한다. 특히 S-Spline Max 기술을 사용하여 업샘플링하면 가독성을 높임과 동시에 OCR 인식률도 높일 수 있다. 한마디로 일거양득이다.

Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<확실히 눈에 띄는 가독성>
Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<300DPI 원본 OCR 결과>
Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<600DPI 보정 후 OCR 결과>
Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<PhotoZoom Pro은 포토샵처럼 일괄 처리도 지원>

장점이 있으면 단점도 있는 법

하지만, PhotoZoom Pro에겐 치명적인 단점이 있다. 바로 결과물의 파일 크기가 포토샵을 사용하여 업샘플링했을 때보다 비약적으로 증가한다는 점이다. 예를 들어 스크린샷에 사용된 테스트 파일은 300dpi로 스캔한 183KB의 TIFF 파일이다. 이것을 스크린샷 설정을 이용하여 600dpi로 업샘플링한 다음 TIFF로 저장하면 파일 크기가 3M를 훌쩍 넘어선다. 포토샵으로 작업하면 300KB~700KB(어떤 필터를 얼마만큼 사용하느냐에 따라 차이가 난다) 정도이다. 둘 다 일괄 처리를 지원하지만, 작업 속도는 포토샵이 훨씬 빠르다. 참고로 PhotoZoom Pro은 GPU 가속을 지원한다고는 하는데, 내 노트북의 A10-4600M APU에서는 사용할 수 있는 GPU가 없다고 나오는 것으로 보아 OpenGL이나 OpenCL이 아닌 NVIDIA의 CUDA만을 지원하는 것 같다.

하지만, (내 보정 실력이 허접해서 일지도 모르겠지만) 포토샵 결과물보다 PhotoZoom Pro 결과물이 OCR 인식률은 조금 더 높다. 파일 크기에 개의치 않고, 매우 좋은 CPU를 사용하면서 포토샵을 사용할 줄 모르는 사용자가 사용하기에 딱 좋은 프로그램이다. 이미지 파일 크기가 커질수록 PDF 파일 크기도 증가하지만, ABBYY FineReader 같은 경우 PDF 저장 옵션에서 DPI나 이미지 압축률을 조절하여 파일 크기를 어느 정도 줄일 수는 있다.

최종적으로 PhotoZoom Pro을 사용해 300DPI로 스캔한 문서를 600DPI로 업샘플링했을 때의 장 • 단점을 요약해 보면 다음과 같다.

★ 장점

1. 누구라도 사용할 수 있는 편의성.

2. 부담 없는 프로그램 크기.

3. 기본적인 설정만으로도 높은 가독성과 높은 OCR 인식률 보장.

★ 단점

1. 파일 크기가 커짐(개선이 필요해 보임).

2. 포토샵에 비해 느린 작업 속도.

3. 유료 프로그램(구글링으로 해결 가능).

비록 보잘 것 없지만 광고 수익(Ad revenue)은 블로거의 콘텐츠 창작 의욕을 북돋우는 강장제이자 때론 하루하루를 이어주는 즐거움입니다

Share:

0 comments:

댓글 쓰기

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요