책도 읽고, 영화도 보고, 그리고 일상적인 생각을 쓰고. 이 모든 것을 음악을 들으며.

Recent Comments

레이블이 SCAN인 게시물을 표시합니다. 모든 게시물 표시
레이블이 SCAN인 게시물을 표시합니다. 모든 게시물 표시

2019. 8. 23.

PhotoZoom Pro로 스캔한 이미지의 가독성과 OCR 인식률 높이기

이미지 확대/축소를 도와주는 전문 프로그램

예전에 「300dpi 스캔 이미지를 600dpi로 업샘플링하여 가독성 높이기」라는 방법을 소개했었다. 이것은 300DPI 스캔이 600DPI 스캔보다 속도 면에서는 빠르지만, 스캔 결과물의 가독성이 600DPI보다 떨어진다는 단점을 포토샵 보정으로 어느 정도 해결할 수 있다는 점을 소개하고 있다. 하지만, 여러 사정으로 포토샵을 사용할 수 없는 사람에게 같은 효과를 줄 수 있는 괜찮은 프로그램이 있어 소개하고자 한다. 바로 BenVista PhotoZoom Pro이라는 이미지 확대 및 축소 전문 프로그램이다.

PhotoZoom Pro를 이용하면 이미지 편집 프로그램에 익숙하지 않은 초보자라도 몇 번의 클릭만으로 손쉽게 300dpi 문서를 600dpi로 업샘플링할 수 있다. 그뿐만 아니라 PhotoZoom Pro는 이미지를 확대 및 축소하는 과정에서 생길 수 있는 왜곡이나 손실을 바로잡기 위한 S-Spline Max 같은 독창적인 알고리즘을 지원한다. 특히 S-Spline Max 기술을 사용하여 업샘플링하면 가독성을 높임과 동시에 OCR 인식률도 높일 수 있다. 한마디로 일거양득이다.

Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<확실히 눈에 띄는 가독성>
Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<300DPI 원본 OCR 결과>
Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<600DPI 보정 후 OCR 결과>
Improves OCR recognition and readability of scanned images with PhotoZoom Pro
<PhotoZoom Pro은 포토샵처럼 일괄 처리도 지원>

장점이 있으면 단점도 있는 법

하지만, PhotoZoom Pro에겐 치명적인 단점이 있다. 바로 결과물의 파일 크기가 포토샵을 사용하여 업샘플링했을 때보다 비약적으로 증가한다는 점이다. 예를 들어 스크린샷에 사용된 테스트 파일은 300dpi로 스캔한 183KB의 TIFF 파일이다. 이것을 스크린샷 설정을 이용하여 600dpi로 업샘플링한 다음 TIFF로 저장하면 파일 크기가 3M를 훌쩍 넘어선다. 포토샵으로 작업하면 300KB~700KB(어떤 필터를 얼마만큼 사용하느냐에 따라 차이가 난다) 정도이다. 둘 다 일괄 처리를 지원하지만, 작업 속도는 포토샵이 훨씬 빠르다. 참고로 PhotoZoom Pro은 GPU 가속을 지원한다고는 하는데, 내 노트북의 A10-4600M APU에서는 사용할 수 있는 GPU가 없다고 나오는 것으로 보아 OpenGL이나 OpenCL이 아닌 NVIDIA의 CUDA만을 지원하는 것 같다.

하지만, (내 보정 실력이 허접해서 일지도 모르겠지만) 포토샵 결과물보다 PhotoZoom Pro 결과물이 OCR 인식률은 조금 더 높다. 파일 크기에 개의치 않고, 매우 좋은 CPU를 사용하면서 포토샵을 사용할 줄 모르는 사용자가 사용하기에 딱 좋은 프로그램이다. 이미지 파일 크기가 커질수록 PDF 파일 크기도 증가하지만, ABBYY FineReader 같은 경우 PDF 저장 옵션에서 DPI나 이미지 압축률을 조절하여 파일 크기를 어느 정도 줄일 수는 있다.

최종적으로 PhotoZoom Pro을 사용해 300DPI로 스캔한 문서를 600DPI로 업샘플링했을 때의 장 • 단점을 요약해 보면 다음과 같다.

★ 장점

1. 누구라도 사용할 수 있는 편의성.

2. 부담 없는 프로그램 크기.

3. 기본적인 설정만으로도 높은 가독성과 높은 OCR 인식률 보장.

★ 단점

1. 파일 크기가 커짐(개선이 필요해 보임).

2. 포토샵에 비해 느린 작업 속도.

3. 유료 프로그램(구글링으로 해결 가능).

Share:

2019. 8. 11.

굳이 스캔테일러(ScanTailor)를 사용해서 전자책을 만드는 이유

전자책을 직접 제작해 읽어온 지도 벌써 5년

내가 「종이책을 스캔해서 전자책(PDF) 만들기 ~ 1. 스캔」이란 글을 블로그에 소개한 지도 어느덧 5년이나 흘렀다. 이 글의 요지는 책을 훼손하지 않는 평판 스캐너로 책을 스캔한 다음, 그 결과물을 스캔테일러(ScanTailor)로 보기 좋게 재단한 다음, 포토샵 보정으로 가독성을 높인 다음, 최종적으로 파인리더(ABBYY FineReader)라는 OCR 및 PDF 제작 프로그램으로 나만의 전자책을 만드는 과정을 장장 7편에 걸쳐 소개한 글이다. 그때나 지금이나 난 캐논 복합기에 딸린 스캐너를 이용하고 있다. 참고로 스캔하는데 걸리는 시간은 ‘300DPI/그레이/A4 크기/Text’ 설정에서 스캔하는 데만 걸리는 시간은 6초, 헤드가 되돌아오는 시간까지 모두 합산하면 10초 정도 걸리고, 600DPI에서는 각각 10초/14초 정도 걸린다. 고로 300DPI에서 헤드가 되돌아오는 4초 남짓 동안 재빠르게 다음 페이지를 준비할 수 있다면, 한 시간에 최대 360번 스캔할 수 있다는 말이고 이것은 720페이지 분량에 해당한다. 책이 문고판처럼 크기가 작다면 스캔하는 시간도 그만큼 짧아진다. 하지만, 이것은 어디까지나 이론적인 이야기이고 실제로는 그 절반 정도 예상하면 될 것 같다. 대략 한 시간에 300페이지 이상은 스캔할 수 있다는 말이고, 난 이 작업을 영화나 축구 중계를 보면서 한다.

스캔테일러(ScanTailor)를 고집하는 이유

5년이란 세월이 흘렀지만, 아직도 복합기 스캐너를 사용 중이고, 중간에 한번 완전히 분해해서 평판 안쪽을 닦은 것을 제외하고는 딱히 문제가 된 점은 없다. 그동안 대략 400권의 책을 스캔해서 전자책으로 만들었는데, 권당 평균 페이지 수를 500페이지로 잡으면 대략 10만 번 스캔했다는 말이다. 얼마나 더 만들어야 내구성이 바닥날지 나로서는 알 수가 없다. 스캔 품질 역시 인터넷에 공유된 고가 스캐너의 결과물과 비교해보더라도 ─ 그레이 수준에서는 ─ 딱히 나쁘지 않다. 하지만, 컬러 스캔은 좀 차이가 나는 것 같지만 일반적인 책 스캔에서 컬러는 그다지 중요한 요소가 아닌지라 지금의 복합기 스캐너로도 꽤 만족스러운 전자책을 뽑아낼 수 있다. 다만, 고가의 장비는 편리성에서 압도적 우세하다. 물론 책을 파손해야 한다는 단점은 있지만 말이다.

Why-create-an-e-book-using-ScanTailor
<ABBYY FineReader 14 이미지 사전처리>
Why-create-an-e-book-using-ScanTailor
<ABBYY FineReader [맞붙은 페이지 분할] 오류>
Why-create-an-e-book-using-ScanTailor
<ABBYY FineReader [페이지 방향 교정] 오류>

전자책을 만드는 과정은 5년 전과 비교하면 지금은 좀 달라졌다. 조금이라도 시간을 절약하고 힘을 덜 쓰기 위해 지금은 주로 300dpi로 스캔하고, 소설책보다 글씨가 작은 책들만 특별히 600dpi로 스캔한다. 그리고 포토샵 보정도 생략한다. 그래도 7인치 테블릿으로 보는데 지장은 없다. 하지만, 여전히 스캔테일러(ScanTailor)로 재단하는 과정만큼은 유지하고 있다. 왜냐하면, ABBYY FineReader의 재단 능력, 즉 [맞붙은 페이지 분할]과 [페이지 방향 교정] 능력이 미덥지 못하기 때문이다. Readiris 17의 경우는 페이지 분할 기능이 아예 빠져 있다. Acrobat도 비슷해 보이는데, 이것은 내가 해당 기능을 찾지 못해서일 수도 있다. OCR 프로그램의 재단 기능이 아무리 좋아도 현재로서는 스캔테일러(ScanTailor)로 재단한 파일로 PDF를 만드는 것이 보기에는 가장 깔끔하다.

ABBYY FineReader이나 Readiris 등의 OCR 프로그램들의 페이지 분할 능력이 믿을만하면 이제는 쿼드 코어를 사용하고 있기에 OCR 프로그램에 내장된 스캔 기능을 이용하면 스캔과 OCR 작업을 동시에 진행할 수도 있지만, 그러기 위해서는 OCR 프로그램들의 재단 능력이 좀 더 강화될 필요가 있다. 물론, 이 문제는 스캔 품질에 따라, 그리고 OCR 언어 설정에 따라 다를 수도 있으니 사용자 환경에 따라 다를 수도 있다.

여전히 쓸모 있는 나만의 전자책

요즘은 산책하면서 전자책을 TTS(Text-to-Speech), 즉 음성으로 듣고 있다. 깊이 생각하면서 읽을 필요가 있는 책들을 이런 식으로 듣는 것은 대충 흘려보는 수준이나 다를 바 없어 별로 추천하지는 않지만, 책장을 쉽게 넘길 수 있는 소설 같은 경우는 시간도 절약하고 눈의 피로도 줄일 수 있는 좋은 방법인 것 같다. 그런 고로 나만의 전자책을 만들면 여러모로 쓸모가 있는 것은 여전하다.

Share:

2019. 6. 19.

스캔테일러(ScanTailor) 여백 설정과 태블릿 화면비율

ScanTailor margin settings and tablet aspect ratio
<ScanTailor Advanced 64bit>

여전히 명맥을 이어가는 Advanced 버전

어느덧 스캔테일러(ScanTailor)를 사용하여 나만의 전자책(PDF)을 제작하게 된 것도 5년이란 세월이 지났다. 좀 무리해서 반올림하면 10년인데, 10년이면 강산도 변화는 시간이다. 그만큼 ScanTailor에도 많은 변화가 있었다. 우선 애석하게도 ScanTailor 초기 버전의 업데이트는 오래전에 끝났다는 것. 하지만, 다행인 것은 소스가 공개된 덕분에 몇몇 제작자들이 ScanTailor 기본 기능에 몇 가지 새 기능을 추가한 새 버전을 내놓으면서 그 명맥을 이어오고 있다는 것. 대표적으로 ScanTailor Experimental 버전과 ScanTailor Advanced 버전이 그러하다. 한 번 더 애석하게도 실험 버전은 결국 실험 버전으로 끝났고, 현재는 ScanTailor Advanced 버전이 유일하게 ScanTailor의 대를 이어가고 있다.

Scan Tailor Advanced는 인터페이스 테마가 '다크'하게 변한 것 외에도 64bit 버전과 OpenGL GPU 가속을 지원한다. 이외에도 내가 사용하지 않는 몇 가지 기능이 추가되었다. 하지만, 오리지널 ScanTailor에서 작업한 저장 파일을 불러올 수 없고, 전반적인 편집 속도는 내가 사용하는 AMD APU의 경우에서는 GPU 가속을 지원함에도 오리지널 버전보다 느리다. 하지만, 최종 결과물을 출력하는 작업이나 ‘Output’ 작업 전 ‘Margin’까지의 작업을 처리하는 등의 ‘일괄 처리(batch processing)’ 작업 속도는 멀티 프로세서를 지원하기(편집 작업은 기존처럼 단일 프로세서로 처리)에 오리지널 버전보다 훨씬 빠르다. 어떤 버전을 사용하든 내가 보기에는 최종 결과물에는 큰 차이가 없기에 오리지널 버전과 Advanced 버전 중 마음에 드는 것을 사용하면 된다.

Margin(여백) 설정의 중요성

스캔테일러(Scan ailor)를 처음 사용할 땐 여백(Margin) 설정의 중요성을 크게 깨닫지는 못했다. 여백이 적으면 적은 만큼 태블릿에서 꽉 찬 화면으로 볼 수 있다는 생각만 했다. 그래서 스캔테일러 편집 과정에서 여백은 되도록 적게 잡았다. 물론 이것이 틀린 말은 아니다. 하지만, PDF 리더의 ‘야간 모드’나 안드로이드 5.0 롤리팝부터 추가된 ‘색상 반전’이란 기능으로 검은색과 하얀색이 반전된 상태로 전자책을 볼 때 스크린샷 우측의 Optimus G Pro의 경우처럼 화면비율이(aspect ratio) 맞지 않으면 태블릿(혹은 스마트폰) 상단과 하단에 귀신의 소복 같은 하얀 여백이 들어선다. 색상을 반전시키지 않은 일반 화면에서 이 하얀 여백은 검은색으로 처리되기 때문에 눈에 거슬릴 것은 없지만, 주로 ‘야간 모드’를 애용하는 나로서는 상단과 하단의 하얀 여백이 보통 눈에 거슬리는 것이 아니다. 눈에 거슬릴 뿐만 아니라 건방지게도 혼자 하얗게 빛을 발하고 있으니 눈이 부시다.

ScanTailor margin settings and tablet aspect ratio
<여백과 태블릿 화면비율>
ScanTailor margin settings and tablet aspect ratio
<PDF 편집 프로그램에서의 '페이지 크롭'>

이 조그만 결점을 견디지 못한 나는 PDF의 화면비율을 내가 전자책을 볼 때 주로 사용하는 태블릿(넥서스 7 2013)의 화면비율(이 경우는 16:10)에 맞출 생각을 하게 되었다. 방법은 간단하다. 스캔테일러에서 Margin을 설정할 때 상하좌우 여백을 1cm 이상으로 넉넉하게 잡은 다음 PDF 편집 프로그램의 ‘페이지 크롭’ 기능을 이용해 상하좌우를 16:10 비율에 맞게 적절하게 잘라주면 된다. 스캔테일러에서 비율을 정확하기 맞추지 않고 PDF 편집 프로그램에서 크롭을 하는 이유는 이 방법이 계산하기도 편하고, 마음에 안 들면 언제든지 다시 원래 상태로 복구할 수도 있기 때문이다. 참고로 내가 사용하는 ‘화면 비율 계산기 Aspect Ratio calculator’ 프로그램은 이 블로그에서 받으면 된다.

챕터 그림을 보존을 위한 Output(출력) 설정 방법

스캔테일러(Scan Tailor)로 스캔한 문서나 이미지를 재단할 때 무심코 지나치기 쉬운 것이 ‘챕터’ 페이지다. 보통 챕터(1장, 2장, 3장...) 페이지에는 아래 스크린샷처럼 책을 이해하는 데 꼭 필요한 내용은 아니지만 별스럽게 그림이 첨부되어 있다. 스캔테일러가 자동으로 잡는 Content Box(최종 출력물에 포함할 내용 선택)를 그대로 최종 출력물에 적용해도 하등 문제가 될 것은 없지만, Output(출력)에서 White Margin(사용할 것을 추천)을 사용한다면, Content Box에서 선택된 내용을 제외하고 나머지는 모두 백지로 처리된다. 이 역시 책을 읽고 이해하는 데 전혀 지장은 없지만, 챕터의 그림마저 온전히 전자책으로 옮기고 싶은 완벽주의자에게는 원본과는 달리 썰렁한 챕터는 꽤 신경 쓰이는 부분이다. 물론 최종 Output(출력) 결과물을 포토샵으로 열어 원본 이미지를 적당히 붙여넣으면 그만이지만, 이것은 일일이 수작업으로 해야 하기에 무척이나 번거롭다.

ScanTailor margin settings and tablet aspect ratio
<'White Margin' 사용 예>
ScanTailor margin settings and tablet aspect ratio
<'Content Box'와 'White Margin' 모두를 제거했을 때>

이때 사용할 수 있는 방법이 챕터 페이지의 Content Box를 제거하고 (최종 출력물에 포함할 어떤 내용도 선택하지 않는다는 뜻) 해당 페이지의 Output(출력)에서는 White Margin을 사용하지 않는 것이다. 스캔테일러는 Content Box에서 선택한 내용이 없고, White Margin도 사용하지 않는 페이지는 자동으로 최종 결과물의 페이지 크기에 맞추어 상하좌우를 자른 다음 출력(Output)한다(위 스크린샷 참고). 물론 이것도 모든 챕터 페이지마다 일일이 적용해주어야 하지만, 포토샵을 사용하는 수고보다는 덜하다. 그리고 중요한 것은 포토샵 사용법을 몰라도 적용할 수 있다는 것.

Share:

2016. 7. 15.

평면 스캐너 사용시 책 안쪽까지 깔끔하게 스캔하기

평면 스캐너로 고급스러운 양장 제본이 아닌 일반 서적에 많이 사용되는 무선 제본으로 된 책을 스캔하다 보면 위의 예시처럼 책 가운데가 살짝 들리기 때문에 책 안쪽이 흐릿하게 스캔되는 경우가 종종 있다. 위의 예시에 사용된 책은 안쪽 여백에 여유가 있는 편이라 힘 조절을 잘하면 굳이 책받침을 사용하지 않아도 되지만, 그래도 일일이 스캔 결과를 확인하기는 번거롭기에 책받침을 사용하여 확실히 하고 넘어가는 것이 좋다. 반면에 안쪽 여백의 여유가 없을수록 책받침을 필수적이다 .

나는 책받침으로 두툼한 박스를 적당한 크기로 잘라 사용 중이다. 책받침은 힘을 안쪽까지 균등하게 분배시켜주며 종이를 평평하게 펴주는 역할을 하기 때문에 적은 힘을 들이고도 깔끔한 스캔 결과를 얻을 수 있다 . 그래서 물에 젖었다 마른 것처럼 쭈글쭈글한 종이도 아무런 흔적 없이 깨끗하게 스캔된다. 스캔할 쪽에서 종이 두께에 따라 30~50쪽 뒤나 앞으로 책받침을 책에 삽입한 다음 20쪽 정도 스캔한 다음 다시 앞의 간격으로 책받침을 옮겨 책 사이에 끼우면 된다. 이런 식으로 20쪽마다 한 번씩 스캔 결과물을 확인하면서 안쪽까지 제대로 스캔이 되었는지, 빠진 쪽은 없는지 확인한다.

양장본 혹은 안쪽 여백이 충분한 책이라도 알게 모르게 종이들이 유리에 완전히 밀착되지 않고 살짝 뜨는 경우가 많기에 평면 스캐너로 책을 스캔할 때는 받침대 사용을 적극 추천한다.

이 리뷰는 2016년 7월 15일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015. 12. 15.

포토샵 보정과 OCR 인식률

이번 테스트는 포토샵 보정에 따른 OCR 인식률의 변화다. 참고로 이번 테스트에 사용한 포토샵 보정 액션 OCR.atn은 이 링크에서 다운로드 할 수 있다.

무보정 원본 인식 결과

13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.

14 Apple’s Jobs to Obama: “Jobs aren’t coming back” to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 214-5ᅳ20)

15 “奥巴馬在中國製造下推廣美國製造 ᄎ風吹現眞相”,http://world.huanqiu.com/exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性,因此加强了對數學與工程學的投資”,http://energy.gov/articles/ president-s-council-jobs-and-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5-7)

Color Burn 혼합 후 인식 결과

  • Color Burn 혼합 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.
      14 Apple’s Jobs to Obama: “Jobs aren't coming back” to U.S., http!//www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 2014-5-20)
      15 “奥巴馬在中國製造下推廣美國製造 大風吹現眞相”, http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性, 因此加强了對數學與工程學的投資”,http://energy.gov/articles/ pi.esident-s-coundl—jobs—and—competitiveness-announces-industry-leaders— commiment-double. (검색일: 2014-5-7)

Multiply 혼합 후 인식 결과

  • Multiply 혼합 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.
      14 Apple’s Jobs to Obama: “Jobs aren’t coming back” to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 24-5-20)
      15 “奥巴馬在中國製造下推廣美國製造 ᄎ風吹現眞相”, http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性, 因此加强了對數學與工程學的投資”, http://energy.gov/articles/ president-s-council-jobs-and-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5-7)

Level, Unsharp 보정 후 인식 결과

  • Level, Unsharp 보정 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 치-지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 히씨 못하였거나 취업을 포기함으로써 발생힘-. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포힘-하지 않았음.
      14 Apple's Jobs to Obama: “Jobs aren't coming back" to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 2014-5—20)
      15 “奥巴馬在中國製造下推廣美國製造 大風吹現眞相”,http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到 /去工 業化的嚴합性,因此加强了尉數은工程^的投資",http://energy.gov/articles/ presiclent-s-council-jobs-ancl-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5-7)

High Pass 보정 후 인식 결과

  • High Pass 보정 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.
      14 Apple’s Jobs to Obama: “Jobs aren’t coming back” to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 2ᄋ14-5ᅳ20)
      15 “奥巴馬在中國製造下推廣美國製造 ᄎ風吹現眞相”,http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性,因此加强了對數學與工程學的投資”,http://energy.gov/articles/ president-s-council-jobs-and-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5ᅳ7)

간단한 이번 테스트 결과와 그동안의 경험으로 봐서는 OCR 프로그램의 눈과 사람의 눈은 달랐다. 즉, 사람의 눈에 명확하게 보이는 진하고 선이 굵은 가독성 높은 보정이 오히려 OCR 인식률을 낮추는 결과를 가져오기 때문이다.

한자나 한글 같은 경우 레벨과 언샵 보정 후에는 낮은 인식률을 보여주는 경우가 종종 있다. 지나친 보정은 글자 획을 굵게 만들어 획과 획 사이의 간격을 너무 좁히거나 겹치게 하기 때문에 자잘한 오타를 유발한다. 거꾸로 원본 상태에서는 제대로 인식하지 못한 글자를 레벨/언샵 보정 후 제대로 인식할 때도 있다. 그래서 전체 이미지에 일괄적용하기 전에 반드시 테스트가 필요하며 스캔한 책의 상태나 재질, 글자 크기에 값도 달라질 수밖에 없다. 레벨과 언샵 보정이 비록 OCR 인식률을 낮추는 경우가 있지만, 가독성은 좋아지고 스캔된 먼지나 이미지의 노이즈 같은 군더더기를 없애면서 파일 크기를 대폭 줄여준다는 장점은 있다(아래 그래프 참고).

인식률에 큰 영향을 주지 않는 보정은 블렌딩 모드와 High Pass 보정을 기초로 작업하는 것이며, 오로지 좋은 OCR 결과만을 원한다면 무보정, 또는 Color Burn 혼합(50~100%)을 약간 사용하는 것이다. 그러나 이 설정은 스캐너의 스캔 품질에 따라 달라질 여지가 많아서 OCR 작업 전에 한 페이지 정도 테스트하면서 최적의 보정 값을 얻은 다음 그 값을 전체 이미지에 일괄적용한 다음 OCR 진행하는 것을 추천한다. 참고로 이 테스트에는 ABBYY Finereader 11 버전이 사용되었다.

이 리뷰는 2015년 12월 15일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015. 3. 8.

스캔 DPI에 따른 OCR 인식률 간단 비교 #3 ~ 신문

이번에는 신문으로 시험했다. 예제에 사용된 자료는 화성시 「시정소식지」(2015년 2월) 중에서 다른 소식보다 작은 글자 크기로 인쇄된 <생생메신저 '시민명예기자' 활동 시작!> 중 한 부분을 사용했다.

대체로 지난 두 번의 시험 결과와 크게 차이는 없지만, 특이한 것은 기사 맨 아랫줄의 '참여예산방'의 홈페이지 링크의 영문이 100DPI에서는 제대로 인식이 안 되었다. 이것은 ABBYY FineReader 11에서도 마찬가지였으며, 인식 언어를 [영어]로만 지정해야 제대로 인식했다. 그러나 이때는 인식 언어를 [영어]로만 지정했기 때문에 한글은 인식 못 한다. 이러한 점으로 미루어 한글과 영어 혼용으로 인식할 때 영어의 인식률이 조금 떨어질 수도 있는 것 같다. 참고로 ABBYY FineReader 12에서는 한글과 일본어 조합으로 인식하면 일본어를 아예 인식 못 하는 버그가 있었다. OCR만을 고려한다면 300DPI 정도면 충분하다는 생각이 든다.

2017년 11월 18일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI로 스캔한 신문 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다.

이 리뷰는 2015년 3월 8일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015. 3. 5.

스캔 DPI에 따른 OCR 인식률 간단 비교 #2 ~ 불교경전

지난 번 「스캔 DPI에 따른 OCR 인식률 간단 비교 #1 ~ 소설책」 비교에 이어 이번에는 좀 낡고 글씨가 작은 『불교경전』의 한 페이지를 시험했다.

인쇄된 글자 크기가 크고 비교적 새책인 지난번 비교 때와는 달리 글씨가 작은 책이라 그런지 전체적으로 DPI가 높을수록 좋은 인식률을 보여준다.

첫 줄의 '많은'의 '은'을 '온'으로 인식한 것은 맨 마지막 사진에서 보듯 인쇄 상태가 썩 좋지 않기 때문에 오히려 '온'으로 인식한 것을 옳다고 봐야 한다면, 150DPI에서 '은'으로 인식한 것은 오류로 봐야 할 것 같다. 위 사진의 통계에는 이 의견을 반영하지는 않았지만 말이다. 그러나 '만족할 줄 앎'의 '앎'은 인쇄에 문제가 없었다. 고로 '앎'을 유일하게 제대로 인식한 1000DPI에서는 띄어쓰기 1회의 오류를 제외하고는 맞춤법은 100% 정확했다고 봐도 무방하다. Abbyy Finereader 도움말에 따르면 글자가 작게 인쇄된 책은 600DPI 스캔을 권장하는데, 그 말이 틀린 것은 아니다.

2017년 11월 17일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다. 흥미롭게도 띄어쓰기 오류 부분에서 12버전보다 못한 결과가 나왔다.

이 리뷰는 2015년 3월 5일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015. 3. 3.

스캔 DPI에 따른 OCR 인식률 간단 비교 #1 ~ 소설책

복합기 평면 스캐너로 스캐한 문서의 해상도 150DPI, 300DPI, 600DPI, 1000DPI에 따른 OCR(ABBYY FineReader 12) 인식률을 간단하게 비교해 봤다. OCR에 사용한 이미지는 스캔 후 ScanTailor 보정(기울기 보정 및 텍스트 영역 선택)만 거치고 포토샵 보정은 하지 않았다. 본문에 사용한 예제는 을유문화사의 「을유세계문학전집」 중 에밀 졸라의 『꿈』의 한 페이지이며 스캐너에 따라, 그리고 스캔 옵션에 따라 각각 결과물이 다를 것이기에 그저 재미 삼아 참고 자료로 보면 될 듯싶다.

뜻밖에 150DPI에서도 꽤 좋은 인식률을 보여주었으며 보다시피 일반적인 소설책은 300DPI 정도면 OCR 작업에 무난 한 것으로 보인다. 그러나 난 첫 번째 사진과 같은 스캔 옵션에서 300DPI와 600DPI의 스캔 속도에 차이가 없어서 600DPI로 스캔한다. 참고로 책 본문의 "자신의 모습을 보는 듯도 했다."에서 '듯'을 '둣'을 인식하는 오류는 가장 빈번한 오류 중 하나이며, "대한공포로끊임없이"를 11버전에서 인식해도 여전히 띄어쓰기는 되지 않았다.

비교적 새책이고 인쇄 상태도 좋으며 글자 크기도 큰 편이기 때문에 DPI에 따른 OCR 인식률에 별 차이가 없는 것 같다. 다음번엔 좀 오래되고 글씨도 작은 책을 구해서 다시 한번 시험해 봐야 할 것 같다.

2017년 11월 17일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다. Abbyy FineReader 11 및 12 버전에서 가장 빈번하게 틀리는 ''을 14 버전은 ''으로 정확하게 인식했다.

이 리뷰는 2015년 3월 3일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2014. 11. 12.

300dpi 스캔 이미지를 600dpi로 업샘플링하여 가독성 높이기

보통 스캔 속도는 300dpi로 스캔할 때가 600dpi보다 빠르다. 필자의 캐논 복합기 MG2270의 스캔 속도 역시 300dpi로 스캔하면 600dpi로 스캔할 때보다 대략 40% 정도 빠르다(300dpi라도 '디스크린' 설정을 켜면 600dpi와 스캔 속도가 같아진다). 그러나 품질이나 가독성 차이가 많이 나기 때문에 어쩔 수 없이 600dpi로 스캔을 한다.

크게 중요하지 않은 문서나 책의 경우 300dpi로 스캔한 다음 포토샵에서 600dpi로 업샘플링한 다음 추가 보정하면 스캔 시간을 절약할 수 있을뿐더러 가독성(이 점은 사용자의 관점이나 취향에 따라 다를 수도 있다)도 좋아진다. 업샘플링 작업(다른 필터 작업에 비해 시간이 좀 더 걸린다)은 액션으로 저장하여 [Image Processor]를 통해 일괄처리해 놓고 다른 볼일을 보면 된다.

300dpi 이미지(문서)를 600dpi로 보정하는 포토샵 작업 과정은 아래와 같다.

[Levels] 작업할 때 우측 슬라이더(White Point Slider)를 조절하는 이유는 너무 굶어진 글자의 획을 보기 좋을 정도로 가늘게 만들기 위해서이다.

아래는 아무 작업도 하지 않은 원본, 위 예시처럼 이미지 리사이징과 레벨, 샤픈 등의 보정 작업을 거친 결과물, 그리고 전체 업샘프링 작업 중 [Image Size] 작업 전 [Gaussian Blur]를 생략했을 때의 결과물을 순서대로 나열한 사진이다.

전체 보정 작업 중 [Image Size] 전에 [Gaussian Blur]를 적용하지 않으면 글자 획들이 울퉁불퉁 거칠어진다.

아래는 테스트에 사용한 원본 이미지와 보정 작업을 거친 최종 결과물의 사진들이다.

스캐너의 스캔 품질이 좋은 경우 굳이 이와 같은 작업을 하지 않아도 300dpi에서 충분한 품질과 가독성을 보장하거나, 업샘플링 과정을 거치더라도 [Gaussian Blur]를 하지 않고 [Image Size]에서 dpi만 조절해도 좋은 결과가 나올 수 있지만, 내 스캐너는 그렇지 못하기 때문에 글자 획에 고르게 굵은 선을 입히기 위해 굳이 [Gaussian Blur] 필터를 사용해야만 했다. 그리고 스캔 이미지의 상태와 사용자의 취향에 따라 [Levels] 값과 [Unsharp Mask] 값을 적당히 조절해서 사용하면 된다.

이 리뷰는 2014년 11월 12일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

Category

팔로어

Recent Comments

Blog Archive