책도 읽고, 영화도 보고, 그리고 일상적인 생각을 쓰고. 이 모든 것을 음악을 들으며.

Recent Comments

레이블이 SCAN인 게시물을 표시합니다. 모든 게시물 표시
레이블이 SCAN인 게시물을 표시합니다. 모든 게시물 표시

2016년 7월 15일 금요일

평면 스캐너 사용시 책 안쪽까지 깔끔하게 스캔하기

평면 스캐너로 고급스러운 양장 제본이 아닌 일반 서적에 많이 사용되는 무선 제본으로 된 책을 스캔하다 보면 위의 예시처럼 책 가운데가 살짝 들리기 때문에 책 안쪽이 흐릿하게 스캔되는 경우가 종종 있다. 위의 예시에 사용된 책은 안쪽 여백에 여유가 있는 편이라 힘 조절을 잘하면 굳이 책받침을 사용하지 않아도 되지만, 그래도 일일이 스캔 결과를 확인하기는 번거롭기에 책받침을 사용하여 확실히 하고 넘어가는 것이 좋다. 반면에 안쪽 여백의 여유가 없을수록 책받침을 필수적이다 .

나는 책받침으로 두툼한 박스를 적당한 크기로 잘라 사용 중이다. 책받침은 힘을 안쪽까지 균등하게 분배시켜주며 종이를 평평하게 펴주는 역할을 하기 때문에 적은 힘을 들이고도 깔끔한 스캔 결과를 얻을 수 있다 . 그래서 물에 젖었다 마른 것처럼 쭈글쭈글한 종이도 아무런 흔적 없이 깨끗하게 스캔된다. 스캔할 쪽에서 종이 두께에 따라 30~50쪽 뒤나 앞으로 책받침을 책에 삽입한 다음 20쪽 정도 스캔한 다음 다시 앞의 간격으로 책받침을 옮겨 책 사이에 끼우면 된다. 이런 식으로 20쪽마다 한 번씩 스캔 결과물을 확인하면서 안쪽까지 제대로 스캔이 되었는지, 빠진 쪽은 없는지 확인한다.

양장본 혹은 안쪽 여백이 충분한 책이라도 알게 모르게 종이들이 유리에 완전히 밀착되지 않고 살짝 뜨는 경우가 많기에 평면 스캐너로 책을 스캔할 때는 받침대 사용을 적극 추천한다.

이 리뷰는 2016년 7월 15일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015년 12월 15일 화요일

포토샵 보정과 OCR 인식률

이번 테스트는 포토샵 보정에 따른 OCR 인식률의 변화다. 참고로 이번 테스트에 사용한 포토샵 보정 액션 OCR.atn은 이 링크에서 다운로드 할 수 있다.

무보정 원본 인식 결과

13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.

14 Apple’s Jobs to Obama: “Jobs aren’t coming back” to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 214-5ᅳ20)

15 “奥巴馬在中國製造下推廣美國製造 ᄎ風吹現眞相”,http://world.huanqiu.com/exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性,因此加强了對數學與工程學的投資”,http://energy.gov/articles/ president-s-council-jobs-and-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5-7)

Color Burn 혼합 후 인식 결과

  • Color Burn 혼합 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.
      14 Apple’s Jobs to Obama: “Jobs aren't coming back” to U.S., http!//www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 2014-5-20)
      15 “奥巴馬在中國製造下推廣美國製造 大風吹現眞相”, http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性, 因此加强了對數學與工程學的投資”,http://energy.gov/articles/ pi.esident-s-coundl—jobs—and—competitiveness-announces-industry-leaders— commiment-double. (검색일: 2014-5-7)

Multiply 혼합 후 인식 결과

  • Multiply 혼합 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.
      14 Apple’s Jobs to Obama: “Jobs aren’t coming back” to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 24-5-20)
      15 “奥巴馬在中國製造下推廣美國製造 ᄎ風吹現眞相”, http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性, 因此加强了對數學與工程學的投資”, http://energy.gov/articles/ president-s-council-jobs-and-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5-7)

Level, Unsharp 보정 후 인식 결과

  • Level, Unsharp 보정 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 치-지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 히씨 못하였거나 취업을 포기함으로써 발생힘-. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포힘-하지 않았음.
      14 Apple's Jobs to Obama: “Jobs aren't coming back" to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 2014-5—20)
      15 “奥巴馬在中國製造下推廣美國製造 大風吹現眞相”,http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到 /去工 業化的嚴합性,因此加强了尉數은工程^的投資",http://energy.gov/articles/ presiclent-s-council-jobs-ancl-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5-7)

High Pass 보정 후 인식 결과

  • High Pass 보정 후 인식 결과 보기
    • 13 노동참여율(Labor Force Participation Rate)은 노동연령층에서 경제활동인구(취업자와 실업자 모두를 포함)가 차지하는 비율로,2013년부터 2014년까지 미국의 실업률은 지속 적으로 하락하는 추세를 보였으나 노동참여율이 현저히 제고되지는 않음. 이는 일부 노동 연령인구가 장기적으로 취업을 하지 못하였거나 취업을 포기함으로써 발생함. 미국 연방통 계국의 통계 방식에 의해 실업인구를 포함하지 않았음.
      14 Apple’s Jobs to Obama: “Jobs aren’t coming back” to U.S., http://www. heraldtribune.com/article/20120123/ARTICLE/301239999. (검색일: 2ᄋ14-5ᅳ20)
      15 “奥巴馬在中國製造下推廣美國製造 ᄎ風吹現眞相”,http://world.huanqiu.com/ exclusive/2013-04/3785969.html. (검색일: 2014-6-3) “美國政府意識到了去工 業化的嚴重性,因此加强了對數學與工程學的投資”,http://energy.gov/articles/ president-s-council-jobs-and-competitiveness-announces-industry-leaders-commiment-double. (검색일: 2014-5ᅳ7)

간단한 이번 테스트 결과와 그동안의 경험으로 봐서는 OCR 프로그램의 눈과 사람의 눈은 달랐다. 즉, 사람의 눈에 명확하게 보이는 진하고 선이 굵은 가독성 높은 보정이 오히려 OCR 인식률을 낮추는 결과를 가져오기 때문이다.

한자나 한글 같은 경우 레벨과 언샵 보정 후에는 낮은 인식률을 보여주는 경우가 종종 있다. 지나친 보정은 글자 획을 굵게 만들어 획과 획 사이의 간격을 너무 좁히거나 겹치게 하기 때문에 자잘한 오타를 유발한다. 거꾸로 원본 상태에서는 제대로 인식하지 못한 글자를 레벨/언샵 보정 후 제대로 인식할 때도 있다. 그래서 전체 이미지에 일괄적용하기 전에 반드시 테스트가 필요하며 스캔한 책의 상태나 재질, 글자 크기에 값도 달라질 수밖에 없다. 레벨과 언샵 보정이 비록 OCR 인식률을 낮추는 경우가 있지만, 가독성은 좋아지고 스캔된 먼지나 이미지의 노이즈 같은 군더더기를 없애면서 파일 크기를 대폭 줄여준다는 장점은 있다(아래 그래프 참고).

인식률에 큰 영향을 주지 않는 보정은 블렌딩 모드와 High Pass 보정을 기초로 작업하는 것이며, 오로지 좋은 OCR 결과만을 원한다면 무보정, 또는 Color Burn 혼합(50~100%)을 약간 사용하는 것이다. 그러나 이 설정은 스캐너의 스캔 품질에 따라 달라질 여지가 많아서 OCR 작업 전에 한 페이지 정도 테스트하면서 최적의 보정 값을 얻은 다음 그 값을 전체 이미지에 일괄적용한 다음 OCR 진행하는 것을 추천한다. 참고로 이 테스트에는 ABBYY Finereader 11 버전이 사용되었다.

이 리뷰는 2015년 12월 15일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015년 3월 8일 일요일

스캔 DPI에 따른 OCR 인식률 간단 비교 #3 ~ 신문

이번에는 신문으로 시험했다. 예제에 사용된 자료는 화성시 「시정소식지」(2015년 2월) 중에서 다른 소식보다 작은 글자 크기로 인쇄된 <생생메신저 '시민명예기자' 활동 시작!> 중 한 부분을 사용했다.

대체로 지난 두 번의 시험 결과와 크게 차이는 없지만, 특이한 것은 기사 맨 아랫줄의 '참여예산방'의 홈페이지 링크의 영문이 100DPI에서는 제대로 인식이 안 되었다. 이것은 ABBYY FineReader 11에서도 마찬가지였으며, 인식 언어를 [영어]로만 지정해야 제대로 인식했다. 그러나 이때는 인식 언어를 [영어]로만 지정했기 때문에 한글은 인식 못 한다. 이러한 점으로 미루어 한글과 영어 혼용으로 인식할 때 영어의 인식률이 조금 떨어질 수도 있는 것 같다. 참고로 ABBYY FineReader 12에서는 한글과 일본어 조합으로 인식하면 일본어를 아예 인식 못 하는 버그가 있었다. OCR만을 고려한다면 300DPI 정도면 충분하다는 생각이 든다.

2017년 11월 18일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI로 스캔한 신문 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다.

이 리뷰는 2015년 3월 8일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015년 3월 5일 목요일

스캔 DPI에 따른 OCR 인식률 간단 비교 #2 ~ 불교경전

지난 번 「스캔 DPI에 따른 OCR 인식률 간단 비교 #1 ~ 소설책」 비교에 이어 이번에는 좀 낡고 글씨가 작은 『불교경전』의 한 페이지를 시험했다.

인쇄된 글자 크기가 크고 비교적 새책인 지난번 비교 때와는 달리 글씨가 작은 책이라 그런지 전체적으로 DPI가 높을수록 좋은 인식률을 보여준다.

첫 줄의 '많은'의 '은'을 '온'으로 인식한 것은 맨 마지막 사진에서 보듯 인쇄 상태가 썩 좋지 않기 때문에 오히려 '온'으로 인식한 것을 옳다고 봐야 한다면, 150DPI에서 '은'으로 인식한 것은 오류로 봐야 할 것 같다. 위 사진의 통계에는 이 의견을 반영하지는 않았지만 말이다. 그러나 '만족할 줄 앎'의 '앎'은 인쇄에 문제가 없었다. 고로 '앎'을 유일하게 제대로 인식한 1000DPI에서는 띄어쓰기 1회의 오류를 제외하고는 맞춤법은 100% 정확했다고 봐도 무방하다. Abbyy Finereader 도움말에 따르면 글자가 작게 인쇄된 책은 600DPI 스캔을 권장하는데, 그 말이 틀린 것은 아니다.

2017년 11월 17일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다. 흥미롭게도 띄어쓰기 오류 부분에서 12버전보다 못한 결과가 나왔다.

이 리뷰는 2015년 3월 5일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2015년 3월 3일 화요일

스캔 DPI에 따른 OCR 인식률 간단 비교 #1 ~ 소설책

복합기 평면 스캐너로 스캐한 문서의 해상도 150DPI, 300DPI, 600DPI, 1000DPI에 따른 OCR(ABBYY FineReader 12) 인식률을 간단하게 비교해 봤다. OCR에 사용한 이미지는 스캔 후 ScanTailor 보정(기울기 보정 및 텍스트 영역 선택)만 거치고 포토샵 보정은 하지 않았다. 본문에 사용한 예제는 을유문화사의 「을유세계문학전집」 중 에밀 졸라의 『꿈』의 한 페이지이며 스캐너에 따라, 그리고 스캔 옵션에 따라 각각 결과물이 다를 것이기에 그저 재미 삼아 참고 자료로 보면 될 듯싶다.

뜻밖에 150DPI에서도 꽤 좋은 인식률을 보여주었으며 보다시피 일반적인 소설책은 300DPI 정도면 OCR 작업에 무난 한 것으로 보인다. 그러나 난 첫 번째 사진과 같은 스캔 옵션에서 300DPI와 600DPI의 스캔 속도에 차이가 없어서 600DPI로 스캔한다. 참고로 책 본문의 "자신의 모습을 보는 듯도 했다."에서 '듯'을 '둣'을 인식하는 오류는 가장 빈번한 오류 중 하나이며, "대한공포로끊임없이"를 11버전에서 인식해도 여전히 띄어쓰기는 되지 않았다.

비교적 새책이고 인쇄 상태도 좋으며 글자 크기도 큰 편이기 때문에 DPI에 따른 OCR 인식률에 별 차이가 없는 것 같다. 다음번엔 좀 오래되고 글씨도 작은 책을 구해서 다시 한번 시험해 봐야 할 것 같다.

2017년 11월 17일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다. Abbyy FineReader 11 및 12 버전에서 가장 빈번하게 틀리는 ''을 14 버전은 ''으로 정확하게 인식했다.

이 리뷰는 2015년 3월 3일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2014년 11월 12일 수요일

300dpi 스캔 이미지를 600dpi로 업샘플링하여 가독성 높이기

보통 스캔 속도는 300dpi로 스캔할 때가 600dpi보다 빠르다. 필자의 캐논 복합기 MG2270의 스캔 속도 역시 300dpi로 스캔하면 600dpi로 스캔할 때보다 대략 40% 정도 빠르다(300dpi라도 '디스크린' 설정을 켜면 600dpi와 스캔 속도가 같아진다). 그러나 품질이나 가독성 차이가 많이 나기 때문에 어쩔 수 없이 600dpi로 스캔을 한다.

크게 중요하지 않은 문서나 책의 경우 300dpi로 스캔한 다음 포토샵에서 600dpi로 업샘플링한 다음 추가 보정하면 스캔 시간을 절약할 수 있을뿐더러 가독성(이 점은 사용자의 관점이나 취향에 따라 다를 수도 있다)도 좋아진다. 업샘플링 작업(다른 필터 작업에 비해 시간이 좀 더 걸린다)은 액션으로 저장하여 [Image Processor]를 통해 일괄처리해 놓고 다른 볼일을 보면 된다.

300dpi 이미지(문서)를 600dpi로 보정하는 포토샵 작업 과정은 아래와 같다.

[Levels] 작업할 때 우측 슬라이더(White Point Slider)를 조절하는 이유는 너무 굶어진 글자의 획을 보기 좋을 정도로 가늘게 만들기 위해서이다.

아래는 아무 작업도 하지 않은 원본, 위 예시처럼 이미지 리사이징과 레벨, 샤픈 등의 보정 작업을 거친 결과물, 그리고 전체 업샘프링 작업 중 [Image Size] 작업 전 [Gaussian Blur]를 생략했을 때의 결과물을 순서대로 나열한 사진이다.

전체 보정 작업 중 [Image Size] 전에 [Gaussian Blur]를 적용하지 않으면 글자 획들이 울퉁불퉁 거칠어진다.

아래는 테스트에 사용한 원본 이미지와 보정 작업을 거친 최종 결과물의 사진들이다.

스캐너의 스캔 품질이 좋은 경우 굳이 이와 같은 작업을 하지 않아도 300dpi에서 충분한 품질과 가독성을 보장하거나, 업샘플링 과정을 거치더라도 [Gaussian Blur]를 하지 않고 [Image Size]에서 dpi만 조절해도 좋은 결과가 나올 수 있지만, 내 스캐너는 그렇지 못하기 때문에 글자 획에 고르게 굵은 선을 입히기 위해 굳이 [Gaussian Blur] 필터를 사용해야만 했다. 그리고 스캔 이미지의 상태와 사용자의 취향에 따라 [Levels] 값과 [Unsharp Mask] 값을 적당히 조절해서 사용하면 된다.

이 리뷰는 2014년 11월 12일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2014년 7월 11일 금요일

종이책을 스캔해서 전자책(PDF) 만들기 - 7. 자작 PDF를 태블릿에서 봤을 때 가독성 및 로딩 속도 비교

종이책을 스캔해서 전자책(PDF) 만들기 ~ 1. 스캔」을 시작으로 종이책 스캔, 스캔 후 이미지 처리와 보정, OCR 작업 및 PDF 출력 등 자작 전자책(PDF)에 대한 별볼일없는 글들을 선보였다. 이번에는 이렇게 해서 완성한, 그리고 다양한 저장 설정으로 출력한 PDF 파일을 태블릿(넥서스 7 2013)에서 ezPDF Reader로 열었을 때의 화면을 스크린샷으로 저장하여 비교해 보았다. 하나는 넥서스 화면 크기에 자동으로 맞추어 356% 확대된 화면의 스크린샷이고 또 다른 하나는 ezPDF Reader에서 수동으로 1,200% 확대한 화면이다. 이 스크린샷들을 윈도우로 옮겨 XnView에서 100% 확대했다. 그러나 스크린샷이기 때문에 실제로 보는 것과는 차이가 날 수도 있다.

또한, 앞의 5개의 PDF 결과물에 ABBYY FineReader 12의 새 PDF 저장 설정인 [ABBYY 정밀 스캔을 적용하여 이미지에서 문자를 부드럽게 처리](기존의 MRC에서 좀 더 발전한 버전)를 적용한 PDF를 하나 더 추가했다. 미리 말하자면 이 설정으로 저장한 PDF는 Acrobat의 [ClearScan]의 결과물과 매우 흡사했다. 참고로 MRC는 'Mixed Raster Content' 약자며 Abbyy뿐만 아니라 다른 OCR 프로그램인 OmniPage Ultimate, Readiris에서도 사용되는 범용적인 압축 기술이다. 마지막으로 파일크기와 로딩시간을 비교했다.

그동안 나는 인터넷에서 300DPI와 600DPI가 큰 차이가 없다는 말을 곧이듣고 넥서스에서 [ABBYY FineReader 11 무손실 300DPI]로 저장한 PDF로 독서를 했는데, 이번 비교를 통해 장시간 볼 때는 [ABBYY FineReader 11 무손실 600DPI]가 눈에 부담이 좀 더 적다는 걸 알게 되었다. 언뜻 봐도 미세하게 600DPI 쪽이 가독성이 좋다.

[Acrobat XL 무손실 PDF]는 [ABBYY FineReader 11 무손실 300DPI]와 비교했을 때 파일크기에 비해 가독성이 뛰어났다. 그러나 로딩 속도가 두 번째로 더딘 것이 흠이다.

[Acrobat XL ClearScan]은 약간 부자유스러운 글자의 획때문에 보는 사람에 따라서는 가독성에 약간은 문제가 있을 수 있지만 여섯 개의 예제 파일 중에서 가장 빠른 로딩 속도를 보여주었다.

[ABBYY FineReader 11 MRC]은 예제 파일 중에서 파일크기는 제일 작음에도 그런대로 괜찮은 가독성을 보여주었다.

이제 마지막으로 [ABBYY FineReader 12 MRC+정밀스캔]을 살펴보면, 가독성은 둘째 치고 로딩 속도가 정말 문제다. 한 페이지를 로딩하는데 무려 10초가 넘게 걸렸다(속도 측정은 수동으로 스톱워치 어플로 측정했고 세 번씩 측정해서 가장 빠른 값을 사용했다). 넥서스 7(2013)의 성능이 평균은 간다고 봤을 때(이 글을 작성한 2014년 기준으로는), 이 느려터진 로딩 속도는 태블릿 등에서 사용할 때 상당한 걸림돌이 될 수 있다.

PDF 저장 설정에 따른 가독성 차이는 태블릿(또는 스마트폰)의 액정 크기가 클수록, 해상도가 높을수록 더욱 분명해지는 것 같다. 예전에 야누스 스마트폰에서 ABBYY FineReader 11에서 MRC로 저장한 PDF를 볼 때 넥서스 7에서와 만큼 가독성의 차이를 느끼지 못했다.

이 리뷰는 2014년 7월 11일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

2014년 7월 3일 목요일

종이책을 스캔해서 전자책(PDF) 만들기 ~ 5. ABBYY FineReader 11을 이용한 OCR 및 PDF 만들기

지난 번 「종이책을 스캔해서 전자책(PDF) 만들기 ~ 4. OCR과 가독성을 위한 포토샵 보정 작업」에서 생성한 출력물을 가지고 OCR 및 PDF를 만드느 시간이다. OCR(문서인식) 프로그램은 Adobe Acrobat XL, OmniPage 등을 포함하여 여러 가지가 있지만, 이것저것 한 번씩 사용해 본 결과 가장 우수한 것은 ABBYY FineReader 11이었다(이 글을 옮기는 2017년 11월 12일 현재에는 ABBYY FineReader 14 버전을 사용 중). 무엇보다 한글 인식률이 좋지만, 인식 후 사용자가 프로그램이 인식한 내용을 자유롭고 편리하게 수정할 수 있으며 인식 결과물을 다양한 문서 포맷(docx, doc, rtf, odt, pdf, htm, txt, xlsx, xls, pptx, csv, fb2, epub, djvu 출력 지원)으로 출력할 수 있다.

아래 스샷은 ABBYY FineReader 11의 메인 화면

앞에서 최종적으로 포토샵 보정까지 끝난 파일들을 불러오기 전에 일단 메뉴의 [도구] - [설정]을 잠깐 살펴보자.

[설정]의 첫 번째 탭은 [문서] 설정이다.

인식에 사용할 언어를 편집할 수 있으며 한글판으로 설치되었다면 기본적으로 [한국어 및 영어]가 선택되어 있다. 또한, 이 [한국어]는 한자도 인식한다. 스캔한 문서에 한글, 한자 및 영어 외에 다른 언어가 포함되어 있다면 [언어 편집]을 통해 추가해줘야 정확한 인식이 가능하다.

[설정]의 두 번째 탭은 [스캔/열기] 설정이다.

[획득한 페이지 이미지 자동 인식]은 이미지 파일을 불러올 때 [이미지 전처리] 설정에 선택된 작업들을 한 후 이미지에 포함된 그림, 글자, 표 등을 분석하고 인식작업까지 한다.

[획득한 페이지 이미지 자동 분석]은 이미지 파일을 불러올 때 [이미지 전처리] 설정에 선택된 작업들을 한 후 이미지에 포함된 그림, 글자, 표 등을 분석하지만, 인식작업은 하지 않는다.

[획득한 페이지 이미지 자동 인식 및 분석 안 함]은 이미지 파일을 불러올 때 [이미지 전처리] 설정에 선택된 작업들만 하고 분석 및 인식은 하지 않는다.


[이미지 전처리] 설정은 ABBYY FineReader에서 바로 스캔해 문서로 인식할 때 유용한 설정이지만, Scan Tailor와 포토샵 보정을 마친 이미지에는 굳이 필요가 없는 설정 이기도 하다.

[이미지 전처리 사용]은 노이즈 제거, 기울어짐 보정, 텍스트 라인 바르게 및 부등변 사각형태 일그러짐 보정과 같은 작업을 자동으로 한다.

[페이지 방향 검색]은 Scan Tailor의 [Fix Orientation]처럼 페이지의 올바른 방향을 자동으로 잡아준다.

[맞붙은 페이지 분할]은 Scan Tailor의 [Split Pages]처럼 페이지를 자동으로 분할한다.


[설정]의 세 번째 탭은 [인식] 설정이다.

[인식 모드]는 [정밀 인식]을 사용해야 인식률이 높다.

[훈련]에서 패턴 설정은 한글은 지원하지 않기 때문에 사용할 일은 없다.

이제 메인 화면의 [이미지/PDF 열기]로 포토샵 보정을 마친 이미지 파일들을 불러온다. Ctrl+A를 누르면 모든 파일을 쉽게 선택할 수 있다.

ABBYY FineReader가 이미지를 불러들이면서 분석 및 인식 작업까지 진행하게 된다.

ABBYY FineReader는 다중 프로세서를 지원하기 때문에 CPU가 많을수록 인식 시간은 단축된다. 필자의 AMD 트리니티 듀얼 코어 노트북으로 400페이지 정도를 인식하는 데 걸리는 시간은 대략 30분 조금 못 미친다. 또한, 인식에 사용할 언어를 많이 추가할수록 시간이 많이 걸리기도 한다.

인식이 완료되면 일단 메뉴의 [파일] - [FineReader 문서 저장]을 통해 저장해둔다. 이렇게 한 번 저장이 되면 사용자가 수정할 때마다 자동으로 저장되니 따로 나중에 저장할 필요는 없다. 일반 하드디스크라면 조금 시간이 걸리는 작업이다.

인식된 페이지들을 살펴보면 빨간색은 그림 영역으로 , 녹색은 텍스트 영역으로, 파란색은 표 영역으로 인식 된 것이다. 표나 글자로 인식된 부분과는 달리 그림으로 인식된 부분은 그냥 일반 이미지 파일로 PDF에 저장된다. 이러한 부분은 OCR의 장점인 텍스트 선택이 안 된다. 영역 설정은 사용자 임의 선택이 가능하지만, 대부분 ABBYY FineReader가 분석 및 인식 작업을 통해 알아서 잘 잡아준다.

그냥 이 상태에서 [저장]을 통해 PDF 문서로 만들어도 되지만, 나는 Scan Tailor에서 했던 것처럼 키보드의 [Page Down]을 이용해 빠르게 흩어내려 가면서 아래 사진처럼 미흡한 부분을 수정한다.

아래 사진은 글자 영역을 그림(빨간색) 영역으로 잘못 인식한 경우이다. 이럴 때에는 드래그 앤 드롭으로 글자 부분을 넉넉하게 선택한 다음 Ctrl+2를 눌러 영역을 텍스트로 지정하고(Ctrl+3은 그림, Ctrl+4는 표) Ctrl+Shift+B를 눌러 다시 인식해준다.

메인 화면의 우측에 보이는 글자들은 ABBYY FineReader가 이미지를 문자로 인식한 내용이다. 한글 인식률은 어림짐작 92% 이상으로 매우 높은 편이지만(600DPI 스캔 후 포토샵으로 가독성 보정한 이미지), 띄어 씌기나 오타 등의 인식 오류가 아예 없는 것은 아니다. 예로 들면 '사실'이라는 단어를 '시실'로 잘못 인식하는 경우가 많았다. 이럴 때엔 Ctrl+H로 [바꾸기] 창을 불러온 다음 '시실'을 '사실'로 전부 바꿔주면 된다. 또는, ABBYY FineReader의 [검증] 기능을 사용할 수 있다.

이러한 방법으로 잘못된 글자와 띄어쓰기 오류들을 일일이 다 수정할 수 있지만, 시간이 오래 걸리니 취향과 필요에 따라 적절하게 작업을 하면 된다. 사용자의 손이 많이 간 PDF는 오디오북으로 활용하면서 들을 때 더 정확한 듣기가 가능하나, 한글 듣기 능력에 특별한 문제가 없는 사람이라면 수정 없이 기본 상태로 저장된 PDF라도 책을 이해할 수 있을 만큼의 음성 듣기는 가능할 정도로 ABBYY FineReader의 인식률은 훌륭하다. 만약 원본과 토씨, 띄어쓰기 하나 틀리지 않게 완벽하게 수정한다면 TXT, DOC 등으로 저장해(인쇄하기 전 원고나 다름없는) 인터넷 서점에서 파는 eBook을 능가하는 고품질, 고활용의 전자책도 가능하다.

제 최종적인 PDF 출력이 남았다

주 도구 모음에 있는 [PDF 저장]을 클릭한 다음 [설정]으로 들어간다. ([저장 모드]에 대한 설명은 「ABBYY FineReader PDF 저장 옵션 중 [저장 모드]에 대하여」를, [이미지 설정]의 [품질]에 대해서는 「ABBYY FineReader PDF 저장 옵션 중 [이미지 설정 ('무손실'과 '손실')]에 대하여」를 참고)

일단 [Mixed Raster Content 사용]을 체크해제하고 [이미지 설정]에서 [사용자 지정]으로 들어간다.

원본 보존용(원본 이미지 보관을 위해 꼭 이 방법이 아니라 Scan Tailor 작업만 완료한 이미지나 포토샵 보정을 마친 이미지만 따로 보관해도 된다)으로 만들 PDF를 위해 [해상도]는 [원본]을 선택하고 [색상 조정]이나 [품질] 역시 아래 사진처럼 설정한다. 작업이 어느 정도 익숙해지면 여기 설정들을 조절해서 적당한 크기의 PDF 파일을 만들 수 있다. 그러나 [품질]에서 이미지 압축을 사용하면 태블릿 등에서 PDF를 불러와 페이지를 넘길 때 압축을 하지 않았을 때보다 조금 딜레이가 있다.

설정을 완료하면 [저장]을 통해 PDF 파일을 만든다.

같은 방법으로 이번에는 300DPI PDF를 만든다. 파일 이름은 적당히 정해주면 된다. 필자는 '책이름(300).pdf 이런 식으로 이름을 만든다. 보통 300DPI PDF는 원본 600DPI의 절반 정도 크기가 된다.

그리고 최종적으로 '저용량' PDF 문서를 만들 차례다. 필요 없으면 안 만들어도 상관없다. 필자는 앞의 300DPI와 600DPI PDF 문서들을 부족한 하드 용량에 다 보관할 수가 없어 따로 '저용량' PDF를 만들어 빠르게 본문을 흩어볼 일이 있을 때 사용한다. [사용자 지정]에서 [해상도] 등은 위의 원본 보존용처럼 설정한 다음 [저장] 설정에서 아래 사진처럼 [Mixed Raster Content 사용]을 체크한다. 아마도 이 설정은 인식된 글자들을 아마도 벡터 이미지로 바꿔 용량을 줄이는 고압축 방법인 것 같다.

이 글을 작성하면서 만든 416페이지 PDF 책의 용량을 보면 아래 그림과 같다.

원본 보존용으로 600DPI 무압축 설정으로 저장한 PDF 파일은 405M, 300DPI PDF 파일은 180M, 그리고 [Mixed Raster Content 사용]을 이용한 PDF 파일을 14.9M, Acrobat [ClearScan]으로 만든 PDF 파일은 66.3M이다. 그리고 포토샵 보정을 마친 416개 이미지 파일의 총용량은 455M이다.

획기적으로 PDF 용량을 줄이는 방법으로 Adobe Acrobat의 [ClearScan] OCR 인식이 있으나 한글 및 한자 인식률이 ABBYY FineReader에 비해 떨어지고 오랫동안 사용한 ABBYY FineReader에 익숙해서 ABBYY FineReader를 사용한다. 그러나 PDF 편집은 ABBYY FineReader에서 할 수 없기 때문에 Acrobat 등을 사용하면 된다. OCR 작업은 취향에 따라 Acrobat을 사용해도 무방하나, Acrobat은 OCR 작업할 때 아직 다중 프로세서를 지원하지 않기 때문에 시간이 좀 더 걸린다.

이제 남은 것은 완성된 PDF 파일을 Acrobat 같은 PDF 편집 프로그램으로 보안설정이나 [책갈피] 등을 추가하여 완성도를 높이는 것이다. 즐겁고 편안한 독서를 위한 지루한 모든 과정은 끝났다. 만약을 위해 클라우드 등에 백업하는 것을 잊지 말고 이제 기꺼운 마음으로 전자책을 펼치자.

이 리뷰는 2014년 7월 3일 네이버 블로그에 올린 것을
특별한 수정 없이 그대로 옮긴 글입니다
Share:

Category

관심 사용자

Recent Comments

Blog Archive