2019/08/11

, ,

굳이 ScanTailor 사용해서 전자책을 만드는 이유

굳이 스캔테일러(ScanTailor)를 사용해서 전자책을 만드는 이유

전자책을 직접 제작해 읽어온 지도 벌써 5년

내가 「종이책을 스캔해서 전자책(PDF) 만들기 ~ 1. 스캔」이란 글을 블로그에 소개한 지도 어느덧 5년이나 흘렀다. 이 글의 요지는 책을 훼손하지 않는 평판 스캐너로 책을 스캔한 다음, 그 결과물을 스캔테일러(ScanTailor)로 보기 좋게 재단한 다음, 포토샵 보정으로 가독성을 높인 다음, 최종적으로 파인리더(ABBYY FineReader)라는 OCR 및 PDF 제작 프로그램으로 나만의 전자책을 만드는 과정을 장장 7편에 걸쳐 소개한 글이다. 그때나 지금이나 난 캐논 복합기에 딸린 스캐너를 이용하고 있다. 참고로 스캔하는데 걸리는 시간은 ‘300DPI/그레이/A4 크기/Text’ 설정에서 스캔하는 데만 걸리는 시간은 6초, 헤드가 되돌아오는 시간까지 모두 합산하면 10초 정도 걸리고, 600DPI에서는 각각 10초/14초 정도 걸린다. 고로 300DPI에서 헤드가 되돌아오는 4초 남짓 동안 재빠르게 다음 페이지를 준비할 수 있다면, 한 시간에 최대 360번 스캔할 수 있다는 말이고 이것은 720페이지 분량에 해당한다. 책이 문고판처럼 크기가 작다면 스캔하는 시간도 그만큼 짧아진다. 하지만, 이것은 어디까지나 이론적인 이야기이고 실제로는 그 절반 정도 예상하면 될 것 같다. 대략 한 시간에 300페이지 이상은 스캔할 수 있다는 말이고, 난 이 작업을 영화나 축구 중계를 보면서 한다.

스캔테일러(ScanTailor)를 고집하는 이유

5년이란 세월이 흘렀지만, 아직도 복합기 스캐너를 사용 중이고, 중간에 한번 완전히 분해해서 평판 안쪽을 닦은 것을 제외하고는 딱히 문제가 된 점은 없다. 그동안 대략 400권의 책을 스캔해서 전자책으로 만들었는데, 권당 평균 페이지 수를 500페이지로 잡으면 대략 10만 번 스캔했다는 말이다. 얼마나 더 만들어야 내구성이 바닥날지 나로서는 알 수가 없다. 스캔 품질 역시 인터넷에 공유된 고가 스캐너의 결과물과 비교해보더라도 ─ 그레이 수준에서는 ─ 딱히 나쁘지 않다. 하지만, 컬러 스캔은 좀 차이가 나는 것 같지만 일반적인 책 스캔에서 컬러는 그다지 중요한 요소가 아닌지라 지금의 복합기 스캐너로도 꽤 만족스러운 전자책을 뽑아낼 수 있다. 다만, 고가의 장비는 편리성에서 압도적 우세하다. 물론 책을 파손해야 한다는 단점은 있지만 말이다.

Why-create-an-e-book-using-ScanTailor
<ABBYY FineReader 14 이미지 사전처리>
Why-create-an-e-book-using-ScanTailor
<ABBYY FineReader [맞붙은 페이지 분할] 오류>
Why-create-an-e-book-using-ScanTailor
<ABBYY FineReader [페이지 방향 교정] 오류>

전자책을 만드는 과정은 5년 전과 비교하면 지금은 좀 달라졌다. 조금이라도 시간을 절약하고 힘을 덜 쓰기 위해 지금은 주로 300dpi로 스캔하고, 소설책보다 글씨가 작은 책들만 특별히 600dpi로 스캔한다. 그리고 포토샵 보정도 생략한다. 그래도 7인치 테블릿으로 보는데 지장은 없다. 하지만, 여전히 스캔테일러(ScanTailor)로 재단하는 과정만큼은 유지하고 있다. 왜냐하면, ABBYY FineReader의 재단 능력, 즉 [맞붙은 페이지 분할]과 [페이지 방향 교정] 능력이 미덥지 못하기 때문이다. Readiris 17의 경우는 페이지 분할 기능이 아예 빠져 있다. Acrobat도 비슷해 보이는데, 이것은 내가 해당 기능을 찾지 못해서일 수도 있다. OCR 프로그램의 재단 기능이 아무리 좋아도 현재로서는 스캔테일러(ScanTailor)로 재단한 파일로 PDF를 만드는 것이 보기에는 가장 깔끔하다.

ABBYY FineReader이나 Readiris 등의 OCR 프로그램들의 페이지 분할 능력이 믿을만하면 이제는 쿼드 코어를 사용하고 있기에 OCR 프로그램에 내장된 스캔 기능을 이용하면 스캔과 OCR 작업을 동시에 진행할 수도 있지만, 그러기 위해서는 OCR 프로그램들의 재단 능력이 좀 더 강화될 필요가 있다. 물론, 이 문제는 스캔 품질에 따라, 그리고 OCR 언어 설정에 따라 다를 수도 있으니 사용자 환경에 따라 다를 수도 있다.

여전히 쓸모 있는 나만의 전자책

요즘은 산책하면서 전자책을 TTS(Text-to-Speech), 즉 음성으로 듣고 있다. 깊이 생각하면서 읽을 필요가 있는 책들을 이런 식으로 듣는 것은 대충 흘려보는 수준이나 다를 바 없어 별로 추천하지는 않지만, 책장을 쉽게 넘길 수 있는 소설 같은 경우는 시간도 절약하고 눈의 피로도 줄일 수 있는 좋은 방법인 것 같다. 그런 고로 나만의 전자책을 만들면 여러모로 쓸모가 있는 것은 여전하다.

비록 보잘 것 없지만 광고 수익(Ad revenue)은 블로거의 콘텐츠 창작 의욕을 북돋우는 강장제이자 때론 하루하루를 이어주는 즐거움입니다

Share:

0 comments:

댓글 쓰기

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요