2014/07/03

종이책을 스캔해서 전자책(PDF) 만들기 | 6. PDF 결과물 비교

종이책을 스캔해서 전자책(PDF) 만들기 | 6. PDF 결과물 비교

이번에 스캔해서 만든 (포토샵 보정은 '얇은'을 적용) PDF 책에서 한 페이지(200p)를 선정해 ABBYY FineReader(버전 11)과 Acrobat XL(PDF 변환 설정은 아래 사진 참조)의 가독성을 비교해 보았다. 설정에 따라 PDF 품질에 차이가 있을 수 있으니 그저 참고로만 사용하기 바란다.

<(OCR을 적용하면서 파일 크기에는 상관없이 원본에 가까운 품질의 PDF를 만들기 위한 나름의 '무손실' 설정인데, 더 좋은 설정법이 있을 수도>

아래 사진은 300% 확대한 것을 캡쳐한 것(PDF 뷰어는 PDF-XChange Viewer를 사용)

이번에는 1,200% 확대

이번에는 Acrobat XL 무손실 PDF 파일과 ABBYY FineReader 무손실 600DPI PDF 파일만 3,600% 확대했다. 원본 크기에서 좀 더 확대해 보면 Acrobat XL PDF 문서의 글자 윤곽 주변에 미세하게 노이즈가 보이며 전체적인 품질은 파일 크기가 큰 만큼 ABBYY FineReader에서 만든 PDF가 더 좋다. 이런 작은 차이는 전자책을 읽는 데는 크게 상관은 없지만 훗날 다시 재편집을 하거나 재보정을 할 때 큰 차이를 불러올 수 있다.

위의 테스트에 사용한 PDF 문서 각각의 파일 크기는 다음과 같다.

가장 작은 크기의 OCR을 적용한 PDF를 만들려면 ABBYY FineReader의 [Mixed Raster Content]나 Acrobat의 [ClearScan]을 사용 하면 되고, 두 결과물 중 파일 크기는 대체로 [Mixed Raster Content]가 더 작은 편이다. 또한, PDF 파일의 크기는 원본에 사용한 이미지의 크기에 따라 다르므로 원본에 사용된 TIFF 포맷을 ABBYY FineReader 작업 전에 손실 압축 포맷인 JPEG으로 변환하여 적당한 크기로 용량을 줄이면 그만큼 더 적은 크기의 PDF 문서를 만들 수 있다. 다른 방법으로는 ABBYY FineReader의 저장 설정의 [해상도] 설정에서 품질을 낮추는 방법이 있지만, 이 방법으로 만든 PDF는 PDF 뷰어로 볼 때 로딩에 좀 시간이 걸리는 단점이 있다.

아무튼 태블릿에서 페이지 로딩은 [ClearScan]한 결과물이 더 빠르며(「종이책을 스캔해서 전자책(PDF) 만들기 - 7. 자작 PDF를 태블릿에서 봤을 때 가독성 및 로딩 속도 비교」 참고), [Mixed Raster Content]는 아래 사진처럼 ABBYY FineReader가 인식하지 못한 글자는 흐릿하게 처리된다는 것이다. [ClearScan]은 역시 마찬가지이지만 [Mixed Raster Content]보다는 가독성이 괜찮다. 고로 각자의 취향과 필요에 따라 적절하게 사용하면 될 것이다.

0 comments:

댓글 쓰기

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요