2015/03/08

스캔 DPI에 따른 OCR 인식률 간단 비교 #3 | 신문

스캔 DPI에 따른 OCR 인식률 간단 비교 #3 | 신문

이번에는 신문으로 시험했다. 예제에 사용된 자료는 화성시 「시정소식지」(2015년 2월) 중에서 다른 소식보다 작은 글자 크기로 인쇄된 <생생메신저 '시민명예기자' 활동 시작!> 중 한 부분을 사용했다.

대체로 지난 두 번의 시험 결과와 크게 차이는 없지만, 특이한 것은 기사 맨 아랫줄의 '참여예산방'의 홈페이지 링크의 영문이 100DPI에서는 제대로 인식이 안 되었다. 이것은 ABBYY FineReader 11에서도 마찬가지였으며, 인식 언어를 [영어]로만 지정해야 제대로 인식했다. 그러나 이때는 인식 언어를 [영어]로만 지정했기 때문에 한글은 인식 못 한다. 이러한 점으로 미루어 한글과 영어 혼용으로 인식할 때 영어의 인식률이 조금 떨어질 수도 있는 것 같다. 참고로 ABBYY FineReader 12에서는 한글과 일본어 조합으로 인식하면 일본어를 아예 인식 못 하는 버그가 있었다. OCR만을 고려한다면 300DPI 정도면 충분하다는 생각이 든다.

2017년 11월 18일 추가: 네이버 블로그의 글을 여기로 옮기면서 위 테스트에 사용된 600DPI로 스캔한 신문 이미지를 Abbyy FineReader 14로 OCR 작업을 해보았다.

0 comments:

댓글 쓰기

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요