2021/07/18

한국어 지원하는 무료 Wentong TH-OCR

한국어 지원하는 무료 Wentong TH-OCR

Free OCR program in Korean and English | Wentong TH-OCR
<영어 인터페이스를 지원하는 Wentong TH-OCR>

출처: 文通TH-OCR免费版

중국이 AI 분야에 많은 투자를 하는 것은 OCR 엔진 수만 봐도 알 수 있다. 바탕화면/스크린샷 OCR에 특화된 PandaOCR(「빠르고 간편한 무료 OCR 프로그램 | PandaOCR」)를 써 본 사람은 알겠지만, PandaOCR이 지원하는 중국산 OCR 엔진은 무려 10개가 넘는다. 내가 알기론 한국산 OCR 엔진은 네이버 클라우드 플랫폼에서 제공하는 CLOVA OCR 하나뿐인 걸로 알고 있는데, 한국어 인식 성능은 ABBYY FineReader를 뛰어넘지만(자세한 것은 「한컴오피스 2020 OCR 한국어 인식률은 어느 정도일까?」 참고), Wentong TH-OCR, PandaOCR 같은 일반 사용자가 사용할 수 있는 (CLOVA OCR 엔진을 사용한) 써드파티 프로그램이 없어 접근성은 매우 떨어진다.

아무튼, 오늘 소개하는 중국산 OCR 프로그램인 Wentong TH-OCR은 무료 제품이면서도, 중국산답지 않게 영어 인터페이스와 꽤 다양한 OCR 인식 언어(중국어 간체 • 번체, 영어, 일본어, 한국어 , 아라비아어, 홍콩 문자)를 지원한다.

한국어 지원은 그렇다 치더라도 그 수많은 유럽어는 제외하고 아라비아어 지원이라니, 중국산 제품은 역시 뭔가 생뚱맞은 멋이 있다.

Free OCR program in Korean and English | Wentong TH-OCR
<물량 면에선 중국을 따라갈 수가 없다>

Wentong TH-OCR 사용 방법

이미지를 불러온 다음, [Layout analysis] > [OCR] 과정만 거치면 OCR 끝!

Wentong TH-OCR 무료 버전 다운로드

출처에서 제공하는 [立即下载] 클릭

또는, 클릭 →Wentong TH-OCR(출처: www.win1011.com)

Wentong TH-OCR 장 • 단점

Free OCR program in Korean and English | Wentong TH-OCR
<Wentong TH-OCR PDF 품질>

장점

• 무료
• 인식 언어 한국어 지원
• 인터페이스 영어 지원

단점

• 일괄 작업 미지원
• '한국어 + 영어' 혼용 시 인식률 저하
• PDF 품질 설정 불가능
• 인식 결과물 교정 불가능

ABBYY FineReader vs Wentong TH-OCR

Free OCR program in Korean and English | Wentong TH-OCR
<Wentong TH-OCR는 마침표를 모른다?>

프로그램을 설치하면 sample 폴더에 테스트해보라고 언어별로 이미지가 한 장씩 있는데, 내가 오랫동안 사용해 온 ABBYY FineReader 15와 어림짐작으로 인식률을 비교해 보면,

중국어는 Wentong TH-OCR 승리,
영어는 ABBYY가 약간 우세,
한국어도 ABBYY가 약간 우세한 정도다.

이건 몇 장의 이미지만으로 철자를 꼼꼼하게 확인하지 않고 눈으로 대충 흩어보면서 비교한 것이라 정확한 분석이라 할 수는 없지만, Wentong TH-OCR은 무료 제품이면서도 상용 OCR 프로그램 중에서 갑인 ABBYY FineReader와 OCR 품질면에서만큼은 생각보다 큰 차이를 보이지 않는다는 것은 매우 감탄할만한 일이다. 하지만, OCR 품질을 제외한 기타 편의성은 ABBYY 제품과 비교도 할 수 없을 정도로 떨어진다.

Wentong TH-OCR의 가장 불편한 점은 일괄 작업을 지원하지 않는다는 점이다. 만약 OCR 작업할 이미지가 100개 있다면, 이미지 하나하나 [Layout analysis] > [OCR] 과정을 수행해야 한다(고로 총 100번!). OCR 결과물을 PDF로 저장할 수 있다는 점은 훌륭하지만, 일괄 저장이 아닌 개별 저장이다. 이미지 100개를 OCR 작업 후 100개의 PDF 파일로 저장한 다음 PDF 편집프로그램으로 하나의 문서로 합쳐야 한다. PDF 품질은 아예 못 봐줄 정도는 아니지만, 썩 좋지는 않다. 하지만, 내가 볼 땐 무료 OCR 프로그램 중 이만한 것은 흔치 않다는 점에서 사용해볼 만하다.

댓글 8개:

  1. 요즘 바이두 가입이 되나요? 소도음상에서요?

    답글삭제
    답글
    1. 네. 한국 번호로 인증 과정이 진행되는 것으로 봐서는 되는 것 같습니다(그냥 아무 번호나 넣어봤습니다).

      삭제
  2. 그러하군요. 웨이보...이메일 계정에 로그인하려니까 오랫동안 활동하지 않았다고 운영 측에서 동결했습니다. 문제는 이 자식이들이 활성화하는 방법을 제시하지 않는 겁니다...버려야 하나요?

    폰 번호로 만든 건 활성화할 수 있을 거 같은데
    이메일로 만든 계정은...불가능하나요?

    https://ibb.co/stvkgzY

    답글삭제
  3. https://ibb.co/4m7b0Q7

    https://ibb.co/HX4xfLV


    요기서 보완네임이 뭔지 모르겠오요.ㅠㅠ

    답글삭제
    답글
    1. 完善呢称等基本信息,就可以成功激活帐号。(이름과 같은 기본 정보를 입력하면 성공적으로 계정을 활성화할 수 있습니다.)
      웨이보 계정 설정에서 基本信息(기본 정보)에 이름 설정하는 공간이 있습니다만 잘 모르겠네요.

      삭제


    2. 登录提示“帐号长期未使用,已处于保护状态”

      您好,登录提示【帐号长期未使用,已处于保护状态】是由于微博帐号长期未使用,存在较大安全隐患。依据《微博服务使用协议》,系统自动处置为保护状态所致。建议您根据页面提示进行帐号激活,或重新注册新账号使用。如操作过程中遇到问题,可联系@微博客服 或致电4000 960 960进行咨询。


      로그인 프롬프트 "계정이 오랫동안 사용되지 않았으며 이미 보호된 상태입니다"

      안녕하세요, 로그인 프롬프트 [계정을 장기간 사용하지 않고 보호된 상태입니다.]는 Weibo 계정을 오랫동안 사용하지 않았기 때문에 보안 위험이 더 큽니다. "Weibo 서비스 이용 동의서"에 따르면 시스템의 자동 폐기는 보호 상태 때문입니다. 페이지의 안내에 따라 계정을 활성화하거나 사용할 새 계정을 다시 등록하는 것이 좋습니다. 작업 중 문제가 발생하면 @微博客服 또는 4000 960 960으로 전화하여 상담하시기 바랍니다.


      페이지의 안내에 따라 계정을 활성화하거나....이거에 대한 안내가 없는데 어떡하라는 거죠?ㅋㅋ뭐 일처리가 이 따위지인지... 포기해야 하나요?ㅠ

      삭제
  4. 어라 찾은 거 같습니다..

    https://kefu.weibo.com/faqdetail?id=12558&cs_source=

    근데 번역해도 이해가 안 되네요...

    답글삭제
    답글
    1. 앱 설치하고 전화인증하면 되는 것 아닌가요.

      삭제

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요