빠른 무료 스크린 OCR 프로그램 | Umi-OCR
속도 빠른 무료 OCR 프로그램
인터페이스 언어가 중국어이고, 한국어나 영어로 지역화하기가 어려운 점은 마찬가지지만, 「빠르고 간편한 무료 OCR 프로그램 | PandaOCR」을 대체할만한 Windows 무료 스크린 OCR 프로그램을 하나 발견했다. 바로 Umi-OCR.
Umi-OCR의 장점은 오프라인 엔진이라 인식 속도가 PandaOCR보다 월등히 빠르다는 것이다. 반대로 Umi-OCR은 PandaOCR처럼 번역 기능은 없고, 지원하는 OCR 엔진도 PaddleOCR-json C++ 하나뿐이다(PandaOCR은 다중 인식 엔진 및 다중 번역 엔진 지원).
그렇지만, 영어와 중국어 OCR 인식 능력은 OCR 상용 프로그램 중 탑이라 할 수 있는 ABBYY FineReader(버전 15)보다 낫다. 참고로 한국어 OCR 인식 능력은 형편없다.
<PandaOCR, 온라인 엔진 기반이라 인식 속도가 느리다> |
Umi-OCR 특징
무료 : 이 프로젝트의 모든 코드는 오픈 소스이며 완전 무료
편의성 : 압축 해제 후 바로 사용 가능, 오프라인 작동, 네트워크 불필요
일괄 처리 : 이미지 일괄 처리를 지원하며 결과는 여러 형식(txt/md/jsonl)으로 저장. 즉시 스크린샷 인식도 가능
효율성 : PaddleOCR-json C++ 인식 엔진 채택. 컴퓨터 성능이 충분하다면 일반적으로 온라인 OCR 서비스보다 빠름
정확성 : 기본적으로 PPOCR-v3 모델 라이브러리를 사용. 일반 텍스트를 정확하게 인식할 수 있을 뿐만 아니라 손글씨, 잘못된 방향, 지저분한 배경과 같은 시나리오에 대한 인식률도 우수. 워터마크를 제외하도록 무시 영역을 설정할 수 있고, 텍스트 블록 후처리도 지원하고 조판 단락을 병합하여 일반 텍스트를 얻는 것도 가능
Umi-OCR 다운로드
github.com/hiroi-sora/Umi-OCR/releases
Umi-OCR.v1.x.x.7z(중국어와 영어 포함)
Umi-OCR.v1.x.x_ALL_languages.7z(중국어 번체, 일본어, 한국어, 러시아어, 독일어, 프랑스어 포함)
Umi-OCR, 스크린 OCR
위 동영상은 작은 이미지에 그려진 중국어를 ABBYY Screenshot Reader(v15), Umi-OCR, PandaOCR를 사용해 인식해 본 것인데, ABBYY를 제외하고는 모두 정확하게 인식했다.
동영상 재생 속도는 가감 없는 실시간인데, 인식 속도는 단연코 오프라인 엔진을 사용 Umi-OCR이 가장 빨랐다.
Umi-OCR, 불러온 이미지 OCR
이미지를 불러와 OCR 하는 방법은 [浏览文件] 메뉴를 사용하면 된다. 일괄 처리를 지원하며, OCR 결과물은 같은 폴더의 txt 문서로 저장되는 것이 기본값이다.
Alist에서 픽팍 업로드는 일반 업로드 진행 과정과 매우 다릅니다.
답글삭제[업로드 시작 -> PC 캐시 폴더로 복사(이때 업로드 100%로 표시됨) -> 캐시 폴더에서 픽팍으로 전송]
이런 과정으로 진행되기 때문에 처음엔 업로드가 다 된 것처럼(100%) 표시되는데, 실제는 백그라운드에서 업로드가 진행 중입니다(작업 관리자 등의 네트워크 트래픽 모니터링 도구로 확인 가능). 일단 트래픽이 다 끝날 때까지 기다려야 하고, 이것은 편법이기 때문에 간혹 실패할 때도 있습니다만, 꾸준히 사용해본 결과 대체로 잘 되는 것 같습니다.
rclone config, 에서 PikPak 생성할 때 만든 이름입니다.
답글삭제