동영상 자체에 입혀져 있는 자막 추출하기 #1
<완벽하지는 않지만, 그럭저럭 쓸만하다> |
나의 일상 속 딥러닝 기술, OCR
나처럼 종이책을 스캔하여 전자책을 만드는 사람에게 익숙한 딥러닝 기술이 하나 있다. 바로 이미지에서 문자를 추출해주는 OCR이다. 문맹자를 찾아보기 어려운 요즘 사회에서 ‘문자’와 ‘이미지’를 구분하는 것이 뭐가 어려운 것일까 하는 생각이 들 수도 있지만, ‘문자’를 모르는 사람에게는 ‘문자’나 ‘이미지’나 매한가지다. OCR은 우리가 SF 영화에서 볼 수 있는 지능적인 로봇 개발에 있어 가장 기초적인 과제로써 로봇이 사람과 일상을 공유하려면 반드시 갖춰야 할 기술이다.
나날이 발전하는 딥러닝 기술은 「바이두 AI, 오래된 사진 무료 복구 이벤트」에서 소개한 것처럼 오래되어 색이 바랜 사진이나 흑백 사진을 복원해주기도 한다. 또한, 동영상의 음성을 인식하여 텍스트 자막으로 변환해주는 딥러닝 기술은 유튜브에서 흔히 볼 수 있다.
오늘 소개하는 视频取字幕工具(Video subtitle tool)는 영상 자체에 입혀져 있는 자막을 OCR 기술을 이용해 텍스트로 추출하는 프로그램이다.
단, 무진장 아쉽게도 영어, 중국어, 일어 자막만 지원한다. 단, 무진장 아쉽게도 완전한 사용법을 아직 파악하지 못했다.
하지만, 개략적인 테스트 결과 작동은 하는 것으로 확인되었다(아래 동영상). 고로 관심 있는 사람은 조금만 더 노력을 기울이면 충분히 원하는 결과를 얻을만한 자막 추출 프로그램이다.
한국어 자막 추출이 필요하다면, 「동영상 자체에 입혀져 있는 자막 추출하기 #2」, 또는 「동영상 자체에 입혀져 있는 자막 추출하기 #3」(추천!!!)
'드라마/영화/오디오북'의 음성 데이터를 자막/텍스트로 추출하고 싶다면, 「오디오/동영상 음성을 텍스트 및 자막으로 변환 | Buzz」 참고
출처: 视频取字幕工具 V2.0 绿色版
• 자료는 출처에서 다운로드
• 참고로 다른 중국산 프로그램처럼 Locale Emulator로 실행해야 글자가 깨지지 않는다(Locale Emulator 적용 방법은 「바이두 공유 링크 비로그인/로그인 다운로더 | KinhDown」 글 참고).
동영상에서 자막 추출하기
视频取字幕工具(Video subtitle tool)로 동영상 자체에 입혀져 있는 자막을 텍스트로 추출하는 대략적인 과정은 위 동영상을 참고하자.
1. 팟플레이어 같은 동영상 재생기로 자막을 추출할 동영상을 연 다음 视频取字幕工具 실행 후 ❶번을 클릭해 동영상에서 자막을 추출할 이미지 영역을 선택한다.
2. ❹ 启动识别(인식 시작)을 누르고 동영상을 재생하면 앞서 선택한 영역에 나타나는 자막을 인식하기 시작한다.
• OCR 인식률이 높지 않다면, ❸ 检测频率(毫秒)(감지 빈도)를 좀 더 짧게 설정한다.
• 동영상 화질이 좋을수록, 그리고 입혀져 있는 자막 글꼴이 선명할수록 OCR 인식률은 높아질 것이다. 또한, 모니터가 두 대이면 작업이 좀 더 편할 것 같다.
• 만약 한 대의 모니터에서 동영상 재생기를 꽉 찬 화면으로 실행한 상태에서 자막을 추출하고 싶다면, 开启识别后窗口自动最小化(인식이 켜지면 창 자동으로 최소화) 설정을 켜고 하면 된다.
<추출한 자막을 저장하면 이렇게 xls 포맷으로 저장된다> |
이 프로그램을 써보니 풀로는 자막을 추출 할수없고 20분 정도만 추출하다 멈추던데 시간에 상관없이 추출할수 있게 하는 설정도 있나요? 또 자막을 추출한뒤에 srt로 변환은 어떻게 하나요
답글삭제테스트하면서 가장 난감했던 것이 자작 추출 도구이면서도 왜 srt로 저장이 안 되는지 모르겠더군요. Subtitle Edit는 csv 파일을 불러들일 수 있으니 xls>>csv로 저장해서 어떻게 안 되려나 모르겠습니다.
삭제자작 추출 시간은 (2)번에서 설정이 안 되던가요?
한글자막은 인식안되나요?
답글삭제그러면 대박인데, 아쉽게도 중국어와 영어만 됩니다.
삭제https://cafe.naver.com/takesub
답글삭제여기 가면 바로 되는 게 있습니다.
유료에 회원 가입까지 해야 하네요.
삭제