🚀 초저사양 PC도 OK! Gemini+Groq 초간단 AI 자막 생성기
앞서 자작 9탄으로 소개한 「Whisper 일괄 변환기」는 AMD/INTEL 같은 내장 GPU 사용자를 위한 오프라인 ASR(automatic speech recognition) 도구라면, 오늘 것은 Gemini 멀티모달 API와 Groq의 초고속 Whisper(덤으로 Hugging Face)를 사용한 온라인 자막 생성기라고 볼 수 있다.
이 앱의 장점은 CPU, GPU 등 사용자 PC 자원을 전혀 사용하지 않으므로 초저사양에서도 동영상/음성의 자막(또는 텍스트 추출)을 빠르게 생성할 수 있다는 것이다. 생각보다 무료 API 제한이 관대하므로 일반 사용자라면 부담 없이 사용할 수 있다.
영상 편집이나 강의 정리, 콘텐츠 제작을 하다가 '아, 이 많은 말을 언제 다 텍스트로 정리하지?' 하고 막막했던 경험, 혹은 보고 싶은 영화나 드라마가 있는데 자막이 없어서 포기해야 했던 경험, ‘AI 자막 생성기’와 ‘EPUB/TEXT/SRT 만능 번역기’로 다 해결할 수 있다.
AI ASR Subtitle Generator 특징
- Gemini: 구글의 강력한 AI로, 높은 품질의 자막을 원할 때 추천.
- Groq(Whisper): 현존 가장 빠른 속도를 자랑. 긴 영상도 순식간에 처리.
- HuggingFace(Whisper): 세계 최대 AI 커뮤니티의 모델을 무료로 활용. 가벼운 작업이나 테스트에 부담 없이 사용. 단, HuggingFace는 텍스트 추출만 지원.
- 완전 무료: 앱도 무료, API도 일일 한도 내에서 무료 사용 가능.
- 직관적인 사용법: 클릭 몇 번으로 자막 생성.
- 사용자 맞춤 프롬프트: ‘이 영상은 IT전문 용어가 많으니 참고해 줘’ 같은 추가적인 지시나 힌트를 주어 자막의 정확도를 더욱 높일 수 있음.
- 💻🚨 PC에 FFmpeg 설치 필요!!!
AI ASR Subtitle Generator 다운로드
AI ASR Subtitle Generator 테스트 영상
Gemini vs Grok vs Whisper(large-v2), 전사 품질 비교
Gemini vs Grok, 무료 API 일일 제한
구분 (무료 티어 기준) |
Gemini 2.5 Pro / Flash | Groq (whisper-large-v3) |
비고 |
---|---|---|---|
RPM (분당 요청 수) |
5/10 | 20 | Groq가 분당 더 많은 요청 가능 |
RPD (일일 요청 수) |
100/250 | 2,000 | Groq이 더 많은 요청 가능 |
ASH (시간당 오디오 처리량) |
요청당 최대 2시간 | 누적 2시간 (7,200초) |
가장 중요한 차이점! (아래 설명 참조) |
ASD (일일 오디오 처리량) |
지정되지 않음 | 누적 8시간 (28,800초) |
Groq은 일일 처리량도 명확히 제한 |
🔍 더 자세한 것은 공식 문서 참고: Grok Rate Limits, Gemini 비율 제한
마무리
Groq 전사 품질은 제미나이 프로보다 떨어지지만, 빠른 전사 속도와 높은 안정성이 장점이다. 짧은 영상을 대량 작업할 때 유리하다.
반면에 Gemini 같은 경우 대용량 파일을 손쉽게 처리할 수 있도록 구글 드라이브와는 독립된 별도의 20GB 파일 저장 공간을 제공한다. 입력 파일 크기 제한은 2GB이므로 고용량의 긴 음성/영상을 처리하기엔 Groq보다 Gemini가 유리하다.
테스트 결과 2시간 살짝 넘는 400MB 정도의 wav 파일도 (작업 시간은 길지만) 자막 생성에 성공. 하지만, 자막 후반부 전사 품질이 영 아닌 걸로 봐서, 1시간 이상 음성은 30분/1시간씩 끊어 작업하는 걸 추천한다. Hugging Face는 SRT 출력을 지원하지 않는다.
Gemini API에 업로드된 파일은 48시간 후 자동 삭제되고, AI ASR Subtitle Generator 앱은 작업 완료 후 업로드한 파일을 삭제하는 기능이 내장되어 있다. 참고로 Google/Groq 등의 무료 API 정책은 예고 없이 변경될 수 있으며, 특정 기간이 지나면 유료로 전환될 가능성은 항상 존재한다.
0 comments:
댓글 쓰기
댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요