2025/07/28

, , ,

자작 11탄, 클릭 몇 번으로 자막 추출! AI 자막 생성기

AI 자막 생성기 메인 인터페이스

🚀 초저사양 PC도 OK! Gemini+Groq 초간단 AI 자막 생성기

앞서 자작 9탄으로 소개한 「Whisper 일괄 변환기」는 AMD/INTEL 같은 내장 GPU 사용자를 위한 오프라인 ASR(automatic speech recognition) 도구라면, 오늘 것은 Gemini 멀티모달 API와 Groq의 초고속 Whisper(덤으로 Hugging Face)를 사용한 온라인 자막 생성기라고 볼 수 있다.

이 앱의 장점은 CPU, GPU 등 사용자 PC 자원을 전혀 사용하지 않으므로 초저사양에서도 동영상/음성의 자막(또는 텍스트 추출)을 빠르게 생성할 수 있다는 것이다. 생각보다 무료 API 제한이 관대하므로 일반 사용자라면 부담 없이 사용할 수 있다.

영상 편집이나 강의 정리, 콘텐츠 제작을 하다가 '아, 이 많은 말을 언제 다 텍스트로 정리하지?' 하고 막막했던 경험, 혹은 보고 싶은 영화나 드라마가 있는데 자막이 없어서 포기해야 했던 경험, ‘AI 자막 생성기’와 ‘EPUB/TEXT/SRT 만능 번역기’로 다 해결할 수 있다.

AI ASR Subtitle Generator 특징

  • Gemini: 구글의 강력한 AI로, 높은 품질의 자막을 원할 때 추천.
  • Groq(Whisper): 현존 가장 빠른 속도를 자랑. 긴 영상도 순식간에 처리.
  • HuggingFace(Whisper): 세계 최대 AI 커뮤니티의 모델을 무료로 활용. 가벼운 작업이나 테스트에 부담 없이 사용. 단, HuggingFace는 텍스트 추출만 지원.
  • 완전 무료: 앱도 무료, API도 일일 한도 내에서 무료 사용 가능.
  • 직관적인 사용법: 클릭 몇 번으로 자막 생성.
  • 사용자 맞춤 프롬프트: ‘이 영상은 IT전문 용어가 많으니 참고해 줘’ 같은 추가적인 지시나 힌트를 주어 자막의 정확도를 더욱 높일 수 있음.
  • 💻🚨 PC에 FFmpeg 설치 필요!!!

AI ASR Subtitle Generator 다운로드

AI ASR Subtitle Generator 테스트 영상

Gemini vs Grok vs Whisper(large-v2), 전사 품질 비교

Gemini vs Grok, 무료 API 일일 제한

구분
(무료 티어 기준)
Gemini 2.5 Pro / Flash Groq
(whisper-large-v3)
비고
RPM
(분당 요청 수)
5/10 20 Groq가 분당 더 많은 요청 가능
RPD
(일일 요청 수)
100/250 2,000 Groq이 더 많은 요청 가능
ASH
(시간당 오디오 처리량)
요청당 최대 2시간 누적 2시간
(7,200초)
가장 중요한 차이점!
(아래 설명 참조)
ASD
(일일 오디오 처리량)
지정되지 않음 누적 8시간
(28,800초)
Groq은 일일 처리량도 명확히 제한

🔍 더 자세한 것은 공식 문서 참고: Grok Rate Limits, Gemini 비율 제한

마무리

Groq 전사 품질은 제미나이 프로보다 떨어지지만, 빠른 전사 속도와 높은 안정성이 장점이다. 짧은 영상을 대량 작업할 때 유리하다.

반면에 Gemini 같은 경우 대용량 파일을 손쉽게 처리할 수 있도록 구글 드라이브와는 독립된 별도의 20GB 파일 저장 공간을 제공한다. 입력 파일 크기 제한은 2GB이므로 고용량의 긴 음성/영상을 처리하기엔 Groq보다 Gemini가 유리하다.

테스트 결과 2시간 살짝 넘는 400MB 정도의 wav 파일도 (작업 시간은 길지만) 자막 생성에 성공. 하지만, 자막 후반부 전사 품질이 영 아닌 걸로 봐서, 1시간 이상 음성은 30분/1시간씩 끊어 작업하는 걸 추천한다. Hugging Face는 SRT 출력을 지원하지 않는다.

Gemini API에 업로드된 파일은 48시간 후 자동 삭제되고, AI ASR Subtitle Generator 앱은 작업 완료 후 업로드한 파일을 삭제하는 기능이 내장되어 있다. 참고로 Google/Groq 등의 무료 API 정책은 예고 없이 변경될 수 있으며, 특정 기간이 지나면 유료로 전환될 가능성은 항상 존재한다.

0 comments:

댓글 쓰기

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요