줄 단위 번역의 한계를 넘어, Google AI Studio와 XML 변환으로 문맥 • 서사를 살린 고품질 자막 번역! 100만 토큰 맥락 유지, 타임스탬프 오류 해결까지 한 번에. 사람 번역가 못지않은 고품질 자막 번역, 이제 직접 한다.
줄 단위 번역기의 한계와 문맥 번역의 필요성
사람들이 많이 사용하는 자막 편집/번역기인 Subtitle Edit를 비롯해 srt 자막 파일 번역기는 지천으로 널렸다. 그럼에도 「Gemini API 기반 EPUB/TXT/SRT/DOCX 만능 번역기」를 고집하는 이유는 단순히 내가 직접 제작했다는 애착 때문이 아니다. 바로 AI의 가장 큰 장점인 문맥의 흐름을 이해하는 번역이 가능하기 때문이다. 이 앱은 ‘청크 단위 처리’와 ‘이전 문맥 참조’라는 두 가지 기능으로 인해 번역의 품질과 메커니즘 측면에서 기존의 줄 단위 번역기들과는 체급이 다른 서사 지향적 번역, 즉 문맥/대화의 흐름이 자연스러운 번역이 가능하다.
하지만, 초보자의 경우 사용하기 어렵다, 혹은 무료 사용자의 경우 제미나이 프로 모델을 사용할 수 없다는 단점이 있다. 그렇다면 초보자는 구글 AI 스튜디오에서 제미나이 프로 모델을 사용해 자막이나 원서를 번역할 것을 추천한다.
초보자를 위한 최강 대안, Google AI Studio
Google AI Studio는 개발 지식이 없는 초보자에게 가장 강력한 대안이다, 여기서 앱 개발, 자막 번역, 소설 등의 원서 번역, 이미지 생성 등 원하는 작업을 하면 된다.
Google AI Studio에서 자막/원서 번역 시 장점은 (한 세션(채팅창) 안에서 작업을 계속한다는 전제하에) ‘나무’를 보면서도 ‘숲’을 놓치지 않는, 즉 맥락/서사 흐름을 이어가는 번역이 가능하다는 점이다. 예를 들어, Subtitle Edit이나 일반적인 API 번역 도구는 SRT 파일을 처리할 때, 각 자막을 한 줄(또는 두 줄)을 독립된 문장으로 취급하여 API에 던진다. 고로 "No."라는 자막이 있을 때, 앞뒤 내용을 모르는 AI는 이것이 "아니오", "싫어", "없어", "안 돼" 중 무엇인지 찍어야 한다. 하지만, Google AI Studio에서 번역하면 AI는 이전에 입력된 모든 텍스트(이전 자막 파트)를 '단기 기억'으로 가지고 있으므로, AI는 "No." 앞의 대사가 "밥 먹었니?"인지 "거기 갈 거야?"인지를 확인한 다음 상황에 맞는 정확한 한국어 번역을 내놓는다.
또한, Google AI Studio의 경우 입력 토큰 한도도 100만 토큰으로 매우 널널하다. 100만 토큰이라고 하니까 도대체 얼마나 되는 텍스트 분량인지 도저히 감이 안 잡히는 분들을 위해 덧붙이면, 김용 선생의 ‘영웅문 1부’로 알려진 『사조영웅전』의 텍본 총량이 대략 92만 토큰이다. 다만 무료 사용자는 일일 출력 토큰 제한이 있는데, 이는 경험에 비추어보면 최대 20~30만 토큰, 또는 서버 사용량에 따라 그 이하인 경우도 있는 것 같다. 20~30만 토큰은 소설 1권 분량이고, 역시 무료 사용자에겐 충분한 용량이다. 만약 오늘 완료하지 못한 번역은 사용량이 리셋되는 다음 날 오후 5시 이후에 이어가면 된다. 원서를 번역할 경우 어차피 하루에 1권을 다 읽는 경우는 드물므로, 틈틈이 번역하면 된다.
그런데 Google AI Studio에서 자막 번역할 때 한 가지 치명적인 단점이 있다. 바로 AI가 가끔 타임스탬프를 빼먹는 등 자막 형식을 깰 수 있다는 점이다.
AI가 타임스탬프를 망가뜨리는 이유
![]() |
| <SRT 자막 형식을 XML 형식으로 변환> |
![]() |
| <> |
이는 AI가 SRT 자막의 숫자(타임코드)를 ‘입력된 텍스트’로 취급하기 때문에 발생하는 문제인데, 아무리 프롬프트에 똑바르게 명시해 줘도 영 고쳐지지 않는다. 노련한 사람은 Subtitle Edit에서 번역된 자막(타임라인이 살짝 어긋난)과 원본 자막을 대조하면서 수정하면 되지만, 여간 번거로운 작업이 아니다. 이 문제는 자막 형식을 AI가 가장 좋아하고, 그리고 가장 익숙한 형식인 XML 형식으로 변환해 주면 완벽하게 해결된다. 참고로 LLM은 수많은 코드 데이터를 학습했기 때문에,
<entry index="1"><text>...</text></entry>
같은 구조를 보면 본능적으로 ‘구조를 깨면 안 된다’고 인지한다고 한다. 한편으론, XML 포맷을 사용하면 토큰 사용량도 절약할 수 있다.
그래서 만든 앱이 ‘통합 번역 도우미’다. 이는 내가 자막/원서 등을 번역할 때 사용하는 이런저런 잡다한 도구들을 모아 놓은 잡동사니 같은 앱인데, 이 앱엔 ‘SRT <-> XML’ 변환 기능이 있다.->
[SRT 도구] 탭에서 번역해야 할 원본 파일을 XML 형식으로 변환 후, 이 XML 포맷을 그대로 유지한 채 Google AI Studio에서 번역한다, 그렇게 번역이 완료된 XML 파일을 [SRT 복구] 탭에서 원래의 SRT 형식으로 복구하는 것이다. 참고로 복구할 땐 좌측엔 원본 SRT 파일, 우측엔 번역된 XML 파일을 넣으면 된다.
⬇ 번역 통합 도우미 다운로드(업데이트: 2026/02/25)
v2.4: 픽팍 다운
완성도 높은 자막 번역 단계별 가이드
자, 이제 준비는 얼추 끝났으니, 실제 자막 번역 작업에 들어가 보자.
- 1. 통합 번역 도우미 앱으로 번역해야 할 자막을 XML 형식으로 변환.
- 2. Google AI Studio에 XML 자막 파일을 통째로 투척한 후, 영화에 대한 개략적인 설명을 (자세하고 명확할수록 좋음) 덧붙이면서 번역용 프롬프트를 추출한다.
예: 이 자막은 X연도에 제작된 X 감독의 X가 주연한 영화 XX의 영어 자막입니다. 이 자막을 한국어로 번역할 예정입니다. 번역에 적합한 최상의 프롬프트를 작성해 주세요. 더불어 원본의 XML 형식을 반드시 유지해야 합니다. - 3. 프롬프트가 완성되면, 채팅창에 ‘<entry index="1">부터 <entry index="100">까지 앞서 생성한 프롬프트를 사용해 번역해 주세요.’(이미 전체 XML 파일이 입력되어 있기 때문에, 여기선 index 번호만 명시해 주면 된다. 만약 새 채팅장에서 작업하면 해당 텍스트를 채팅창에 붙여 넣으면 된다).
- 4. <entry index="101">부터 <entry index="200">까지 번역해 주세요. 앞서 번역한 텍스트를 서사 흐름 파악/대화 말투와 용어의 일관성 유지를 위한 맥락/참조 목적으로 참고하고, 절대 다시 번역하지 마세요.
10분이면 영화 한 편 뚝딱 번역
이런 식으로 마지막 index까지 번역 완료 후 [SRT 복구] 탭에서 SRT 형식으로 변환하면 된다. 한 번에 번역할 index의 양은 적을수록 번역 품질이 좋아지지만, 그만큼 수고롭다. 오늘 테스트는 100씩(타임라인 100개씩) 번역했지만, 300~500으로 설정해도 번역 품질은 훌륭했고, 테스트 삼아 40분 분량의 중국 드라마 1편(대략 400라인)을 통째로 번역해 봤는데, 이 역시 훌륭했다(이럴 땐 한 번에 1화, 2화, 이렇게 순차적으로 번역하면 되고, AI는 앞선 내용을 기억하므로 서사 흐름/대화 말투/용어 일관성 유지 등이 가능하다). 한 번에 몇 라인씩 번역할 것인가, 하는 문제는 딱히 정답은 없으므로 각자 알아서 판단해야 할 문제지만, 너무 많으면 (예를 들면, 1,000라인 이상) 번역 품질도 떨어지지만, 출력이 중간에 멈추는 경우가 있으므로 주의해야 한다.
참고로 「영춘각지풍파(迎春閣之風派, 1973)」, 「대취협(大醉俠, 1966)」, 「용문객잔(龍門客棧, 1967)」, 「병원 고개의 목매달아 죽은 이의 집(病院坂の首縊りの家, 1979)」, 「Revenge of the Creature(1955) / The Creature Walks Among Us(1956)」 등이 위의 방법으로 번역한 자막들이다. 그리고 가장 최근에 번역한 「Revenge of the Creature(1955)」는 100라인씩 번역했고, 「The Creature Walks Among Us(1956)」 200라인씩 번역했는데, 제미나이 3.1 프로라서 그런지 번역 품질에 큰 차이는 없었다.
영화 한 편 번역하는 데 몇십 분 안 걸린다. 이제 구차하게 남에게 부탁하지 말고, 직접 번역해서 감상하자. 해보면 알겠지만, 웬만한 사람 번역가보다 나은 것이, 요즘의 AI 번역 품질이다.
![통합 번역 도우미의 [SRT 도구]로 SRT 자막 형식을 XML 형식으로 변환](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj15GNIJqIWZ-MW6_bT4que7ohOkGQnreU5g_BkA7xb6kzqF3jbUlefEyz2Dwja-E-DdkfmFdxSGva-aQ0BslApDOVYPJGNkOwEU2t7Je7WA5WMSXsxofcHaJrA1JQaIQG8WKzRVN_dfoQr5RWmu8y6xVxH72Wt-TrUF578X0jgUPxH4cGzBTp7j6wTTzGH/w400-h352-rw/Subtitle-translation-in-Google-AI-Studio-02.webp)
![통합 번역 도우미의 [SRT 복구]로 번역한 XML 파일을 SRT 형식으로 복구](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj3wGaV5zSEiN-yUoYt2ZPENPiCQ2XSjz9ui_4nL5Stw-_ZxAQ_Rfjr1RH3UTn7KTKu4V7YN06JFt03uuxBY1s4VsTfFiZ76vkDbk4JdhkCS4Xs0ZreR6HaWqwKidI80BTtjAQyIkCd-_EdvC4YPAi52-jQPXIqTBXZMuLwBePanP-cRzdlDqZyDxwVRgps/w400-h352-rw/Subtitle-translation-in-Google-AI-Studio-03.webp)
바이두 넷디스크 팁
기타 벤치마크 자료
Windows 팁
srt 를 50개씩 잘라서 순번을 맥이고 키로를 통해서 엔진 (소넷) 사용중입니다 윗방법대로 아직 시도는 안해봣서요 문제가 자꾸 저작권이 들먹이면서 번역을 중단하더군요 이렇게 한꺼번에 시도하면 하다가 중간에 자막번역을 중단할경우 어떻게 해야 할까요? 중단부분 부터 시도할수있나요?
답글삭제소넷이 Grok을 말하는 건가요? 번역 품질이 제미나이보다 많이 떨어져서 번역엔 사용하지 않습니다. 다만, 성인물 검열은 약해서 AV 번역할 땐 최고죠.
삭제제미나이로 영화 자막 번역하면서 콘텐츠 필터링에 걸려본 기억은 없는 것 같습니다. 반면에 AV 자막 번역할 땐, 자주 걸리는데, 이땐 [이어 하기] 신공이나 자막을 더욱 쪼개 번역하면 됩니다. 만약 1~300라인 번역 자막이 출력되다가, 검열 혹은 서버 문제로 250라인에서 출력이 중단되면, 250라인부터 다시 번역해달라고 하면 됩니다. AI와 대화하거나 뭔가를 요구할 땐 사람 대하듯 하시면 됩니다.
‘어, 중간에 번역이 끊겼네. 끊긴 부분부터 다시 해줘’
참고로 제미나이에서 AV 자막 같은 성인물 번역할 때 검열은 특정 단어를 검열하기보다는 앞뒤 맥락을 파악한 다음 그 내용을 검열합니다. 그래서 자막을 쪼개면 필터링을 우회할 수 있는 겁니다.