2020/08/28

바이두 초전 링크로 4G 이상 빠른 업로드

바이두 표준 추출 코드(초전 링크)로 4G 이상 파일 빠르게 업로드하는 방법

바이두 넷디스크 인터페이스 변경과 Alibaba Cloud Disk와 유사한 로컬 + 클라우드 양방향 검증 2차 전송 전략의 채택으로 인해 기존 초전송 링크는 기능은 완전히 종료됨!

바이두 표준 추출 코드 형식
<바이두 초전 링크 형식>

해시값으로 중복 저장을 단속하는 중국 클라우드

바이두 넷디스크 등 중국의 개인 클라우드 서버의 파일 관리는 구글, 드롭박스, 원드라이브 등의 다른 클라우드 서비스와는 다르다. 알다시피 바이두, 6판, 115 클라우드, PikPak, TeraBox는 파일의 해시값 등을 사용하여 서버에 파일이 중복으로 저장되는 것을 원천적으로 봉쇄한다.

만약 내가 오늘 AAAAAA라는 해시값을 가진 동영상 파일을 바이두 서버에 처음으로 업로드했다고 치자. 그런데 다음 날 누군가 같은 파일을 바이두에 업로드할 때, 일반적인 클라우드 서버는 어제 내가 올린 파일과 다음 날 누군가 올린 파일이 같은 파일이라고 해도 서버에선 다른 파일로 취급하여 각각 따로 저장된다(원칙은 이렇지만, 실제로도 그렇게 처리하는지 우리로서는 알 수 없다).

그런데 바이두는 누군가 서버에 파일을 업로드할 때 나름의 해시값을 산출한다(그래서 바이두는 파일을 업로드할 때 업로드를 바로 시작하지 않고, 해시값을 추출하는 과정을 먼저 시작하기 때문에 하드디스크를 무진장 긁어대는 것이다). 그렇게 해서 만약 서버에 같은 파일이 존재하면 업로드 과정 없이 바로 서버에 저장된다. 일명 ‘빠른 업로드(혹은 빠른 전송, 초전 링크, 秒传链接)’라고 불리는 기능이다. 다시 말해 서버 어딘가에 같은 파일이 존재하면 우리가 단축 아이콘 만들듯이 파일의 링크만을 생성하는 것이다.

앞에서도 말했듯 이런 방식은 중복 파일을 방지할 수 있으므로 저장 공간의 낭비를 막을 수 있다. 바이두로선 저장 공간 비용을 절약할 수 있어 좋고, 사용자로선 지루한 업로드 시간을 줄일 수 있어 좋다. 하지만, 어떤 이유에서든 파일에 문제가 생기면, 그 파일 링크를 소유한 모든 사용자에게도 문제가 생긴다는 단점이 있다(아직 이런 문제는 없었고, 바이두 정도의 기술력이라면 앞으로도 없을 것이다).

아무튼, 이런 방식 때문에 중국 클라우드만의 특별 서비스인 [오프라인 다운로드]가 가능한 것이니 나로선 이의를 제기할 이유가 없다. 중국 특유의 실용주의와 공유 정신이 엿보이는 방법이지만, 다른 나라에선 ‘저작권’과 ‘개인정보’라는 잣대를 들이대며 사용하지 않는다.

이번에도 도움을 주는 템퍼몽키 스크립트
<여러모로 도움을 주는 템퍼몽키 스크립트>

度盘标准提取码(다이얼 표준 추출 코드)

그럼 이런 꼼수를 생각해볼 수 있다.

만약 바이두 넷디스크가 이용하는 파일 해시값 추출 형식을 알면, 그 해시값만으로 파일 업로드를 완료할 수 있지 않을까?

바로 그 일을 해주는 것이 度盘标准提取码(다이얼 표준 추출 코드)와 秒传链接提取(초전 링크 추출) 템퍼몽키 스크립트다. 하나는 윈도우에서 파일의 바이두 표준 추출 코드(해시값)를 계산하는 프로그램이고, 하나는 앞에서 생성한 추출 코드를 바이두 웹페이지에서 파일로 전환해주는 스크립트다.

표준 추출 코드/초전 링크 사용법

1. 度盘标准提取码 다운로드

2. 百度网盘秒传链接提取(最新可维护版本) 스크립트 설치(템퍼몽키 확장프로그램 필요, 초전 링크 생성도 가능)

3. 度盘标准提取码 실행 후 표준 추출 코드 생성

★ 표준 추출 코드 웹 버전은 百度网盘秒传链接生成(바이두 넷디스크 초전송 링크 생성)를 참고

4. 바이두 웹페이지의 [秒传链接(초전 링크)]를 이용해 표준 추출 코드를 파일로 전환

표준 추출 코드 생성 프로그램

ducode_ENU.7z


구 버전 ducode_ENU.7z / 공유 암호: k4ki / 압축 암호: singingdalong

바이두 표준 추출 코드 생성 프로그램
<바이두 표준 추출 코드 생성 프로그램>

표준 추출 코드 형식
<完整 MD5> # <片段 MD5> # <文件长度> # <文件名>
<전체 MD5> # <조각 MD5> # <파일 길이> # <파일명>

표준 추출 코드, 무엇에 쓸 수 있을까?

아쉽게도 바이두 표준 추출 코드는 하나의 해시값만으로 이루어진 것이 아니다. 만약 추출 코드가 MD5값 하나만으로 완성된다면, 사용자는 원본 파일이 없어도 인터넷에서 쉽게 발견할 수 있는 MD5값으로 업로드를 대신에 할 수 있으므로 상당히 위험하다.

표준 추출 코드를 이용한 업로드의 장점은 지금으로선 무료 사용자가 4G 이상 파일을 업로드할 수 있다는 것 빼곤 딱히 생각나는 것이 없다. 또 하나 있다면, 이런저런 이유(불법, 저작권 등)로 공유 금지된 파일을 공유할 수 있다.

표준 추출 코드의 활용성은 앞으로 좀 더 생각해봐야 할 문제다. 이대로 묵힐 수도 있고, 이를 이용한 뭔가 대단한 트릭을 발견할 수도 있다. 일단은 그냥 이런 것이 있다는 것 정도는 알아두면 언젠가 쓸모가 있을 날이 올지 모른다는 안일한 마음에 몇 자 적어봤다.

하나 생각났다. 바이두에 표준 추출 코드만 저장함으로써 저장 공간을 절약할 수 있지 않을까 싶다.

2021/01/09: BaiduPCS-Go의 초전송 기능을 이용하면, 「구글 드라이브에서 바이두로 대용량 파일 빠르게 전송」하는 것이 가능!
2022/07/28: 「바이두 넷디스크 저장 공간 무제한 확장 팁

댓글 8개:

  1. 안녕하세요. ^^ 윈도우10설치중 오류가 생겨 웹검색중 우연히 아래 링크를 보게 되었습니다. 저역시 동일한 오류가 생겼습니다. 아래 방법이 구체적으로 어떻게 해야 하는것인지 잘모르겠습니다. 쉽게 알 수있는 방법 있을지 조심스럽게 문의드립니다.

    content://com.sec.android.app.sbrowser/readinglist/0827224750.mhtml

    답글삭제
    답글
    1. 무슨 오류인가요? 해당 링크로는 아무것도 찾을 수가 없습니다.

      삭제
    2. usb로 부팅디스크 만들어서 윈도우10 설치시에 아래 2가지 오류가 나며 진행이 되지 않습니다.
      1. 이컴퓨터의 하드웨어에서 winows를 실행하도록 구성하지 못했습니다.
      2. 컴퓨터가 예기치 않게 다시 시작되었거나 오류가 발생했습니다. windows 설치를 계속할 수 없습니다. windows를 설치하려면 확인을 클릭하여 컴퓨터를 다시 시작한 다음 설치를 다시 시작하십시요.

      가상머신으로 햐결하셨다는 게시글을 보았습니다. 저도 한번 해보려고 하는데, 방법을 잘모르겠습니다.

      삭제
    3. 해당 글에다 댓글을 남겨주셨으면 이해하기 쉬웠을 텐데 아쉽네요.
      기본적인 가상 머신 사용법을 아셔야 합니다. VirtualBox는 사용하기 쉬우니 구글에서 정보를 찾아 윈도우 설치를 해보세요. 생각보다 아주 간단합니다.

      삭제
  2. 转存完毕 共1个 失败1个! 전송 완료, 총 1 개, 실패 1 개! 失败原因:文件不存在(秒传无效)(#404) 실패 이유 : 파일이 존재하지 않습니다 (두 번째 전송이 유효하지 않음) 라고 나오는데 해결방법이 있을까요? 크기 작은 파일도, 4G 이상 파일도 다 저렇게 나오네요..

    답글삭제
    답글
    1. 그 파일들이 바이두 서버에 없는 겁니다. 서버에 있는 파일만 빠른 업로드가 가능합니다.

      삭제
    2. 그렇군요 감사합니다!

      삭제

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요