2017/06/19

네이버 유사문서 필터링에서 제외되는 '구글 블로거'

네이버 유사문서 필터링에서 제외되는 '구글 블로거'

네이버 유사문서 필터링에서 제외되는 '블로거(Blogger)'

네이버가 구글을 개무시하는 것인지 아니면 검색 시스템 자체가 개허접해서 그런 것인지는 잘 모르겠지만, 구글 블로그인 ‘블로거(Blogger)’에 올린 글은 네이버 블로그 검색의 유사문서에서 제외된다는 점을 네이버 블로그와 블로거를 동시 운영해오길 몇 달이 지난 인제야 알게 되었다. 참고로 그동안 ‘책 리뷰’만큼은 블로거에 먼저 올리고 며칠 지난 다음 일부 내용만을 네이버 블로그에 올려 왔다. 그렇다고 블로거(Blogger)에 올린 글이 네이버 ‘웹문서’ 검색에 반영되지 않는 것은 아니다. 하지만, 예를 들어 ‘중국 공산당을 개혁하라 리뷰’라는 문장으로 구글에서 검색하면 내 블로거의 글이 첫 페이지에 뜨지만, 네이버 ‘웹문서’ 검색에서는 20페이지까지도 나타나지 않는 것으로 보아 사실상 네이버 ‘웹검색’ 시스템과 구글의 블로거는 궁합이 잘 맞지 않는 것 같다.

백업 블로그를 운영한다면 ‘블로거’추천

이로 말미암아 알 수 있는 유용한 사실은 두 개의 블로그를 동시에 운영하고 싶은 사람은 (특히 한 개의 블로그를 백업용으로 사용한다면) 유사문서 필터링을 신경 써야 하는 ‘네이버 + 티스토리’ 조합보다는 ‘네이버 + 블로거’ 조합을 추천할 수 있다는 것이다. 물론 이것은 어디까지나 현재의 사정이고 앞으로 네이버 유사문서 신경망이 뻗어나가는 마수의 손길이 어디까지 영향을 미칠지는 아무도 모르기 때문에 훗날 어떤 식으로 변할지는 아무도 알 수 없지만, 내 생각이지만 자사의 콘텐츠 확보 차원에서도 유사문서 시스템에 적용되는 범위를 굳이 구글 블로거까지는 확대하지는 않을 것 같다.

한편으로는 현재 네이버 블로그의 유일한 경쟁 상대가 티스토리이기 때문에 유사문서 적용 범위를 티스토리까지 확장한 것으로 보이지만, 만약 훗날 티스토리가 문을 닫고 그 빈틈을 구글 블로거가 밀고 들어온다면? 그땐 블로거도 네이버 유사문서 시스템의 감시 대상이 될 수도 있지만, 티스토리와는 비교조차 할 수 없는 그 어마어마한 콘텐츠 용량을 생각하면 과연 네이버가 감당해낼 수 있을지도 의문이다.

두 개의 블로그에 시간 차를 두고 올리는 것을 고려

아무튼, 오늘의 잡담에서 기필코 결론을 이끌어내야 한다면 백업용으로든 뭐든 두 개의 블로그를 운영하고자 한다면 ‘네이버 + 블로거’ 조합을, 그리고 그럴 때 구글 검색 결과에 블로거의 글을 우선순위를 두고 싶다면 해당 글을 블로거에 먼저 올리고 구글 검색에 반영되는 최소 4~5일 지난 다음에 앞의 글을 네이버에 올릴 것을 추천한다. 구글도 유사문서 검색 시스템이 있기 때문이다. 예를 들어 ‘취한 배 - 파멸적 허무주의적인 삶을 살다 요절한 자의 지독한 체취를 맡다’로 구글 검색하면 2017년 5월 7일에 네이버 블로그에 올린 글이 뜨고 블로거에 올린 글은 생략된다. 이때 [생략된 결과를 포함하여 다시 검색]하면 그때야 2017년 5월 5일에 블로거에 올린 글이 뜬다. 네이버 블로그보다 블로거에 이틀이나 먼저 올렸지만, 구글은 네이버 블로그에 올린 글의 손을 들어주었다. 공정한 모습을 보여주려고 일부러 네이버의 손을 들어준 것일까? 이럴 땐 구글이 얄밉다. 그런데 항상 그런 것도 아니다. 어쩔 땐 네이버 블로그보다 나중에 블로거에 올린 글이 구글 검색에 반영될 때도 있고, 같은 두 글이 유사문서에 걸리지 않고 고스란히 검색 결과에 나타날 때도 있다. 심오한 구글 제국의 세계는 도통 알 수가 없다. 아무튼, 이런저런 점을 고려해서 두 개의 블로그를 운영하면 될 듯싶다.

Robots.txt를 활용한 네이버 수집 차단

이 글을 수정하면서 알게된 사실인데 블로거는 Robots.txt를 지원한다. 고로, Robots.txt으로 네이버 검색로봇을 아래처럼 차단하면 네이버 유사문서 필터링에서 영원히 해방될 수 있을 것이다.

User-agent: NaverBot
Disallow: /

User-agent: Cowbot
Disallow: /

User-agent: Yeti
Disallow: /

댓글 4개:

  1. 작성자가 댓글을 삭제했습니다.

    답글삭제
    답글
    1. 네이버 블로그 저품질은 구글과는 상관없기에 말씀하신 대로 한다면 걱정할 것은 없을 것 같습니다. 다만, 현재 네이버 블로그에 올린 글이 구글에서 검색이 안 되고 있다는 점이 조금 걱정스럽습니다.

      삭제
  2. 작성자가 댓글을 삭제했습니다.

    답글삭제
    답글
    1. 구글에서도 같은 문서가 두 개 검색된다면, 원본만 반영됩니다. 그리고 제가 알기에는 구글에 저품질 블로그 같은 것은 없습니다. 느낌상 구글은 글 하나하나에 품질을 따로따로 매기는 것 같습니다. 네이버처럼 글 하나 잘 못 올려 블로그가 죽지는 않습니다. 그냥 그 글만 죽는다고 보면 됩니다. 고로 같은 글을 두 군데에 올려야 한다면 구글에 먼저 글을 올리고, 2~3일 지나고 나서 네이버에 올리는 것이 나을 것 같습니다. 네이버는 구글 블로그의 글을 네이버 유사문서 필터링에 포함시키지 않으니까 말입니다.

      삭제

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요