구글 ‘편집’ 음모론

구글은 전통적으로 페이지 랭크(Page Rank)라는 알고리듬을 써서 수학적 계산에 따라 검샘 결과의 랭킹을 매기는 것으로 알려져 있다. 혹시 특정 키워드에 따라 상위에 올라가는 검색 결과를 편집하고 있을까?

그런 주장을 하고 있는 분들을 가끔 본다. 구글 음모론 이나 구글의 ‘개인화’라는 글을 보면 특정 검색어에 대해 시장 점유율이나 사용자의 인식과 다르게 구글 자사 제품이 상단에 올라간다는 이야기다.

과연 구글은 검색 결과를 편집하고 있는 것일까?
그동안 검색 결과에서 구글이 자사의 제품을 홍보한다는 문제 제기가 있기도 했다. Blake Ross가 작년에 Google Tips 이라는 서비스에 대해 혹평을 한 이후 1주일 만에 그 기능이 문을 닫은 적이 있다. Calend, Photo sharing, Blogging 등의 검색어에 대해 자사 제품을 팁 처럼 올려 준 것이다. 하지만 이외에 내가 알기로 구글이 검색 결과를 편집한다는 폭로를 들은 적은 없다.

구글의 페이지 랭크는 매우 정교한 방식으로 구성되어 있으며 여러 가지 변수들을 가중치로 두고 있다고 한다. 우리 나라 웹 사이트에 대해 페이지 랭크를 측정할 수 있으며 이를 통해 웹 페이지 순위를 어느 정도 가늠해 볼 수 있다.

예를 들어 ‘개인화’는 구글-이화여대-ZDNet 순서로 나오고 있으며 이는 대체로 페이지 랭크 순위와 일치한다고 볼 수 있다. 사실 Google.com은 최상위 순위인 10점이고 백링크 갯수도 다른 웹 사이트 보다 월등히 많다. 특히 친 구글 성향의 블로그 같은 다양한 링크 생산지 때문에 비슷한 검색 결과라면 Google에 있는 서비스나 정보가 상위에 오를 가능성이 높다. 물론 검색만 하던 구글이 서비스가 하나씩 더 늘일 때 마다 이런 음모론은 계속될 가능성이 많다.

페이지 랭크는 만능이 아니다?
사실 구글이 항상 페이지 랭크에만 의존하는 것은 아니다. 워낙 검색 엔진 최적회(Search Engine Optimization) 기법에 의한 링크 어뷰징이 많기 때문에 이를 걸러 내기 위한 다양한 방법이 모색 되고 있다. 특히 구글에서는 Rater라는 직종을 통해 인위적 모니터링을 하고 있는 것으로 안다.

구글은 외주 업체를 통해 특정 검색 키워드에 대해 결과로 나온 웹 사이트가 광고 사이트인지 아니면 키워드에 적합한 사이트인지를 사람의 손에 의존해서 처리하고 있는 것이다. 이러한 인력의 규모가 적지 않고 전 세계적으로 각 언어별로 굉장히 많은 사람이 하고 있다. (요즘 미주 한인 주부들 사이에 인기 있는 아르바이트라고^^)

이러한 모니터링 결과는 실제로 의미있는 링크나 웹 페이지인지 가려내기 위한 것으로 페이지 랭크 계산에 필요한 데이터로 쓰는 것 같다.

또한, 과거의 정적 HTML을 기준으로 만든 웹 문서간 링크 계산에 따른 페이지 랭크는 오늘날 처럼 블로그를 비롯한 동적 문서가 많을 경우 빠르게 대처하지 못할 경우가 많다. 따라서, 최신 업데이트 주기   같은 것이 중요한 기준이 되고 있기도 하다.

해가 갈 수록 페이지 랭크가 완벽하지는 않을 것 같다. 또한, 중요한 몇 가지 작업이 사람의 손에 의해 이루어 지고 있다는 점도 인정해야 한다. 하지만, 적어도 국내 검색 포털 처럼 특정 중요 키워드에 대해 검색 결과 편집을 하고 있지는 않다. 만약 그렇다고 한다면 그 자체가 음모론이 아닐까?

- ;

Disclaimer- 본 글은 개인적인 의견일 뿐 제가 재직했거나 하고 있는 기업의 공식 입장을 대변하거나 그 의견을 반영하는 것이 아닙니다. 사실 확인 및 개인 투자의 판단에 대해서는 독자 개인의 책임에 있으며, 상업적 활용 및 뉴스 매체의 인용 역시 금지함을 양해해 주시기 바랍니다. 본 채널은 광고를 비롯 어떠한 수익도 창출하지 않습니다. (The opinions expressed here are my own and do not necessarily represent those of current or past employers. Please note that you are solely responsible for your judgment on checking facts for your investments and prohibit your citations as commercial content or news sources. This channel does not monetize via any advertising.)

여러분의 생각 (11개)

  1. hooney 댓글:

    페이지랭크를 확인할 때마다 느끼는 거지만, 제 블로그가 rank 7이라는 것이 믿기지 않답니다. ^^;

    차니님이 링크해주신 페이지에서 확인하니, 137위네요. kldp나 chosun.com도 그렇지만, myspace.com보다 높아서 당황스러울뿐이네요;;;

  2. 석찬님의 블로그에서 발견한 이삼구님의 사이트에 있는 국내 사이트 PageRank 순위를 보았더니 태우’s log가 402등으로 나와있다. 이는 천리안 (404), 지마켓 (407), 한겨레 (410), DC인사이드 (417),…

  3. 채원석 댓글:

    항상 글 잘 읽고 있다가 첨 답글 씁니다…죄송…
    근데, 오늘 내용중 첨듣는 이야기가 있어서 구글링을 하니…

    Did you mean: google rater

    ^_^

    항상 좋은 글 많이 부탁드립니다.

  4. 독자 댓글:

    검색결과 일부는 구글에서 편집하는 걸로 알고 있는데요…

    어떤 사이트는 구글 검색결과에서 전에는 나왔는데 얼마후부터 삭제되어 아예 안 나왔다죠…

  5. fromeric 댓글:

    페이지랭킹는 구글이 웹페이지의 중요도를 매기는 단위로, 그 페이지를 링크한 페이지가 많을수록 높아집니다. 그리고 랭킹이 높은 페이지가 링크 했을수록 더 효과는 큽니다. 위 그림을 참고하면 이해하는데 도움이 될겁니다. 초록,빨강,파랑,노랑 순으로 높은 랭킹을 의미합니다. 그림에서 윗부분에 있는 빨간색과 가장왼쪽에 있는 초록색은 외부로부터 받는 링크가 똑같이 한개 뿐인데, 위에있는 것의 랭킹이 더 높죠? 이유는 랭킹이 가장높은 노란 동그라미로부터 링크가..

  6. 나루나루 댓글:

    구글이 검색결과를 편집한다는 음모론은 꾸준히 제기되어 왔죠.

    허나 실제로 그런 일은 없을 가능성이 높다는 것,

    예를들어 전의 천안문 건만 해도, 실은 국가별로 구글은 다른 검색 페이지를 보여주는 일 때문에 생긴 해프닝 이었죠.

    실제로 4294967296이라는 검색어를[정치적으로 아무런 관계 없는 2^32값일뿐인 검색어] 구글 ‘한국’ ‘일본’에 각각 쳐보면 서로 다른 검색값이 나온다죠[물론 검색 설정은’한국어 페이지’ 가 아닌 전체로 하였습니다]

  7. 나이 댓글:

    이런식으로 따지면 네이버의 최사장은 구속이다 구속!~
    검색서비스에서 인위성을 완전히 배제할 수는 없는가!!
    검색포탈의 사정을 이해는 하면서도 안타깝네요.

  8. shyjune 댓글:

    검색도 보안하고 같은 길을 가는걸까요? 검색 로직과 SEO Abuser 들의 먹고 먹히는 싸움 가운데 진화하는. 잘 보고 갑니다.

  9. ftd 댓글:

    나도 내생각으로는 어느정도 편집한다고 생각하는데, 수동이 아닌 잦은 바꿈으로 조절한다고 생각해요

  10. homestayin 댓글:

    안녕하세요? homestayin.com입니다. 블로그가 7까지 가신적이 있으셨다니 대단하십니다. 구글의 알고리즘이 업데이트 된 이후 많은 블로그들의 PR이 떨어진 듯 합니다.
    편집은 할 수 있다고 생각됩니다. 구글의 수익적인 측면에서 어쩌면 당연할 수도 있겠지요. 하지만 장기적 관점에서 핵심 로직은 손대지 않을 것이며 편집도 특정 키워드에 한해, 그러니까 수익에 지대한 영향을 주는 범위 내에서 조절하겠지요. 좋은 글 잘읽었습니다.