구글은 전통적으로 페이지 랭크(Page Rank)라는 알고리듬을 써서 수학적 계산에 따라 검샘 결과의 랭킹을 매기는 것으로 알려져 있다. 혹시 특정 키워드에 따라 상위에 올라가는 검색 결과를 편집하고 있을까?

그런 주장을 하고 있는 분들을 가끔 본다. 구글 음모론 이나 구글의 '개인화'라는 글을 보면 특정 검색어에 대해 시장 점유율이나 사용자의 인식과 다르게 구글 자사 제품이 상단에 올라간다는 이야기다.

과연 구글은 검색 결과를 편집하고 있는 것일까?
그동안 검색 결과에서 구글이 자사의 제품을 홍보한다는 문제 제기가 있기도 했다. Blake Ross가 작년에 Google Tips 이라는 서비스에 대해 혹평을 한 이후 1주일 만에 그 기능이 문을 닫은 적이 있다. Calend, Photo sharing, Blogging 등의 검색어에 대해 자사 제품을 팁 처럼 올려 준 것이다. 하지만 이외에 내가 알기로 구글이 검색 결과를 편집한다는 폭로를 들은 적은 없다.

구글의 페이지 랭크는 매우 정교한 방식으로 구성되어 있으며 여러 가지 변수들을 가중치로 두고 있다고 한다. 우리 나라 웹 사이트에 대해 페이지 랭크를 측정할 수 있으며 이를 통해 웹 페이지 순위를 어느 정도 가늠해 볼 수 있다.

예를 들어 '개인화'는 구글-이화여대-ZDNet 순서로 나오고 있으며 이는 대체로 페이지 랭크 순위와 일치한다고 볼 수 있다. 사실 Google.com은 최상위 순위인 10점이고 백링크 갯수도 다른 웹 사이트 보다 월등히 많다. 특히 친 구글 성향의 블로그 같은 다양한 링크 생산지 때문에 비슷한 검색 결과라면 Google에 있는 서비스나 정보가 상위에 오를 가능성이 높다. 물론 검색만 하던 구글이 서비스가 하나씩 더 늘일 때 마다 이런 음모론은 계속될 가능성이 많다.

페이지 랭크는 만능이 아니다?
사실 구글이 항상 페이지 랭크에만 의존하는 것은 아니다. 워낙 검색 엔진 최적회(Search Engine Optimization) 기법에 의한 링크 어뷰징이 많기 때문에 이를 걸러 내기 위한 다양한 방법이 모색 되고 있다. 특히 구글에서는 Rater라는 직종을 통해 인위적 모니터링을 하고 있는 것으로 안다.

구글은 외주 업체를 통해 특정 검색 키워드에 대해 결과로 나온 웹 사이트가 광고 사이트인지 아니면 키워드에 적합한 사이트인지를 사람의 손에 의존해서 처리하고 있는 것이다. 이러한 인력의 규모가 적지 않고 전 세계적으로 각 언어별로 굉장히 많은 사람이 하고 있다. (요즘 미주 한인 주부들 사이에 인기 있는 아르바이트라고^^)

이러한 모니터링 결과는 실제로 의미있는 링크나 웹 페이지인지 가려내기 위한 것으로 페이지 랭크 계산에 필요한 데이터로 쓰는 것 같다.

또한, 과거의 정적 HTML을 기준으로 만든 웹 문서간 링크 계산에 따른 페이지 랭크는 오늘날 처럼 블로그를 비롯한 동적 문서가 많을 경우 빠르게 대처하지 못할 경우가 많다. 따라서, 최신 업데이트 주기   같은 것이 중요한 기준이 되고 있기도 하다.

해가 갈 수록 페이지 랭크가 완벽하지는 않을 것 같다. 또한, 중요한 몇 가지 작업이 사람의 손에 의해 이루어 지고 있다는 점도 인정해야 한다. 하지만, 적어도 국내 검색 포털 처럼 특정 중요 키워드에 대해 검색 결과 편집을 하고 있지는 않다. 만약 그렇다고 한다면 그 자체가 음모론이 아닐까?
Creative Commons License 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 라이센스에 따라 이용하실 수 있습니다.