구글이 창사 이래 최악의 실수를 저질렀다. 두 시간 가량 구글 검색 엔진에 포함된 모든 웹 사이트를 악성 코드 배포 사이트로 표시했기 때문이다.

미국 시간 1월 31일 오전 6시 부터 8시까지 구글 검색의 모든 웹 사이트를 악성 코드 배포 사이트 표시하거나 Gmail에서 스팸 필터링에 의해 정상 메일을 스팸으로 인지 하는 사고가 발생했다.

그 결과 모든 링크가 악성 사이트를 관리 지침을 만드는 비영리 기관인 StopBadWare.org로 집중 됨에 따라 몸살을 앓기도 했다. 많은 사람들이 StopBadWare.org가 잘못된 정보를 구글에 전달해서 그런것으로 오해를 했고 이에 대한 시정 요구 공지가 올라오기도 했다.

기술도 막지 못한 최악의 인재
사고가 일어난지 한 시간만에  구글은 사이트를 한시간 만에 복구함과 동시에 악성 사이트 관리를 하는 사람이 "/"를 추가하는 바람에 일어난 실수라고 공식 인정했다.

사용자 삽입 이미지

일단 이번 사건은 구글 플랫폼의 신뢰도를 크게 떨어뜨리는 결정적인 계기가 될 확률이 높다. 악성 코드 배포 사이트 목록 관리를 자동 혹은 수동으로 편집하고 있었다고 시인했으며 결정적으로 사람의 손에 의존하고 있었음을 반증하는 것이다. (구글 편집 음모론 참조)

멀웨어 인지하는 작업은 아마 일개 아르바이트에 의해 이루어졌을 것으로 생각되는데 이들이 만든 목록을 전체 검색 엔진에 업로드하는 과정에서 URL 유효성 검증 정도는 기술적으로 쉽게 할수 있었을 것이다.

그럼에도 불구하고 이를 전체 서버에 적용(Deployment)하는 과정에서 오류를 냈기 때문에 적용 프로세스에 대한 문제도 있는 것 같다. 이에 대한 상세한 조사 결과를 공식적으로 나올 것 같다. (이는 작년 Daum의 한메일 사고와 거의 유사하다고 볼 수 있다.)

돋보이는 빠른 시정 능력
하지만, 구글의 대응 능력은 높히 사야 할 것 같다.  대략 문제 발생 한시간 정도 만에 자신들의 문제를 시정하고, 한 시간 후에 실수를 인정하는 공식 입장을 내 놓았다. 지메일 공지를 보면 문제의 배포 목록이 업로드 된 시간은 대략 새벽 6시 이것이 배포된 시점은 30분 후인 6시 30분이다. 문제를 인지한 것은 6시 50분이고 이를 시정한건 대략 7시 20분경이다.

구글 검색 엔진 인덱스는 '검색 인덱스'를 조각내 가진 천 여대의 서버가 한 세트로  이루어진 분산형 클러스터 박스로 이루어져 있다. 이 박수의 갯수는 적어도 수 만개가 있는 것으로 알려져 있다. 악성 배포 사이트 목록은 인덱스에 포함될 수 밖에 없는 성질의 것이기 때문에 인덱스를 새로 생성해서 배포를 해야 하는 것으로 생각된다.

그런데, 이 작업을 30분 만에 했다는 것은 거의 불가사의한 일이다. 물론 클러스터 박스가 가진 백업 데이터를 롤백(Roll back)했다고 볼 수 도 있는 데 그렇다고 해도 30분이라는 시간내에 수십만대 서버를 롤백했다는 것은 굉장히 빠른 속도이다.

아마 수 백대 아니 수 십대 서버에 서비스 적용(Deployment)를 해 본 사람이라면 이게 얼마나 빠르게 된 것인지 알 수 있을 것이다.

구글은  2006년에 분기당 10만대의 서버를 추가하고 있었고, 그로 인해 2007년  5천억건의 웹페이지를 인덱싱했다. 2008년 1조(兆)개의 웹 페이지를 인덱싱 하고 있는 걸로 봐서 총 서버 숫자가 100만대는 훨씬 넘는 것으로 알려져 있다.

악성 사이트 구분 노력 계속 되어야
어제 일어난 문제는 명백히 구글 내부의 실수로 밝혀졌지만, 솔직히 악성 배포 사이트에 대한 표시에 대한 오류는 이전에도 계속 제기되어 왔던 문제점이다. 구글의 데이터를 이용해서 파이어폭스, 사파리, 크롬 등 웹 브라우저들도 서비스를 제공하고 있기 때문에 Facebook을 악성 사이트로 표시하거나 하는 사건이 빈번히 일어나고 있다. 

물론 웹의 규모가 커짐에 따라 악성 코드 배포 사이트는 기하급수적으로 늘고 있고 이에 대한 해결책이 마련되고 있다. 하지만 이런 중요한 일이 하나의 검색 엔진에만 의해서 맡겨진다면 인터넷의 또 다른 위협이 될 지도 모르는 일이다.

검색 엔진을 통한 악성 사이트 구분 문제는 이어지는 ‘악성 사이트 차단’ 만능일까?을 참조하시면 더 자세한 것을 알 수 있습니다.