아직 준비가 덜된 구글 앱스

지난 주 가장 큰 이슈 중 하나가 ‘Gmail 장애’ 소식이었다.

2004년 초부터 개인 메일로 쓰고 있는 나로서도 가끔 짧은 서버 장애를 본 적이 있지만 이처럼 많은 사용자에게 영향을 주는 대규모 장애는 처음이었던 것 같다.

트위터에서는 구글 장애에 대한 피드백이 엄청나게 쏟아졌고, 구글은 이례적으로 사과 공지를 하기까지 했다. 이번 장애가 일반 사용자들 뿐 아니라 직원들까지 영향을 받았다는 신파적인 내용을 담아서…

사용자 삽입 이미지
문제의 심각성을 인지해서 였는지 구글 앱스 상태 리포트를 바로 오픈 했다. 각 구글 애플리케이션의 날짜별 장애 현황 및 해결 상태를 볼 수 있는데, 이는 트위터의 것을 모델로 빠르게 대응한 것으로 보인다.

사용자 삽입 이미지
물론 지메일은 아직 야후!메일이나 핫메일에 비해 주류 웹메일 서비스는 아니다. 구글 전체 트래픽 중에서도 6%정도만을 차지하고 있다. 하지만, 사용자 대부분이 대학생이거나 말많은(?) IT 계통 사람들임을 감안하면 이 정도 규모 장애를 가볍게 넘길 수 없다.

특히, 사고 시간 동안 구글에 돈을 내며 지메일로 업무를 처리하던 기업들은 발만 동동 굴러야 했다. 지메일상에 저장해놨던 주요 문건들을 열람할 수 없었고, 업무는 마비됐다.
 
미국 누리꾼들 사이에서는 “지메일 뿐 아니라 온라인 엑셀, 워드 등도 이제 믿을 수 없게 됐다”는 반응들이 나오고 있다.

검색과 사용자 기반 기술의 차이
우리는 구글의 대용량 검색 처리 기술력을 높히 산다. 실제로 구글러들은 수십만대가 넘는 서버 클러스터에 밥숫가락 하나 얹어 놓듯이 서비스를 개발하고 있다.

구글의 대용량 분산 처리 시스템은 장애 처리에 사람이 관여하지 않을 만큼 잘 구성되어 있다. 누구나 인정하는 세계 최고 플랫폼에서 왜 이런 장애가 발생하는 걸까?

예전에 N모사에 재직하고 계신 한 지인과 이야기를 나누던 중 이런 이야기를 듣게 되었다.

“검색 서비스와 사용자 기반 서비스는 많이 다른것 같다. 검색에서 장애란 대개 인덱스(검색 목록)가 깨지거나 하는 것인데, 새로 생성하는 동안 누락된 웹 페이지들이 있게 된다. 하지만, 검색 목록에 뭐가 좀 빠졌다고 해서 사용자들은 알수도 없고 뭐라 하는 사람이 없다. 그런데 카페나 블로그 같은 경우, 그런 상황이 생기면 서버를 내려 놓고 장애 처리를 해야 하니 힘들것 같다. 데이터 누락 상태에서 서비스를 할 수는 없으니까…”

한마디로 말해 읽기(Read) 위주 서비스를 하는 검색의 경우와는 달리 읽기와 쓰기(Read/Write) 그리고 사용자별(User-based) 데이터를 저장하는 소통형 서비스는 전혀 다른 기술적 구조와 도전을 가진다는 이야기이다.

좁게 국내의 경우도 Daum은 한메일, 카페 위주로 성장해왔고 네이버는 검색을 위주로 성장을 해왔기 때문에 대용량 처리를 바라보는 기술 기반이 크게 다르다. 따라서, 네이버가 아고라와 같은 서비스를 할 수 있을까 하는 질문에 대해 회사 정책과 별개로 ‘기술적 함정’도 분명히 존재할 것이다. (아고라의 기술적 도전 참고.)

5년전 처음 입사했을 때, 사내에서 뭔가 시도를 하면 “당신 대용량 처리를 해보셨나요?”라는 핀잔을 가장 많이 들었다. 이전 회사에서 나름 50만명 가까운 음악 사이트 개발을 해왔던 나에게 조차 천 만명이 쓰는 서비스에 숟가락 하나 올리는데 얼마나 많은 기술적 고려가 필요한지 알게 해주는 충고였다.

내게 그런 말을 했던 개발자들 대부분은 이전에 실수로 장애를 만나서 수 백만의 사용자에게 고충을 안겨줬던 끔찍한 경험을 해 봤던 사람들이었다.

비슷한 길을 걷는 구글과 트위터
하물며 전 세계 사용자를 대상으로 그것도 수동적 정보 소비만 하는게 아니라 적극적 소통을 하는 현 시대의 구글의 읽기형 대용량 시스템은 오히려 낡은게 아닌가 싶다. 규모가 조금 다르지만 비슷한 경험을 하고 있는 곳이 있는데 바로 트위터(Twitter)이다.

트위터는 전 세계인들의 대화 내용을 실시간으로 전달하고 녹취해서 저장해 놓는 기술적 도전을 감당하느라 수 많은 장애를 만났다. 장애시 표시되는 고래 표시는 아주 일상적인게 될 정도였다.

사용자 삽입 이미지
다행히 최근 일년 동안 장비 투자와 기술적 개선에 의해 많이 좋아지긴 했어도 사용자에 따라 여전히 장애 표시가 빈번하게 나타나고 있는 중이다. 물론 트위터는 계속 노력하고 있고 소통을 통해 사람들은 공감하고 있다.
 
구글이 트위터와 유사한 규모의 서비스를 감당할 수 있을까? 혹은 페이스북과 같은 서비스를 제대로 운영할 수 있을까? 하는 질문은 답하기 쉽지 않다. 구글이 말아먹은 서비스들이 모두 이런 종류이기 때문에 아예 관심이 없거나 있더라도 성의 없게 운영되고 있는지 모르겠다.

블로거닷컴의 기능은 여전히 그대로이고 피드버너가 잦은 장애맘대로 피드주소를 바꿔도 사용자들은 그냥 주던 떡을 받아 먹어야 한다. 사용자들이 구글의 사용자 기반 서비스가 좋긴 하지만 불친절하다고 느끼는 것도 바로 그런 이유이다.

아마도 구글은 이런 기술적 혹은 감성적 난제를 극복해야만 자신들이 꿈꾸는 구름(Cloud)위에 앱스(Apps)를 실현할 수 있을 것이다. 이미 많은 사람들이 이번 지메일 장애로 ‘클라우드 컴퓨팅’에 문제가 있는것 아니냐고 의문을 제기할 정도니까.

실시간 웹에 맞는 기술적 도전
Docs, SpreadSheet, Calendar 등 구글 앱스는 아직도 구글 도메인 전체 트래픽에서 모두 1%이하이다. 그들이 구글 앱스를 통해 얻으려는 것이 검색과 광고 고도화에 사용하기 위한 사용자 기반 데이터이든 아니든 상관은 없다.

하지만, 이미 지메일 처림 어느 정도 크리티컬 매스에 올라갔을 경우 서비스 장애로 인한 파급 효과는 치명적이다.

구글이 이번 사태로 깨달을 점도 그것이고 준비해야 할 것도 그것이다. 지난 Lift09에서 빈트 서프가 구글이 좋은 점을 “그들은 젊어서 불가능이란걸 모른다. 일단 못먹어도 고(Go)를 외친다!”라고 이야기했다.

지금은 과거의 링크와 정적 웹이 차지하던 수동형 웹을 이미 벗어나서 쓰기와 커뮤니케이션이 창궐하는 실시간 웹(Real-time Web)으로 옮겨가고 있다. 과거에는 수 천자의 문서가 한번의 쓰기 비용만 들면 됐지만, 지금은 140자의 트위팅이 쓰고 또 수백 수천명에게도 전달해야 하는 비용을 들여야 한다.

구글의 진취성이 이를 극복하고 안정적인 웹 애플리케이션 서비스를 제공하는 기술 기반을 가지게 되던지 검색과 광고에 도움이 되지 않는 것은 손대지 말자고 스스로 역할을 한정하던지는 구글의 선택이 될것이다.

p.s. 아니나 다를까 구글도 트위터를 시작했다!
사용자 삽입 이미지

여러분의 생각

  1. 구글뿐만아니라 대부분의 클라우드컴퓨팅을 표방하는 기업들은 ‘준비중’인 것 같습니다…블루오션을 만들어가기 위한 웹2.0보다 더욱 강력한 마케팅쇼가 아닐까요…

  2. 몇 시간 전에도 장애가 있어서 릴리즈 어나운스가 늦어졌었어요. 재미있는 것은 GMail 은 잘되는데 Google Apps Mail Premiere Edition 이 장애였다는 것.. 돈 내고 쓰고 있는데 말이죠 ㅡㅡ;

  3. 개인적으로 최소한 웹2.0 보다는 구체적인 시장으로 보입니다. 확실한건 모든 기술이 만능이 아니고 최종 형태가 아니라는거죠.

  4. Channy님 덕분에 트위터와 고래의 관계(?)를 알았습니다. ^^
    좋은 정보 감사합니다~ (관련 글 트랙백 남겼습니다…)

  5. 아, 고래는 버블버블 오락에 나오는 것을 패러디한 줄 알았어요 !

의견 쓰기

이름* 이메일* 홈페이지(선택)