[ZDNET 칼럼] 클라우드 서버의 혁신, 은밀하게 그리고 위대하게

한때 조립 PC가 유행인 적이 있었다. 내 맘대로 원하는 사양의 CPU와 메모리 그리고 그래픽 카드를 조합하여 원하는 PC를 만드는 것이다. 하지만, 정보기술(IT) 서비스를 위한 서버 역시 물리적으로 조립은 가능하지만, 부품이나 안정성을 위해 벤더들이 제공하는 제품을 써야 하는 경우가 많았다. 벤더 중심으로 돌아가던 서버 시장은 클라우드 시대로 접어들면서 완전히 패러다임이 바뀌고 있다.

클라우드를 사용하는 고객의 서비스 계획과 인프라를 확장하는 요구 사항이 서비스 업체에 지속해서 공유되고 있고, 이러한 점이 서비스에 적극적으로 반영되고 있기 때문이다. 부품과 생산 설비를 중심으로 주기적으로 서버 제품을 생산한다면 불가능했던 일이다.

클라우드 시장을 선도하고 있는 AWS의 경우, EC2 인스턴스의 역사를 보면 IT 변화에 민감하게 가상 서버 사양을 계속 추가해 왔음을 알 수 있다. CPU를 많이 쓰는 프로그램, 메모리를 많이 쓰는 프로그램 그리고 디스크 입출력(I/O)을 많이 쓰는 경우 등등 다양한 애플리케이션에 맞게 입맛에 맞는 인스턴스 타입을 선택할 수 있다.

따라서, 최근에 추가되는 Amazon EC2의 인스턴스 타입을 보면 IT 시장의 변화를 예측할 수 있는 실마리를 제공한다.

■ 512MB 메모리 최소형 T2.Nano 인스턴스
T2 인스턴스는 AWS에서 가장 낮은 사양의 인스턴스 타입으로 별도 프로세서 사용량 기준을 가지고, (예를 들어, CPU 20%만 사용 가능) 이를 넘어가는 경우 기존에 모아둔 CPU 크레딧을 사용하는 방식으로 효율적으로 자원을 활용할 수 있다. 가격도 저렴할 뿐만 아니라 필요할 때도 컴퓨팅 용량을 크레딧으로 사용할 수 있기 때문에 인기가 높다.

최근 서비스 아키텍처가 마이크로서비스로 변화하면서 예전에 한 덩어리로 매우 큰 애플리케이션을 잘게 서비스로 쪼개는 경향이 높아졌다. 그러다 보니 개별 서비스의 사이즈는 작고, 컴퓨팅 용량을 많이 사용하지 않는 경우가 많다.

aws-t2-instance

re:Invent 2015에서 T2.nano를 발표하는 버너 보겔스 아마존 CTO(출처: AWS)
소형 웹 사이트를 운영하거나, 테스팅 및 모니터링이나 마이크로서비스용 서비스를 위한 최소형 인스턴스 타입을 원하게 되었는데 이를 위해 만든것이 t2.nano 인스턴스다. 항시 CPU 사용량이 5% 미만인 일반적인 웹 서비스에 딱 맞고, 512MB 메모리의 초소형 서버라고 할 수 있다. (물론 트래픽이 넘치면, 모아둔 크레딧으로 72분가량 100% CPU를 사용 가능하며, 필요 시 오토스케일링으로 서버를 확장할 수 있다.)

■ 2TB급 메모리를 장착한 X1 인스턴스
클라우드 컴퓨팅의 주요 고객은 스타트업과 중소 규모 기업이라고 생각하기 쉽지만, 최근 몇 년 사이 기업 IT의 새로운 표준으로 자리 잡으면서 엔터프라이즈 기업의 수요가 많이 늘어났다. 많은 엔터프라이즈 고객은 많은 메모리 용량을 가진 고성능의 인스턴스를 요구하기도 한다. 예를 들어, 인메모리 기반의 애플리케이션 즉, SAP HANA나 Microsoft SQL Server, Apache Spark 및 Presto 같은 대용량 데이터를 다루는 비지니스 분석 프로그램이다.

이를 위해 만든 것이 바로 X1 인스턴스 타입으로 네 개의 Intel® Xeon® E7 프로세서를 기반으로 하고 각 프로세서는 L3 캐시의 메모리 대역폭을 가지며 고성능 대용량인 2TB를 지원하고, 100개가 넘는 vCPU를 통해 이들 인스턴스가 동시 작업을 수행할 수 있다. 네트워크나 디스크 대역폭도 10Gpbs를 지원하고, X1 인스턴스를 클러스터로 묶으면 메모리 용량을 16TB까지 확장할 수 있다.

aws-x1-instance

X1인스턴스를 위한 인텔 Xeon E7을 소개하는 다이앤 브라이언트 인텔 부사장(출처:AWS)
엔터프라이즈 기업이 원하는 고성능 컴퓨팅을 위해 굳이 비싼 장비를 갖춰 놓지 않아도, 테스트 업무, 주기적인 분석 및 고가용성 구성 등을 위해 클라우드를 활용할 수 있게 되었다. 이는 클라우드를 기업의 핵심 업무에도 사용하기 시작하고 있다는 청신호이다.

■ 16개 GPU를 장착한 P2 인스턴스
최근 IT 업계에 화두는 단연 인공 지능(AI)이다. 특히, 딥러닝에 대한 고성능 컴퓨팅 인프라가 요구됨에 따라 지난 9월 30일 최대 16개의 GPU를 통해 CPU 연산을 병렬 처리할 수 있는 P2 인스턴스가 출시 되었다.

P2 인스턴스는 192GB의 GPU 메모리, 4만 개의 병렬 처리 코어, 70테라플롭스의 단정밀도 부동 소수점 성능 및 23테라플롭스의 배정밀도 부동 소수점 성능을 갖춘 그야말로 공룡급 인스턴스 타입이다. 16개의 NVIDIA K80 GPU, 64개의 vCPU 및 732GiB의 호스트 메모리를 가진다. P2 인스턴스는 최대 16개의 GPU까지 GPUDirect™(피어 투 피어 GPU 통신) 기능을 제공하므로 여러 개의 GPU가 단일 호스트 내에서 함께 작동할 수 있다.

CUDA 및 OpenCL을 사용하는 범용 GPU 컴퓨팅 애플리케이션을 위해 설계된 P2 인스턴스는 기계 학습, 고성능 데이터베이스, 전산 유체 역학, 컴퓨팅 금융, 내진 해석, 분자 모델링, 유전체학, 렌더링, 그리고 대량의 병렬 부동 소수점 처리 능력이 필요한 서버 측 워크로드에 매우 적합하다.

또한, 이러한 가상 서버들이 클라우드 상에 보이지 않게 존재하고 있다고 생각하는 것이 일반적이다. 하지만 AWS의 전용 호스팅(Dedicated Hosts)를 이용하면, 우리 회사 가상 서버들만 지정된 AWS 데이터 센터 내부의 단일 물리 서버에 올릴 수 있다. 어떤 소프트웨어의 경우, CPU 코어당 특정 물리 서버에만 운용할 수 있도록 판매 라이선스를 제공하는 경우가 있다. 기업 데이터를 고유한 물리 서버에만 저장하도록 하는 법적 규정이나 규제 준수 사항이 있을 때도 있다. 전용 호스팅 서버는 이러한 기업의 요구 사항에도 충족할 수 있게 만들어졌다. 즉, 클라우드가 물리적인 서버도 빌려주는 시대이다.

정보 기술의 변화와 컴퓨팅 활용에 대한 고객의 요구 사항이 계속 변화하고 있다. 그러한 변화의 조짐을 알고 싶다면 ‘은밀하고도 위대하게’ 바뀌고 있는 클라우드 서비스 기술으 트렌드를 눈 여겨 볼 필요가 있다. 오는 11월 말이면 AWS가 주최하는 re:Invent 행사가 라스베가스에서 열린다. 매년 20여가지 신규 서비스와 신 기능을 출시해왔기 때문에 많은 이목이 집중되고 있는 클라우드 업계의 대표 행사이다. 내년 클라우드 기술에 어떤 변화가 오는 서비스가 출시 될지 기대해 봐도 좋을 듯 하다.

여러분의 생각