ICT트랜드

ICT트랜드

국가정보자원관리원 전문가에게 듣는 최신 ICT트렌드 / 클라우드 플랫폼 운영 관리의 진화 / 아키텍트팀 한인종 전문관

[ 클라우드 플랫폼 운영 관리의 진화 ]

- 아키텍트팀(정보시스템1과) 한인종 전문관 -

클라우드 컴퓨팅 서비스, 특히 인프라서비스(IaaS)는 가상화와 공유를 바탕으로 신속한 자원 할당 및 확장을 가능케 하고, 자원 사용률과 운영 효율을 높였다. 데이터 센터를 운영하는 서비스 공급자 시각에서 볼 때 클라우드 플랫폼은 IT인프라 운영 관리의 분명하고 뚜렷한 진화라고 볼 수 있다.

현재 G-클라우드는 자원 프로비저닝1)은 자동화되었지만, 가상자원 운영 중 필요한 작업 즉, 가상서버(VM) 마이그레이션, 자원 확장과 축소(scaling) 그리고 자원 반환 등은 여전히 운영자가 수행하고 있다. 클라우드 플랫폼 운영 관리사람이 툴을 사용하여 처리하는 작업으로 이루어지고 있는 것이다. 인프라 서비스 운영에 운영자의 지식과 경험이 필요하고, 향후 자원 풀 규모가 커지면 이에 비례해서 운영자 수도 늘려야 한다.

아마존, 마이크로소프트, 그리고 구글처럼 전 세계에서 수십 개의 데이터 센터를 운영하고, 한 센터에서 수만에서 수십만 개의 컨테이너와 가상 서버를 운영하는 클라우드 서비스 기업들은 어떻게 하고 있을까. 구글이 수년 전 쿠버네티스(Kubernetes)2)를 공개한데서 짐작할 수 있다. 쿠버네티스 같은 관리자SW가 규칙 기반(rule-based)으로 자원을 스케줄링하고, 자동 확장(auto-scaling) 등을 수행한다. 예를 들어, 5분 간격으로 연속해서 3번 CPU 사용률이 임계치의 60%를 넘으면 컨테이너를 하나 더 늘린다. 이 방법으로 사람이 직접 처리하는 것보다 훨씬 더 많은 컨테이너를 운영할 수 있고, 24시간 365일 쉬지 않고 처리하며, 적은 수의 인력으로 운영할 수 있다. 그러나 약점도 있다. 규칙(또는 정책) 기반 시스템은 정해진 규칙에 따라 동작하기 때문에 최적화 수준이 미흡할 수 있고, 서비스 사용자 수가 빠르게 변하는 예측할 수 없는 상황에는 효과적이지 않다. 사람이 규칙을 업데이트해주어야 하기 때문이다.

사람이 판단하고 조치하는 것을 1세대(L1)라고 한다면, 쿠버네티스 등의 관리자SW가 규칙(또는 정책)기반으로 처리하는 것을 2세대(L2)로 볼 수 있다. 그렇다면 그 다음 단계는 무엇일까.
클라우드 플랫폼 운영 관리의 진화 - 1.운영자가 직접 관리(L1) 2.정책·규칙기반 관리(L2) 3.머신러닝 중심의 관리((L3) 최근 10여 년간 빠르게 발전하고 있는 머신러닝/인공지능 기술을 활용하는 것이다. 인프라 구성요소와 이들의 동작(behavior) 관련 데이터로 학습한 AI모델은 스케줄링, 자원 확장, 마이그레이션 등을 예측(prediction)하여 기존의 규칙·정책기반 방식보다 더 스마트하게 최적화 할 수 있다. 그리고 야간이나 주말에 자원 사용량이 적을 것으로 예측되는 컨테이너들을 몇몇 소수의 서버에 모아 전력 사용량도 효과적으로 줄일 수 있다.

실제로 마이크로소프트사클라우드 플랫폼 관리에 머신러닝(Machine Learning)을 응용한 사례를 발표했다3). 머신러닝 기술을 사용하여 애저 컴퓨트패브릭4)의 여러 리소스 관리자SW에 인프라와 워크로드에 대한 인사이트를 제공하는 범용의 예측 서비스 시스템인 리소스 센트럴(Resource Central)을 구현했다. 그리고 이를 활용하여 컨테이너 스케줄링, 서버 조각 모음/마이그레이션 관리, 전력 사용량 관리 및 서버 상태 관리에 사용하여 자원 사용률 증대, 전력 사용량 절감, 서비스 안정성 강화 등의 효과를 확인했다.

클라우드 서비스는 다양성이 풍부해지며 발전하고, 클라우드 플랫폼을 운영하는 관리 기술도 진화하고 있다. 클라우드 플랫폼은 정보 서비스 플랫폼의 현재이고 미래다.
1) 실제 자원을 할당하고 구성작업을 하여 사용 가능한 상태로 만드는 것
2) 구글이 공개한 도커 컨테이너 배포 및 관리 소프트웨어
3) "Toward ML-Centric Cloud Platforms" 라는 제목으로 발표됐고, "머신러닝 중심의 클라우드 플랫폼을 향하여"로 번역한 자료가 있다.
4) 마이크로소프트(Microsoft)사의 클라우드 플랫폼에서 제공하는 서버 인프라서비스(IaaS) 이름