특별부록

특별부록

국가정보자원관리원 광주센터 정보시스템2과 소통포스트 Vol 03

국가정보자원관리원 광주센터 정보시스템2과 소통포스트 Vol 03

관리원 이야기

국가정보자원관리원 장애대응 실황 LIVE!

신속한 장애복구를 위해 밤낮없이 고군분투하는 시스템 운영 담당자들의 생생한 현장을 소개합니다.

2021년 0월 0일 오전 03:55 광주센터 종합상황실

  • [ 장애 발생 ]

    종합상황실 근무자가 ○○부 3등급 업무의 장애 이벤트를 관제하였습니다.
    종합상황실은 광주센터에서 운영하고 있는 10,000여대의 정보시스템의 운영 상황을 24시간 연중무휴 모니터링합니다.
    국가정보자원관리원의 기술과 노하우로 구축한 통합 이벤트관리시스템(nTEMS)과 빅데이터로그분석시스템(nSIMS) 등의 모니터링 체계를 통해 시스템 장애와 사이버 침해 상황을 빈틈없이 관제합니다.
  • 종합상황실 근무자가 장애 이벤트를 관제하였습니다.

2021년 0월 0일 오전 03:58

  • [ 장애 접수, 예비 전파 ]

    종합상황실은 장애 이벤트 발생 7분 이내에 서비스데스크에 장애 접수를 합니다.
    서비스데스크는 장애접수 즉시 대상 장비의 기관 및 업무를 확인하여 관리원과 입주기관의 업무등급별 전파 체계에 따른 예비전파(SMS)를 실시합니다.
  • 서비스데스크에 장애를 접수하고 서비스데스크는 관리원과 입주기관에 예비전파를 하고 있습니다.

2021년 0월 0일 오전 04:00

  • [ 장애대응반 소집 ]

    서비스데스크는 상황반장이 파악한 업무등급을 기준으로 장애 접수로부터 10분 이내에 장애 담당자와 장애조치자에게 유선으로 장애를 전파 및 장애대응반 소집에 대해 통보합니다.
  • 장애대응반 구성

2021년 0월 0일 오전 04:03 ○○○ 주무관 자택

  • 장애대응반 주문관이 서비스데스크의 전화를 받고 관리원으로 출발합니다.
  • 집에서 깊은 잠에 빠져 장애대응반 소집 SMS를 확인 못한 ○○○주무관의 휴대전화가 울리기 시작합니다. 장애대응반의 신속한 응소를 요청하는 서비스데스크의 전화입니다.
    비몽사몽 전화를 받은 ○○○주무관을 비롯하여 장애대응반 구성체계에 따른 장애대응반은 장애인지 즉시 장애응소를 위해 관리원으로 출발합니다.

2021년 0월 0일 오전 04:03 전산동

  • 야간 당직자들이 장애대응반 도착 전까지 할 수 있는 조치를 실시합니다.
  • 댜간 당직자가 조치를 실시합니다.

2021년 0월 0일 오전 04:13

  • [ 장애대응반 응소 ]

    담당주무관과 장애대응반이 응소하고 있습니다.
    광주센터 로비에 설치된 장애응소시스템에 공무원증, 출입증 등을 태그함으로써 응소 기록을 남깁니다.
  • 담당주무관과 장애대응반이 장애응소시스템에 공무원증, 출입증을 태그합니다.
  • [ 장애 조치 ]

  • 장애대응반이 장애원인 파악 및 시스템 복구를 시도합니다
  • 광주센터에 도착한 장애대응반은 신속히 장애원인 파악 및 시스템 복구를 시도합니다.
    국가정보자원관리원의 장애등급별 장애조치 최대 허용시간은 아래와 같습니다.
  • 국가정보자원관리원의 장애등급별 장애조치 최대 허용시간
  • 위의 장애조치 최대 허용시간과는 별도로 2021년 평균장애복구시간 목표는 31.19분이며 업무등급에 따라 가중치를 달리하여 적용합니다.
    '21.10월 말 기준, 광주센터 정보시스템2과의 평균 장애복구시간은 입주기관소관 장애를 포함하여 27.69분 입니다.
  • [ 장애상황 전파 및 보고 ]

    서비스데스크는 장애진행 상황을 수시 또는 주기적(30분 간격)으로 전파합니다. 이와 별도로 장애대응반장은 장애 보고 체계에 따라 진행상황을 보고합니다.

2021년 0월 0일 오전 04:23

  • [ 서비스 복구 확인 및 장애종료 ]

    장애대응반은 장애 해결책을 마련하는 즉시 적용하고 서비스데스크에 서비스 정상 확인을 요청합니다.
    서비스데스크는 서비스 복구 유무를 확인 후 nTOPS를 통한 장애 종료 처리와 함께 서비스 복구 완료 및 장애 종료 상황을 전파합니다.
    장애종료와 함께 장애대응반은 소집 해제 됩니다.
  • 장애대응반이 서비스데스크에 서비스 정상확인을 요청합니다.

  • [ 사후관리 ]

    장애대응반 조치자는 장애 종료 후 장애처리내역을 상세히 기록하여 nTOPS에 등록합니다. (48시간 이내)
    이밖에광주센터에서는매주장애절차실무회의를 개최하여 발생장애에 대한 처리 과정 및 결과에 대한 적정성 및 시사점을 검토하고 있습니다.
    앞으로도 국가정보자원관리원은 고품질 공공 IDC 서비스 제공을 위해 최선을 다할 것을 약속드립니다.
    감사합니다.
  • 장애처리 결과 보고서