• 페이스북
  • 네이버포스트
  • 유튜브
인간과 공간을 위한 빛의 가장 아름다운 진화 옳은미래 lg의 옳은 미래가 더 궁금하다면 lgfyture.com

KT 장애 원인 살펴보니, 상식 깬 관리 소홀···정부 “당황스럽다”

  • font-plus
  • font-minus
  • print
  • 카카오 공유하기
  • twitter
  • facebook

밤에 해야 할 작업 주간에 진행, 관리자도 자리 비워
검증 시스템 없어, “기본 상식 어겨 사고, 당황스럽다”

이미지 확대thumbanil

사진=과학기술정보통신부.

지난 25일 발생한 KT 유무선 인터넷 장애가 KT 측의 관리소홀로 인한 명백한 인재였다는 사실이 드러났다. 야간작업을 꺼려 한다는 이유로 장비교체 작업을 낮에 진행했으며 KT 관리자는 하청 직원 작업 시 다른 업무가 있다며 자리를 이탈했다.

관리 소홀 속 하청 관리자는 인터넷망과 연결된 상태에서 작업을 진행했으며 중요 명령어 누락 사실을 모른 채 장비 설정을 진행, 전국망이 마비됐다. 조사를 진행한 과학기술정보통신부에서 기본 상식에 맞지 않는다며 당황스럽다고 설명할 정도다.

과기정통부는 지난 25일 발생한 KT 네트워크 장애 사고와 관련해 정보보호, 네트워크 전문가들로 구성된 사고조사반과 함께 원인을 조사, 분석한 결과를 29일 발표했다.

이번 KT 네트워크 장애 사고는 25일 11시16분경부터 시작돼 12시 45분경 KT의 복구조치가 완료, 약 89분의 서비스 장애가 발생했다.

조사반의 조사 결과를 토대로 사고의 타임라인을 열거하면 25일 11시16분 KT에 트래픽이 급증하기 시작, 4분만에 KT에서 인터넷 장애를 인지했다. 트래픽 증가로 인해 KT 측에서는 먼저 디도스 공격 가능성을 의심했고 11시40분 과기정통부에 신고했다.

하지만 신고 4분만인 11시44분 KT 측에서 디도스가 아닌 네트워크 경로 설정(라우팅) 오류로 판단했다고 다시 과기정통부 측에 알려왔다. 신고를 접한 과기정통부는 11시56분에 정보통신사고 ‘주의’ 단계를 발령했다. 11시57분경부터 인터넷망의 복구가 진행되기 시작했고 12시45분 KT 측에서 복구 조치가 완료됐다고 과기정통부에 보고했다.

이번 KT 유무선 네트워크 장애는 명명백백한 인재다. 조사반에 따르면 이번 사고의 원인은 라우터 설정 오류다. 부산 지역 국사의 라우터 장비의 교체 작업 과정 중에서 설정 값을 잘못 입력했다.

라우터는 인터넷 이용자 단말과 접속 대상 인터넷 주소 사이에 위치하는 네트워크 장비들이다. 라우터는 네트워크의 최신 경로정보를 기기끼리 교환하는 프로토콜을 사용한다. 내부 라우터들의 경우 내부 라우터끼리, 외부는 외부 장비끼리 서로 교환하며 최적의 경로를 제공한다.

이번 장애의 단초가 된 것은 명령어 누락이다. 라우팅 설정을 하는 명령어 스크립트 상에서 내부 라우터에 더 이상 입력하지 않는 ‘exit’ 명령어가 누락됐다. 외부 라우터 설정들이 내부 장비에 설정되면서 오류가 발생했다. 해당 장비의 설정은 각 지역국의 라우터로 자동 공유, 전파됐고 전국망이 마비되는 사태까지 이르렀다.

해당 사고를 사전에 검증할 수 있는 테스트베드 역시 없었으며 명령어 스크립트 작성 과정 및 사전검증 과정에서 명령어 누락을 발견하지 못했다.

특히 KT 측의 상식을 벗어난 관리 소홀 문제가 드러났다. 네트워크 장비들의 변경 등의 작업 시 야간 작업은 기본이지만 낮에 작업을 진행했다. 미리 테스트를 해야하지만 테스트 역시 하지 않았다.

홍진배 과기정통부 정보보호네트워크정책관은 “상식적으로 낮에 작업하는 것은 KT 작업원칙에도 사실 맞지 않는다. 작업계획서 상에서도 새벽에 하도록 돼 있었다”면서 “작업자들과 관리자들이 그 원칙을 어기고 작업했다”고 밝혔다.

홍 정책관은 “야간작업을 사실 좋아하는 사람은 없기 때문에 주간작업을 선호했던 것으로 파악했다”면서 “KT 관리자와 협력사 직원 양쪽 합의하에 이뤄졌다는 것을 확인했다”고 설명했다.

더군다나 낮 시간 하청업체 직원들이 작업을 진행하는 상황에서 KT 관리자는 자리를 비웠던 것으로 드러났다. 최성준 과기정통부 네트워크정책과장은 “관리자에 확인한 결과 다른 업무가 있어서 자리를 비웠다고 들었다”고 말했다.

조사를 진행한 과기정통부 측은 이번 사고가 기본 상식을 벗어났다고 지적했다.

허성욱 네트워크정책실장은 “네트워크 작업을 하게 되면 분명히 한두시간 테스트를 한 이후 오픈하는 것은 기본상식에 속한다. 파란불에 신호등 건너라는 것과 똑 같은 것”이라며 “저희들(과기정통부)도 당황스러운 것은 사실”이라고 말했다.

허 실장은 “관리자 없이 용역업체가 그것도 주간에 파란불에 신호등을 건너야하는 것을 어겨서 큰 교통사고를 냈다”고 비유했다.

이어진 기자 lej@

관련태그

#KT

#장애

#관리 소홀

<저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지>

위로 가기