“야간작업 안좋아해 낮에”… KT 망 먹통, 황당한 人災

김도형 기자

입력 2021-10-30 03:00 수정 2021-10-30 04:05

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
과기부, KT 사고 조사 결과 발표… KT-협력업체 직원 시간 변경
KT측 관리자는 자리도 비워… 과기부 “파란불 보행 상식 어긴셈”


25일 오후 서울 종로구 KT 광화문지사. 2021.10.25/뉴스1 (서울=뉴스1)

“야간작업을 선호하는 사람은 없어서 (작업계획서를 무시하고) 주간에 작업을 했다.”

이달 25일 전국에서 벌어진 KT의 전국 유·무선 인터넷 통신망 장애 사고 원인을 닷새 동안 조사한 과학기술정보통신부가 밝힌 사고 원인이다. 트래픽이 몰리는 월요일 점심시간에 89분 동안 전국 인터넷이 마비된 이번 사고가 ‘밤에 일하는 걸 좋아하는 사람이 없어서’라는 어이없는 이유 때문에 빚어진 것이다.

조경식 과기부 2차관은 “KT는 작업계획서상 야간에 해야 할 작업을 주간에 진행했고 작업 관리자 없이 협력업체 직원들끼리 작업을 수행했다. 네트워크가 연결된 채로 라우팅(네트워크 경로 설정) 작업을 진행하는 등 관리적 측면에 문제점이 있었다”고 원인 분석 결과를 밝혔다.

29일 과기부가 발표한 KT 네트워크 장애 원인 분석 보고에 따르면 KT 네트워크관제센터는 당초 협력업체가 26일 오전 1∼6시 교체 작업을 진행하도록 승인했지만 실제로는 25일 오전에 교체가 진행됐다. 야간이 아닌 주간에 작업하는 게 더 좋다는 이유로 KT와 협력업체 직원의 합의하에 작업 시간을 변경했다는 것이다.

과기부 관계자는 “네트워크 작업은 야간에 해야 한다는 것과 작업 전 한두 시간가량 테스트를 해야 한다는 것은 ‘파란불 신호에 길을 건너야 한다’는 것과 같은 기본 상식이다. 이를 어기면서 사고가 발생해 정부도 당황스럽다”고 말했다.

장비 교체 작업은 KT 측 작업 관리자 없이 협력업체 직원들끼리만 한 것으로 확인됐다. 과기부 관계자는 “KT 관리자에게 알아본 결과 다른 업무가 있어서 자리를 비웠다고 했다”고 전했다. 감독 책임이 있는 KT의 관리를 벗어난 상태에서 전국 네트워크가 위험에 노출된 채로 작업이 이뤄졌고 결국 큰 사고로 이어졌다.

사고의 직접적인 원인도 사람의 실수였다. 협력업체 직원이 교체 장비의 라우팅을 하다가 정보를 입력하는 과정에서 들어가야 할 명령어 중 ‘엑시트(exit)’라는 한 단어를 빠뜨렸다는 것이다. 이 때문에 KT 내부용 프로토콜로 경로 정보가 한 번에 몰리면서 오류가 발생했고 잘못된 라우팅 경로 설정이 다른 지역 라우터에까지 전달되면서 오류가 전국으로 확산했다는 것이 과기부의 설명이다.

과기부는 “명령어 스크립트 작성은 KT와 협력업체가 같이 한 것으로 이해하고 있다”며 “1, 2차에 걸친 사전검증 단계가 존재하지만 사람이 직접 검토하는 체계이기 때문에 오류를 발견하지 못했다”고 밝혔다. 과기부는 부산 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 없었다고 지적했다. 전체 라우터에 오류가 전파되기까지 걸린 시간은 30초 이내였다.

이 같은 조사 결과에 대해 KT는 “야간작업으로 승인을 받았지만 이를 위반해 주간에 작업이 이뤄졌으며 KT 직원도 이를 양해하고 관리 감독을 소홀히 했다”면서 “예외적인 일탈 사례이고 앞으로 이런 사례가 재발되지 않도록 절차를 강화하겠다”고 밝혔다.




김도형 기자 dodo@donga.com


라이프



모바일 버전 보기