배치작업시간 줄이려다 DB속도저하 '화' 자초


지난 15일 발생했던 국민은행 전산시스템 장애는 `배치(Batch)' 작업시 발생한 데이터베이스(DB)처리 속도의 급격한 저하가 직접적인 원인이었던 것으로 파악됐다.

배치 작업이란 은행 업무중 실시간 데이터 처리가 되지 않은 특정 업무 데이터를 주기적으로 갱신시켜주는 것이다. 통상 은행들은 고객의 불편을 덜기 위해 휴일 또는 평일 새벽시간을 이용해 전산시스템을 30분 내지 1시간 동안 일부러 다운시켜 배치작업을 실행하고 있다.

국민은행은 그동안 일주일에 한번 꼴로 해오던 배치 작업을 이달부터 한달에 한 번 꼴로 횟수를 줄이기로 결정한 이후 첫 작업에서 사고가 난 것으로 밝혀졌다.

이번 사고를 계기로 온라인 서비스의 중단을 최소화하기 위해 배치 작업 시간을 경쟁적으로 단축하고 있는 시중 은행에도 파문이 예상된다.

국민은행 곽광수 IT팀장은 "이번 사고는 데이터 구조의 문제점으로 인해 `배치 타이밍'이 비정상적으로 길어진 것이 원인"이라며 "앞으로 이같은 사고가 발생하지 않도록 `데이터 셋(Data Set)'의 관리능력을 높이겠다"고 밝혔다. 곽팀장은 이어 "이번 사고는 DB 외의 하드웨어나 소프트웨어 측면의 문제점은 전혀 없다"며 "은행의 데이터 구조를 재정비해 나가는 데 주력하겠다"고 덧붙였다.

◇사고 원인 = 국민은행은 지난 5월말까지 평일에는 약 3분간 금융서비스채널을 막아놓고 배치작업을 해왔으며, 또 일주일(휴일 이용)마다 약 30분간 전체 시스템을 중단시킨채 `사고신고'와 같은 업무 데이터들에 대한 배치작업을 처리했다.

국민은행은 이달부터 배치작업 주기를 한 달에 한 번으로 단축시키기로 하고, 배치작업을 시도했다. 하지만 당초 30분 정도로 예상했던 배치작업이 예상외로 길어지면서 문제가 발생했다. 데이터 입출력(I/O)시간이 길어지면서 결과적으로 15일 오전 8시부터 낮 12시까지 약 4시간 동안 계좌조회ㆍ입/출금ㆍ송금ㆍ이체ㆍ카드분실 신고 등 모든 은행업무가 마비되는 상황으로 발전했다.

국민은행측은 배치 처리시 데이터 입출력 속도가 현저히 떨어진 원인을 파악하는 데 전력한 결과 데이터 구조에서 일차적인 원인을 찾아냈다.

만약 배치작업이 완료되지 않은 상황에서 시스템을 재가동할 경우에는 데이터 정합성에 심각한 문제가 발생할 수 있어, 배치작업을 도중에 중단하고 시스템을 가동할 수는 없었다.

◇금융권 `24/365' 무리한 경쟁...후유증 우려 = 결과적으로 이번 국민은행 사고는 `배치'시간을 한달에 한 번으로 줄이려다가 발생한 것으로 볼 수 있다. 모 은행의 경우 배치작업을 위해 평일 새벽마다 4시간 동안 시스템 가동을 중단시킬 정도로 은행권의 배치작업 시간은 시스템 환경마다 약간씩 다르다.

`배치' 작업을 줄인다는 것은 그만큼 시스템 가동시간이 늘어나고, 대고객 온라인 금융서비스 시간이 확대됨을 의미한다. 특히 은행권이 차세대전산 프로젝트를 진행하면서 전산시스템의 `24/365(연중 무휴 및 무중단)'환경 구현을 중요한 목표로 설정하고 있는 것도 이 때문이다. 하지만 이번 사고에서보듯 "충분한 사전 검증없이 배치작업 주기를 단축할 경우 자칫 시스템 전체가 장시간 중단되는 대형 사고로 번질 수 있다"는 것이 전문가들의 경고다.

박기록기자

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0