한국 빅데이터 기술 세계적 주목

`대용량 인터넷 트래픽 고속 분석` SW 개발
충남대 이영석 교수 논문 글로벌 저널 게재

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


한국 빅데이터 기술 세계적 주목
국내 연구진의 빅데이터 연구결과가 글로벌 저널에 논문으로 게재되는 등 세계의 이목을 끌고 있다. 대용량 인터넷 트래픽을 빨리 분석할 수 있어 통신, 인터넷 업계에 주요 기술로 주목받을 전망이다.

15일 충남대 컴퓨터공학과 이영석 교수 연구실은 IP 패킷(데이터 전송 단위)과 넷플로우(네트워크 발생 트래픽)를 빅데이터 분석 기술인 하둡을 활용해 처리할 수 있는 소프트웨어 개발 논문을 컴퓨터네트워크 분야 세계 저널인 `ACM(미국컴퓨터협회) SIGCOMM(데이터통신분과) CCR(Computer Communication Review)' 2013년 1월호에 게재했다고 밝혔다.

이 소프트웨어는 대용량 인터넷 트래픽을 빠른 시간에 분석할 수 있도록 도와주는 것이 특징이다. 기존에 인터넷 트래픽을 분석하기 위해서는 티씨피덤프(tcpdump)나 와이어샤크(wireshark)와 같은 오픈소스 도구 또는 상용 소프트웨어를 이용했지만 이들 도구는 대용량 데이터를 처리하는데 한계가 있었다.

연구실은 이들 인터넷 트래픽 분석 모듈을 맵리듀스(병렬형 처리방식)로 구현해 하둡(대용량 데이터 처리 기술) 기반 클러스터에서 분석이 가능하도록 처리했다. 이 시스템을 도입한 결과, 기존 1테라바이트의 IP 패킷 통계를 계산하는데 217분이 걸렸던 것이 11분으로 단축됐다.

이 과정에서 연구실은 `하둡 맵리듀스에서 바이너리 형태의 데이터 분석을 위한 입력포맷 추출방법 및 이를 이용한 바이너리 데이터의 분석방법(2012.12)'과`하둡 맵리듀스에서 네트워크 패킷 분석을 위한 입력포맷 추출방법(2012.10)'이라는 국내 특허 두건을 등록했다.

이 기술은 국내외 다양한 통신, 인터넷 업계로부터 러브콜을 받을 수 있을 것으로 보인다.

이 교수 연구실은 지난해 기술 개발 과정에서 KT, LG유플러스, NHN 등 국내 다양한 기업으로부터 문의를 받거나 연구과제를 함께 수행했다. 이들 기업의 고민은 국내외 네트워크 망을 타고 급증하는 데이터의 양을 어떻게 처리할 수 있는지 였다. 한 기업은 한 시간에 4.6테라바이트까지 패킷량이 치솟았으며, 일주일에 몇백테라바이트의 패킷이 쌓이는 곳도 있었다. 이들 업체는 빅데이터 기술이 도입될 경우 이들 데이터를 빠른 시간에 분석해 네트워크 이상 징후, 보안 문제 등을 사전 예측할 수 있을 것으로 기대했다.

연구실은 올해 이 기술을 기반으로 상용SW 제품을 개발할 계획이다.

이 교수는 "아직 국내뿐 아니라 해외에서도 인터넷 패킷 대용량 분석에 대한 관심은 많지만 이를 쉽게 처리할 수 있는 빅데이터 기술 도입은 드물다"며 "웹 시각화, 데이터마이닝 등 추가 기능을 덧붙여 상용제품으로 발표하겠다"고 말했다.

현재 이 소프트웨어는 웹사이트(https://github.com/ssallys/pcap-on-Hadoop)에 오픈소스 형태로 공개돼있으며 누구나 다운받아 활용 가능하다.

김지선기자 dubs45@
▶김지선기자의 블로그 바로가기




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사