[알아봅시다] 데이터시장 판도 바꾸는 빅데이터 시각화

방대한 데이터, 이미지화… 한눈에 의미 완벽 전달
흥미 유발·정보 습득시간 단축 '장점'
시간·분포·관계 등 시각화 방법 다양
"향후 의사결정 지대한 영향 미칠 것"

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


[알아봅시다] 데이터시장 판도 바꾸는 빅데이터 시각화


데이터의 시대. SW업계에 따르면 2020년에는 전 세계 40억명이 인터넷을 사용하게 되고, 이들은 44제타바이트(10의 21승 바이트)의 데이터를 생산할 것이라고 합니다. 그야말로 데이터 홍수의 시대가 도래하는 것이지요. 때문에 수 많은 정보를 시각적으로 묘사하고, 필요한 정보를 효율적으로 제공하는 빅데이터 시각화(Big Data Visualization)의 필요성이 증가하고 있습니다. ◇'빅데이터시각화=일상에서 벌어지는 모든 것의 시각화'

최근 빅데이터 기술시장의 성장과 함께 시각화 기술도 중요한 기술요소로 자리 잡고 있습니다. 전통적인 시각화 기술은 주로 시스템 로그나 실험 분석 결과 등에 대한 통계정보를 그래프로 보여주는 것을 의미했습니다. 그러나 방대한 데이터를 분석하는 빅데이터 기술은 모든 데이터를 살펴보는 것에 제약이 따르기 때문에, 데이터를 요약하고 한 눈에 살펴볼 수 있도록 돕는 시각화가 중요해지고 있습니다.

빅데이터 시각화는 데이터 분석 결과 즉, 정보를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 것을 말합니다. 다양한 시각화 방법을 통해 보는 사람의 흥미를 유발하고, 정보를 습득하는 시간을 단축시켜 빠른 상황 판단을 도울 수 있습니다. 또 정보를 빠르게 확산시킬 수 있고, 한 번 보고도 자료를 오래 기억할 수 있으며, 무엇보다도 정보에 대해 효과적으로 커뮤니케이션 할 수 있습니다. 따라서 이를 이해하기 위해서는 정보 시각화(Information Visualization)를 먼저 이해해야 하고, 정보의 시각화 방법으로는 시간 시각화, 분포 시각화, 관계 시각화, 비교 시각화, 그리고 공간 시각화가 있습니다.

시간시각화는 시계열 데이터(Time series data)라고도 합니다. 이것은 시간에 따른 경향분석이 가능하기 때문에 시간에 따른 트렌드(Trend)를 도출하는 것에 적합합니다. 시간이 흐름에 따라 사람들의 생각이 바뀌고, 인구분포도 변하며, 사업은 확장됩니다. 이러한 변화가 얼마나 있었는지 측정해서 기록하면 시계열 데이터가 되는데요. 변화의 패턴을 찾으려면 개별적인 데이터보다 전체 그림을 볼 수 있어야 합니다. 한 가지 구간의 값에 대해서만 의미를 말하기보다 전후 관계를 감안하면 더 의미 있는 이야기를 전달할 수 있습니다. 분포 시각화도 시계열 데이터와 비슷합니다. 다만 분포 데이터의 구분 단위는 시간이 아니라 분류, 세부 분류, 가짓수입니다. 분포 데이터에서 말하는 가짓수는 가능한 선택이나 결과들을 의미합니다. 분포 데이터의 일반적인 특성은 최대(Maximum), 최소(Minimum), 전체 분포(Overall distribution)입니다. 관계시각화는 데이터 간의 관계를 찾는 것으로 '집단 간의 어떤 유사점이 있는가' 등의 상관관계를 찾는 것입니다. 상관관계란, 이를테면 키와 몸무게 같은 관계(일반적으로 키가 크면 체중도 큰 경향이 있음)를 말합니다. 관계 시각화를 가장 잘 보여주는 시각화 방법은 버블차트입니다.

[알아봅시다] 데이터시장 판도 바꾸는 빅데이터 시각화
대한민국 행정구역별 인구현황 (버블 차트). LG CNS 제공


비교시각화는 다양한 변수를 통해 대상들을 비교하는 것입니다. 어떠한 대상의 차이를 찾아야 할 필요도 있지만, 동시에 유사성 관계도 확인해 볼 수 있는 것이 비교 시각화입니다. 공간시각화는 동일한 한 장의 지도 차트에서 특정 연도나 성별을 선택해 시점에 따른 경향이나 그룹별 차이 또한 즉시 확인해 볼 수 있습니다. 지도상에서 표시하는 점은 단지 한 위치만을 표시하는 데 그칩니다. 또 좌표가 밀집한 구역에서는 점이 모여 있어 가독성을 해치게 됩니다. 도시, 주, 국가, 대륙은 일정한 경계가 있기 때문에 점이 아닌 영역을 활용해 데이터를 표현할 수 있습니다.

빅데이터는 그 자체가 곧 현실입니다. 빅데이터를 시각화한다는 것은, 곧 우리 주위에서 어떤 일이 벌어지는지 시각적으로 보여준다는 것을 뜻합니다.

이에 LG CNS 관계자는 "데이터와 정보에 대한 새로운 접근법들이 도입됨에 따라 시각화 기술은 지금까지 계속 발전하고 있으며, 이러한 기술은 정보에서 도출할 수 있는 지식을 구체화하는 방법론이기 때문에 향후 의사결정에 지대한 영향을 미칠 수 있는 분석 전략이 될 수 있다"고 강조했습니다.

송혜리기자 shl@dt.co.kr / 도움말 =LG CNS




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사