웹ㆍ소셜ㆍ포털 서비스 등 데이터 주목

외부 빅 데이터 발견 노하우

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


웹ㆍ소셜ㆍ포털 서비스 등 데이터 주목
성공적인 빅 데이터 활용을 위해서는 주어진 빅 데이터를 관리하고, 처리하는 것과 함께 활용할 수 있는 외부 빅 데이터 자원을 발견하고 확보하는 전략을 수립하는 것이 중요하다.

한국정보화진흥원 보고서(빅 데이터 활용을 위한 3대 요소)에 따르면, 데이터를 금맥(유용한 정보)을 찾는데 필요한 자원으로 본다면, 자원을 키우는 것은 중요한 빅 데이터 성공 전략의 하나이다.

빅 데이터 환경에서 자원 확보는 생성, 수집(검색), 공유와 연계, 협력, 참여, 개방 등에 따라 단계적으로 확장이 가능하다.

최근에는 웹, 소셜 미디어, 포털 검색 데이터 등을 분석해 여론 확인, 기업의 마케팅 서비스 등에 적용하는 사례가 증가하고 있다. 또 국내ㆍ외에서 공공 데이터의 개방이 확대되는 추세이며, 개방된 공공 데이터를 활용한 다양한 환경 분석이 가능하다는 점을 주목할 필요가 있다.

이처럼 활용할 수 있는 외부 빅 데이터 자원을 발견해 적극적으로 확보하는 것과 함께 내부 자원에 대해서는 결과의 신뢰성을 제고하기 위해 품질을 높이고 관리하는 것이 중요하다.

빅 데이터라고 말할 수 있는 수준으로 데이터가 증가하는 분야는 통신, 포털, 금융, 의료, 공공과 일부 대기업에 국한될 수 있다. 이는 반대로 데이터가 부족한 대부분 기업, 특히 중소기업의 경쟁력이 약화되거나 정보격차 발생으로 이어질 수 있다는 것을 뜻한다.

최근 저렴한 가격으로 빅 데이터 저장공간과 분석 솔루션을 제공하는 기술과 서비스 시장이 확대되고 있는 것은 기업의 투자부담을 완화시킬 수 있다는 점에서 긍정적이다.

대용량 데이터 처리 분석을 위한 오픈소스 기반의 대규모 분산 컴퓨팅 지원 프레임워크인 하둡(Hadoop)은 비용이 저렴한 것이 장점이다. 또 구글이 추진하고 있는 `빅 쿼리(Big Query)' 서비스는 기업이 별도의 인프라를 구축하지 않고도 데이터를 분석할 수 있도록 지원한다는 점에서 눈 여겨 볼 만 하다.

강동식기자 dskang@
▶강동식기자의 블로그 : http://blog.dt.co.kr/blog/?mb_id=dskang




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사