"원천 데이터 제각각… 표준 정립 시급"

부처간 빅데이터 협력 전략

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


소프트웨어(SW)업계에서 빅데이터 시대에 데이터 활용성을 높이기 위해 정부 주요 부처와 공공기관, 학계에서 사용하는 데이터를 표준에 맞춰 정립해야 한다는 주장이 나오고 있다. 정부가 빅데이터 효율을 높이기 위해 부처별로 협력을 확대하고 있지만, 데이터 표준이 달라 제대로 활용하기 어렵다는 지적이다.

지난달 30일 업계에 따르면, 최근 정부는 행정자치부를 중심으로 부처 간 빅데이터 협력 전략을 발표했다. 관련 내용은 각 부처에서 발생하는 공공정보를 취합해 빅데이터 분석을 통해 활용성을 높이고 데이터 기반의 정책을 추진하도록 하는 것이다. 하지만, 현재 국내 부처별로 수집하는 데이터에 대한 표준이 없어 부처 간 데이터 분석시 추가로 데이터 기준을 맞춰야 하는 데이터 정제와 가공이 필요한 것으로 나타났다.

빅데이터 전문가들은 이같은 문제를 해결하기 위해 빅데이터 협력 못지 않게 데이터 표준에 맞춰 수집하는 것이 중요하다고 지적하고 있다. 정부 부처에서 수집하는 데이터는 속성이 달라 같은 종류 파일이라도 재가공이 필요하다는 입장이다.

SW업체 관계자는 "데이터 표준이라는 개념이 등장한 지 얼마 되지 않아 각 기관별로 데이터 표준이 다르며 일부에서는 업무에 따라 부서 간에서도 호환성이 떨어진다"며 "수집 정보 종류와 속성, 파일 종류부터 정립할 필요가 있다"고 말했다.

실제 정부가 운영하고 있는 공공데이터 포털(www.data.go.kr)에 올라온 정보는 대부분 재가공이 필요한 상태다. 교육, 국토관리, 공공행정 등 분야별로 각 부처, 공공기관이 올려놓은 정보는 개별적인 현황 파악은 가능하지만, 교차분석을 하기 위해서는 분석할 수 있는 형태로 변환이 필요하다.

이같은 문제를 해결하기 위해 웹 표준을 활용해 데이터 활용과 재생산이 가능한 '링크드 데이터'로 구축하는 방안이 추진 중이다. 링크드 데이터는 월드와이드웹(WWW)을 만든 팀 버너스리가 제안한 데이터 방식으로 2009년 미국 정부는 민간에 공개하는 공공데이터(data.gov)를, 2010년 영국 정부도 공공데이터 개방사이트(data.gov.uk)를 통해 제공하고 있다. 링크드 데이터로 구축된 정보는 다른 데이터와 연동 분석, 변환이 유연한 것이 특징이지만, 가공을 위해 비용이 추가되는 것이 단점이다.

우리나라도 국가DB사업을 통해 생물정보와 한국사을 링크드 데이터로 구현했지만 일부 데이터에 국한되고 있다.

SW업체 관계자는 "빅데이터를 일찍 시작한 금융, 유통 업체들도 데이터 통합이 안돼 지점별, 온·오프라인 별로 정보가 상이하다"며 "다양한 채널에서 발생하는 데이터를 분석하려면 데이터 수집보다 표준을 먼저 구축하고 그에 맞춰 데이터를 수집하는 것이 중요하다"고 말했다.

이형근기자 bass007@
▶이형근기자의 블로그 바로가기

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]

추천기사