[알아봅시다] 국내 데이터 공개현황 및 개선방안

데이터 공개에만 초점… 활용도·성과 낮아
한국, 품질 2등급 84.3% 쏠림… 4·5등급 없어
"수집 · 가공 · 추출 등 포함… 공개 개념 바꿔야"

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


[알아봅시다] 국내 데이터 공개현황 및 개선방안


◇데이터 처리 기술의 이해=데이터 유형 중에서 그동안 공개 대상은 내부·정형 데이터에 주된 초점이 맞춰졌습니다.

한국지역정보개발원이 한국과학기술정보연구원에 의뢰해 발간한 발간한 '데이터처리기술 및 데이터공개방안' 보고서에 따르면 이제 내부·정형의 데이터만이 아니라 외부·비정형 데이터까지 관련된 정보들을 통합하고, 가공함으로써 보다 가치 있는 데이터를 생성·공개하는 것이 필요하다고 말하고 있습니다. 이를 위해선 기존의 데이터 공개에만 초점을 맞추던 것에서 벗어나 데이터의 수집, 가공, 추출을 함께 다루어 데이터 공개의 개념을 바꿀 필요가 있다는 지적입니다.

데이터 확보 측면에서 기관이 기존에 확보한 정형 데이터의 경우, 데이터 확보 단계는 이미 달성된 상태라고 할 수 있습니다. 데이터 확보단계는 단순히 기관 내부의 자료 뿐 아니라 기관 외부에 공개된 자료들 중에서 관련된 자료들을 수집해 향후 사용 가능하도록 변환하는 작업을 말합니다. 이에 외부 데이터를 수집하고 필터링하는 일련의 단계가 필요합니다.

◇데이터 품질 향상을 위한 개선 방안=국무조정실 정부업무평가위원회가 발표한 '국정과제 평가결과(2014.3)'에 의하면, 정부3.0 성과에 대한 국민체감도가 저조해 국민의 34%만이 정부3.0에 대해서 인지하고 있는 수준으로 나타났습니다. (정부3.0 인지도 조사, 2013.11) 이는 공급자 편의 위주의 데이터 공개로 공개된 데이터에 대한 저조한 민간 활용률을 극복해야 하며, '이제는 정부에서 개방할 수 있는 데이터가 아닌 민간이 필요로 하는 데이터를 집중 개방할 시기'라는 행정자치부의 자체 평가가 도출된 것으로 보입니다.

한국지역정보개발원 보고서에 따르면 미국·영국과 비교했을 때 한국 데이터 품질은 데이터 조작이 어려운 2등급(84.3%)에 집중돼 있는 것으로 조사됐습니다. 3등급 데이터 비중은 선진국 대비 한국의 경우 그 비중이 상당히 낮게 나타났습니다. 3등급 오픈 데이터는 2등급과 비교했을 때 '특별한 소프트웨어 없이도 데이터의 조작이 쉬운가'에 대한 평가가 반영된 것으로, 해당 등급이 낮다는 것은 공개된 데이터를 원하는 목적에 맞게 가공하기 위해 추가적인 데이터 처리가 필요함을 의미합니다.

이에 행자부는 2012년부터 '공공기관의 데이터베이스 품질관리 지침'을 수립하고 품질센터를 운영하고 있으며 2014년까지 총 75개 DB에 대해 DB품질개선사업을 추진했다고 밝혔습니다.

◇국민이 직접 체감할 수 있는 공공데이터 정책 필요=이제는 공공데이터 개방을 넘어 '우리의 절실한 문제를 해결하는데 도움이 되는 데이터는 무엇인가', '그 데이터는 어디에 가면 찾을 수 있고, 어떤 절차를 거쳐야 확보할 수 있는가', '어떻게 활용할 수 있고, 성과를 만들어내기 위해 누구의 도움을 요청해야 하는가' 등으로 구체화해 정책과 전략을 수립해야 할 때라는 게 전문가들의 지적입니다. 그간 데이터 활용사례에서 일부 사례만 반복적으로 등장하는 것은 새로운 성공사례가 부족한 까닭이라는 것입니다.

사업자나 국민이 공개된 데이터를 활용함에 있어 데이터를 분석할 수 없거나, 특정 도구를 이용해 해당 데이터를 재가공해야 재사용이 가능해 일반 사용자의 경우 데이터를 적절하게 원하는 목적대로 활용하는 데 있어 불편을 느끼고 있는 게 현실입니다. 이는 링크드 오픈 데이터 국내 현황의 경우, 제2등급 데이터와 제3등급 데이터 간 차이가 크다고 분석할 수도 있습니다.

공공데이터 본격 개방 3년을 맞아 국민들이 원하는 것을 손쉽게 찾아 활용할 수 있다는 것을 국민이 직접 체감할 수 있는 공공데이터 정책 추진이 필요할 때입니다.

심화영기자 dorothy@dt.co.kr

도움말=한국지역정보개발원




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사