AI 활용도 높은 100종 선정·제공 계획

과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 범부처 인공지능(AI) 학습용데이터 현황조사 ‘AI학습용데이터 센서스’에 지난 10일 착수했다고 밝혔다.

과기정통부는 AI기본법에 근거해 각 부처·공공기관이 보유한 AI 학습용 데이터에 대한 첫 전수조사를 실시한다. 이로써 공공부문에서 기관별로 분산·관리돼온 AI 학습용 데이터 현황을 체계적으로 진단한다. 또, AI 학습 활용 가능성이 높은 데이터 100종을 발굴해 ‘AI학습용데이터 통합제공체계’를 통해 연계·제공(60억원 규모) 계획이다.

이번 조사에선 AI 학습용 데이터뿐 아니라 향후 가공을 통해 활용 가능한 데이터까지 포함해 조사한다. 조사항목은 AI 학습용 데이터의 유형·구조, 구축 목적, 제공 가능 범위 등 AI 학습 활용 가능성과 직결되는 요소 중심으로 구성되며, 표준화된 조사체계를 통해 일관성과 신뢰성을 확보할 계획이다.

조사결과를 토대로 기관별·분야별·유형별로 데이터 제공 가능 여부 및 가공 수준 등에 대한 종합적인 검토를 진행하고, AI 학습 활용 가능성이 높은 데이터 후보군을 도출한다. 전문가 심층 인터뷰와 민간 수요조사 등을 거쳐 통합제공체계를 통해 연계·제공할 데이터 100종을 선정한다. 품질보완과 비식별조치 등 AI 학습용 데이터 가공 관련 기술적·재정적 지원을 거쳐 제공하고, 온라인 공개가 어려운 경우 ‘데이터 안심구역’을 통한 제공을 병행할 예정이다.

김경만 과기정통부 인공지능정책실장은 “AI 성능과 품질의 핵심은 활용 가능한 풍부한 데이터에 있다”며 “이번 조사를 통해 공공부문이 보유하고 있는 AI학습용데이터 자산을 체계적으로 발굴하고 이를 편리하게 활용할 수 있는 AI학습용데이터 통합제공 기반을 지속적으로 발전시켜나가겠다”고 말했다.

팽동현 기자(dhp@dt.co.kr)

[저작권자 ⓒ디지털타임스, 무단 전재-재배포, AI 학습 및 활용 금지]
팽동현

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0