과기정통부 `AI 데이터 구축사업` 과제 확정

20개에 과제 390억 투입

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


과기정통부 `AI 데이터 구축사업` 과제 확정
'AI 학습용 데이터 구축과제' 선정결과

<자료:과기정통부>


과학기술정보통신부는 AI(인공지능) 개발에 필수적인 데이터를 대규모로 구축·개방하는 'AI 학습용 데이터 구축사업' 20개 과제를 확정했다고 21일 밝혔다.

과기정통부는 2017년부터 이 사업을 추진, 한·영 번역 말뭉치, 한국어 음성, 이상 행동영상 등 텍스트, 이미지, 영상 분야 기계학습용 데이터 21종, 4650만건을 구축해 AI허브를 통해 공개 중이다. 예산이 작년 195억원에서 올해 390억원으로 늘어 선정과제도 2배로 증가했다.

올해는 △사람의 감성과 문맥을 이해하는 자연어 처리 △자동차·드론 등 자율주행기술 △음성·시각·언어 융합 등 국가·산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 선정했다. △질병진단·운동 등 헬스케어 △사람의 얼굴을 악의적으로 변조한 딥페이크 방지기술 △장애인 삶 향상 관련 과제도 포함시켰다.

과기정통부 `AI 데이터 구축사업` 과제 확정
데이터 댐 구상 예시

<자료:과기정통부>


AI 학습용 데이터 수집·가공에는 많은 인력이 필요한 만큼 언제 어디서든 누구나 참여하는 크라우드소싱 방식을 적용해 인력부족 문제를 해결한다. 과기정통부는 지난해 2개 과제에 크라우드소싱을 적용한 데 이어 올해 모든 과제로 확대했다. 이를 통해 청년과 취업준비생, 경력단절여성, 장애인 등에게 일자리를 제공하고, 데이터 가공 전문성을 쌓는 기회도 열릴 전망이다.

한편 과기정통부는 이번 선정에 이어 추경을 통해 2925억원을 추가 확보해 150종의 데이터를 더 구축할 예정이다. 시장에서 필요한 양질의 AI 학습용 데이터를 많이 확보해 AI 경쟁력을 끌어올린다는 전략이다. 구축 결과물은 데이터 댐에 모으고, 연구와 상용화 서비스 개발에 활용하도록 지원할 계획이다.

과기정통부 관계자는 "이 사업을 통해 양질의 일자리 창출과 경제성장의 새로운 원동력을 확보할 수 있을 것으로 기대한다"고 밝혔다.

안경애기자 naturean@dt.co.kr

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]