"언어 특화된 데이터 플랫폼 키워 기계, 사람처럼 말하는 시대 열것"

언어·자연어 처리로 차별화 전략
퍼블릭 크라우드 소싱 9월 도입
25개 기업·공공기관 고객사 확보
8000여명 작업자 플랫폼서 활동

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


"언어 특화된 데이터 플랫폼 키워 기계, 사람처럼 말하는 시대 열것"
딥네츄럴 플랫폼의 AI 비서 기능.

딥네츄럴 제공

"언어 특화된 데이터 플랫폼 키워 기계, 사람처럼 말하는 시대 열것"
박상원 딥네츄럴 대표.


'데이터 콜라보' 현장을 가다

딥네츄럴


"데이터바우처 사업 수요기업들의 데이터 수요가 점점 늘어나고 다양해지는 것을 체감한다. 특히 AI 스타트업들이 크게 늘었고, 앞으로도 점점 많아질 것으로 기대된다." 데이터 콜라보 현장의 목소리를 듣기 위해 최근 서울 서초구 사무실에서 만난 박상원(사진) 딥네츄럴 대표는 "대기업이 잘 하는 분야가 있는 반면 기술 하나만 보고 집중하는 스타트업이 잘 하는 영역이 있는 것 같다"면서 "AI 분야가 대표적"이라고 말했다.

◇크라우드소싱 통해 데이터 생산·가공= 2017년 4월 설립된 딥네츄럴은 크라우드 소싱과 기계학습, 자연어 처리를 핵심 기술로 하는 AI 데이터 생산·가공 플랫폼을 운영한다.

이 회사는 작년 1월부터 크라우드 소싱 기반 데이터 생산·가공 플랫폼 개발을 시작해 여름부터 베타 서비스를 시작했다. 9월에는 플랫폼을 오픈하고, 일반 사용자도 작업할 수 있게 퍼블릭 크라우드 소싱을 도입했다. 국립국어원, KB금융지주, 솔트룩스, 스피링크 등 25개 기업, 공공기관을 고객사로 확보했다.

회사는 특히 정부가 데이터 경제 활성화를 위해 역점적으로 추진하는 과기정통부, 한국데이터산업진흥원의 데이터바우처 사업을 통해 스타트업들을 돕는 동시에 협업·성장 기회를 얻고 있다. 타로챗봇, 작곡AI, 영어 말하기 교육기업 등이 데이터바우처 사업을 통해 딥네츄럴의 서비스를 이용하고 있다.

딥네츄럴은 지난해에 11개 수요기업을 지원한 데 이어 올해에는 18개 수요기업을 지원하고 있다.

박 대표는 "AI 학습 데이터 구축에 수천만원에서 수억원의 비용이 들다 보니 스타트업들이 자체 자금으로 투자할 엄두를 내기 힘들다"면서 "데이터바우처가 마중물 역할을 하는 것 같다"고 밝혔다.

◇8000여 명의 작업자가 플랫폼서 활동= 이 회사는 수요자들의 요청을 받아 AI 데이터 수집·가공 프로젝트를 오픈하고, 플랫폼에 참여하는 작업자들의 협업을 통해 작업을 수행한다.

약 8000명의 작업자가 PC에 인터넷만 연결돼 있으면 플랫폼에 로그인해 작업을 수행하고 수익을 올린다.

최근 산업 현장에서 필요로 하는 데이터의 종류는 빠르게 늘어나고 있다. 과거에는 정형 데이터 수요가 많았다. 그러나 딥러닝이 나오면서 부터는 과거보다 할 수 있는 영역이 훨씬 많아지면서 데이터 수요도 다양해졌다. 회사는 데이터를 만든 후 기업들이 본격적으로 활용할 수 있도록 AI 엔진 프로토타입을 개발해 주기도 한다.

박 대표는 "예를 들어, 동영상을 가짜로 만드는 AI 기술이 개발됐는데, 이를 위해서는 텍스트와 연설하는 모습 데이터가 필요하다. AI 아나운서 기술을 위해서는 텍스트와 영상의 패키지 데이터가 요구된다"고 설명했다.

◇20대 여성 작업자 비중 가장 높아= 작업자들은 매우 다양한 작업을 한다. 언어 전공자만 할 수 있는 언어 형태소 분석을 하기도 있고, 텍스트에서 사람, 기관, 장소 등의 개체명을 구분해 라벨링 작업을 하기도 한다. 음성을 듣고 영어 말하기 등을 얼마나 잘했는지 점수를 매기는 음성점수 라벨링 작업도 이뤄진다. 장소, 주제, 대화 분위기 등 주어진 설정에 맞게 일대일 대화을 만드는 대화생성 작업도 한다.

박 대표는 "작업자는 20대 여성이 가장 많은데, 고령층 데이터가 필요할 경우 다른 기업과 활발하게 협업한다"고 말했다.

작업자는 연내 1만명을 넘길 것으로 예상된다. 작업 과정에는 AI도 조력자 역할을 한다. AI는 학습자가 데이터를 라벨링 작업을 하기 전 먼저 가능한 부분을 수행해 준다. 또 작업자가 한 작업 결과를 확인해 오류 가능성을 알려줘 검수작업에 생기는 병목현상을 줄여준다. 회사는 연내 플랫폼을 고도화해 PC 뿐만 아니라 모바일에서도 작업할 수 있도록 할 예정이다. 또한 현재 수동으로 적용하고 있는 AI비서 기능을 자동화해 선보일 계획이다.

◇"컴퓨터가 사람처럼 대화하는 날 올 것"= 숭실대, KAIST 대학원, 독일 베를린공대 대학원에서 머신러닝 기반 자연어 처리를 전공한 박 대표는 언젠가 컴퓨터가 사람처럼 대화하는 날이 올 것이라는 확신을 갖고 창업에 도전했다. 크라우드 소싱 기반 데이터 플랫폼 중에서도 언어와 자연어 처리로 차별화하겠다는 전략이다.

과거에는 딥러닝 기술을 적용해도 언어 장벽이 컸지만, 최근 뉴럴 네트워크와 자연어 처리 기술이 진화하면서 언어장벽이 거의 극복됐다는 게 박 대표의 설명이다. 데이터만 있으면 한국어에 적용했던 언어 AI모델을 이용해 중국어, 일본어 모델도 쉽게 만들 수 있게 된 것. 국내 시장에서 플랫폼을 완성한 후 향후 베트남, 인도네시아 등으로 확장한다는 전략이다.

딥네츄럴은 작년 10억원의 매출을 달성한 데 이어 올해 50억원, 내년도에는 100억원의 매출을 기대하고 있다. AI 기술을 강화해 생산성을 높이고 모바일앱을 올해중 선보여 보다 많은 사람들이 AI 학습에 참여하면서 수입을 얻도록 한다는 계획이다.

박상원 대표는 "우리의 미션은 기계가 사람처럼 대화하는 시대를 여는 데 일조하는 것"이라면서 "크라우드 소싱 플랫폼을 통해 노동시장에서 AI와 인간이 공존하는 질서를 만드는 데 기여하겠다"고 밝혔다.

안경애기자 naturean@dt.co.kr




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사