들을수록 실력 업그레이드… `지식증강형` 통역기술 나온다

강연·동영상·화상통화도 지원
웨어러블 기기로 상용화 기대
ETRI, 2020년까지 개발 추진

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


들을수록 실력 업그레이드… `지식증강형` 통역기술 나온다
ETRI 연구자들이 웨어러블 헤드셋을 착용하고 지니톡을 이용해 자동통역을 시연하고 있다. ETRI 제공
국내 자동 통번역 솔루션인 '지니톡'이 실시간 동시통역 원천기술을 적용해 웨어러블 기기 등 단말기에 탑재될 전망이다. 기존 정형화된 단문 구조 통역을 뛰어넘어 일상에서 사용하는 모든 자유발화를 실시간 통역하는 형태로 업그레이드되는 것이다.

한국전자통신연구원(ETRI) 연구진은 강연이나 동영상 등 연속된 자유발화에 대해 의사소통 단위로 실시간 통역이 가능하고, 사용하면 할수록 성능이 개선되는 '지식증강형 실시간 동시통역 기술'을 오는 2020년까지 개발하기로 했다.

한 문장씩 순차적으로 통역하는 기존 통역 방식에서 벗어나, 말하는 사람의 연속된 자유발화를 실시간 통역하는 형태로 진화시키겠다는 것. 일상생활에서 쓰이는 비문을 포함한 모든 문장과 단어를 실시간으로 동시 통역해 주는 방식이다. 50만개 이상의 단어를 통역할 수 있도록 성능을 높여 사실상 모든 어휘의 통역이 가능한 수준으로 발전시킨다는 구상이다.

현재 실시간 동시통역 기술은 신경망 자동번역(NMT) 기술과 대용량 번역 데이터베이스(DB) 및 하드웨어 인프라 발전에 힘입어 다양한 형태의 서비스로 선보이고 있다. 일례로 마이크로소프트는 화상통화 서비스인 '스카이프'에 실시간 자동통역 소프트웨어인 '트랜스레이터'를 탑재해 서비스하고 있다. 구글 역시 유튜브를 통해 '동영상 실시간 통역'을 제공하면서 시장선점 경쟁을 벌이고 있다.

ETRI는 오는 2020년까지 영어와 중국어를 동시 통역하는 '비정형 연속발화 자동통역기술'을 확보할 계획이다. 이를 위해 정형화되지 않은 문장이나 발음을 알아들을 수 없는 단어 등을 처리할 수 있는 비정형 언어분석과 의사소통 단위의 실시간 분절 기술을 개발하고 있다. 또한 딥러닝 기반의 연속 자유발화 음향·언어 모델링 기술과 신경망 기반의 다중모델 하이브리드 자동번역 기술, 자유로운 양방향 대화가 가능한 '제로 UI' 통역 기술 등을 탑재한 '신경망 자동번역 엔진'을 개발하고 있다.

이 엔진은 쓸수록 음성인식 지식 DB와 자동번역 지식 DB가 업그레이드되는 지식증강형 형태여서 통역 정확도가 갈수록 높아질 수 있다.

이 솔루션이 완성되면 강연이나 동영상, 화상전화 등이 실시간으로 통역되는 만큼 언어에 구애받지 않고 의사소통이 가능해질 것으로 기대된다.

ETRI는 이 기술을 단말탑재형이나 웨어러블 기기 형태로 상용화한다는 계획이다. 또 동남아어, 아랍어 등 다양한 언어 통역서비스도 개발한다.

ETRI 관계자는 "동영상 강연과 생중계 강연을 동시 통역해 주는 프로토타입 시스템을 구현해 실시간 동시통역 서비스의 완성도를 높여 가겠다"고 말했다.한편 지니톡은 내년 평창동계올림픽에서 8개 언어에 대한 통역 서비스를 지원할 예정이며, 지난 1월 MWC 2017에서 선 없이 이어폰만 낀 채 통역을 지원하는 '넥밴드 이어셋 웨어러블 자동통역 기술'을 선보여 주목을 받았다.

대전=이준기기자 bongchu@




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사