네이버가 하반기 인공지능 (AI) 스피커에 '화자인식' 시스템을 적용한 서비스를 선보인다.

네이버는 4일 네이버테크포럼을 열고 네이버의 AI 스마트 스피커에 적용된 음성인식, 음성합성, 언어처리 기술을 소개했다. 이 자리에서 한익상 네이버 클로바 음성인식 리더는 음성인식의 발전 방향과 과제에 대해 '화자인식'과 '맥락 이해'를 꼽았다. 네이버는 올 하반기 화자인식 서비스를 선보일 방침이다. 네이버의 메신저서비스인 '라인'에서 메시지를 읽어 주는 서비스에 적용한다는 계획이다.

예를 들어 "라인 메시지 읽어줘"라고 했을 때 계정 사용자의 목소리를 구별해 인증하는 방식이다.

한익상 리더는 "화자인식은 크게 '누가 말하는지 맞추는 것'과 '등록된 사용자가 말하는 지 인증하는 기술'로 나뉘는데 아직까지 국내에서는 서비스를 낸 곳이 없다"며 "구글에서 말하는 사람에 맞춰 맞춤 정보를 제공해 주는 서비스를 제한적으로 시행하고 있다"고 말했다. AI스피커 화자인식이 가능해지면 발화자의 의도에 가장 가까운 정보를 제공해 줄 수 있을 것으로 보인다. '내가 좋아하는 음악', '내가 찾았던 정보' 처럼 1인칭으로 물어도 스피커가 구분할 수 있기 때문이다. 또 스피커와 대화 시 발화자의 이름을 불러 주는 등의 고도화된 음성 서비스가 가능해 진다.

네이버는 화자인식 서비스가 정밀해 지면 등록된 발화자에 따라 상품 주문이나 결제 서비스등을 연동하는 방안도 검토 중인다. 이미 네이버는 AI스피커에서 삼다수 등 소액 결재가 가능한 현재 11개 품목에 대해 음성 주문 가능하도록 서비스하고 있다.

이와 함께 네이버는 AI스피커와 지식인을 연동하는 시멘틱 매칭 시스템을 통해 질의 응답 시스템의 성능향상, 자연어 처리 정확도를 높여간다는 방침이다. 시멘틱 매칭 시스템이란 2500만건의 지식인 문서로부터 사용자의 언어 표현 행동을 습득해 유사한 의미로 구성된 일상에서 사용하는 표현을 처리한다. 강인호 자연어처리(NLP)리더는 "지식인의 데이터를 AI스피커에 적용해 언어로서는 같은 말이지만 스피커가 인식하기 어려웠던 동의어, 오타 등 한계를 극복할 수 있다"며 "시멘틱 매칭 기술은 지식인이 활발한 한국어 처리에서 압도적인 성능을 보이고 있는데 일본어 등 글로벌 기술력을 확보하고 차후 라인이 서비스되는 모든 국가에 적용하는 것을 목표로 하고 있다"고 말했다.

김지영기자 kjy@

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0