‘백조’가 100조라고?… AI적용했다더니 구글 ‘엉뚱 번역’

AI 적용 성능 개선 불구
동음이의어 등 해석 못해

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


‘백조’가 100조라고?… AI적용했다더니 구글 ‘엉뚱 번역’
구글 번역 모바일 웹페이지에서 '옛날에 백조 한 마리가 살았습니다'를 번역한 결과, 백조를 새가 아닌 숫자 100조로 번역하는 오류가 나타난 모습.


구글이 최근 인공지능(AI) 기술을 적용해 성능을 크게 개선했다는 '구글 번역' 서비스를 선보였지만, 여전히 적잖은 오류가 발견돼 이용자 불만을 잠재우기엔 역부족이란 지적이다. 구글은 번역 서비스를 바탕으로 사용자 명령 인식 기술을 끌어올려 'AI 시대'를 대비한다는 계획이지만, 번역 기술의 한계 극복이 선행돼야 할 것으로 보인다.

버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 29일 서울 역삼동 구글코리아 사옥에서 'AI 혁신의 시대:구글 포토와 구글 번역'이라는 주제로 화상 간담회를 열었다. 투로프스키 총괄은 "구글이 최근 번역 서비스에 적용한 '구글 신경망 기계번역(GNMT)' 기술은 단어나 어구를 쪼개 번역하는 기존 방식과 달리 문장 전체를 하나의 단위로 번역할 수 있는 서비스"라며 "오역을 줄이는 차세대 번역 시스템"이라고 소개했다.

구글은 앞서 지난 9월 '구글 신경망 기계번역' 기술을 공개하고 이달 15일부터 한국어를 포함한 영어, 일본어, 중국어 등 8개 언어 번역 서비스에 이 기술을 적용했다. 신경망 기계번역이란 기존 구문 기반의 기계번역(PBMT)이 문장을 단어와 구 단위로 쪼개 개별적으로 번역하는 것과 달리 전체 문장을 하나의 번역 단위로 간주해 한꺼번에 번역하는 기술을 말한다. 문맥을 사용해 가장 적합한 번역을 찾고, 이를 문법 규칙에 따라 자연스러운 문장으로 번역하는 기술이다. 구글은 자체 조사 결과, 위키피디아와 뉴스 매체의 문장을 기준으로 주요 언어 조합을 평가했을 때 이 기술을 사용한 이후 번역 오류가 기존 55%에서 88% 가량 줄었다고 설명했다.

실제 이날 시연에서 웹과 모바일 앱에서 구글 번역을 사용한 결과, 대한민국 헌법 제1조는 물론 법률 스님의 명문으로 꼽히는 '삶이 그대로 복인 줄 알아야 돼요'(Life must be blessed as it is) 등을 막힘없이 번역했다. 투로프스키 총괄은 "전체 문맥을 고려해 실제 인간이 말하는 문장에 가깝도록 번역하고 있다"며 "이 시스템으로 구글 번역은 지난 10년 노력을 합친 것 이상으로 도약했다"고 주장했다.

하지만 구글의 설명과 달리 한국어의 중의적 의미 등을 해석하지 못하는 등 이전 구글 번역 서비스의 오류가 개선되지 않고 있다. 예컨대 '옛날에 백조 한 마리가 살았습니다'에서 백조는 새가 아닌 숫자 100조로, 먹는 밤은 깜깜한 밤으로, 미쳤다는 의미의 돌았다는 회전하다 등으로 잘 못 번역됐다.

이에 대해 구글 측은 "한국어의 경우, 인공지능의 학습 내용이 적어 이 같은 오류가 아직 발생한다"며 "신경망 기계번역 기술은 학습 내용을 축적해 시간이 갈수록 더 나은, 더 자연스러운 번역 서비스를 제공할 것"이라고 밝혔다.다가올 AI 시대를 맞아 번역 서비스 경쟁이 본격화할 전망이다. AI 시대에서 이용자의 명령을 인식하고 수행하는 시스템에 필요한 핵심 기술이 번역, 즉 자연어 처리 기술이기 때문이다. 현재 국내에서는 네이버가 해외를 겨냥해 AI 기반 통번역 앱 '파파고'를 선보였다. 이 앱 역시 구글과 마찬가지로 신경망 기계번역 기술을 적용했다.

정용제 미래에셋증권 애널리스트는 "기존과 달리 모든 기기가 인터넷으로 연결되는 사물인터넷(IoT) 시대에 인터넷 기업들은 음성인식 AI 기술을 통해 차세대 검색 서비스에 대비해야 한다"며 "주도권 경쟁은 AI를 통한 분석과 추천 능력이 될 것"이라고 말했다.

정채희기자 poof34@

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]

추천기사