'언어 장벽' 허무는 AI, 단어 순서·의미·맥락 등 반영 전체 문맥 파악… 정교한 번역 가능 반복적 기계학습 통해 스스로 습득 입·출력 문장 데이터 확보 등 관건 네이버·구글·한컴 등 IT 기업 경쟁 문학·비유적 표현 번역 능력은 숙제
구글 번역 로고 이미지 <구글 제공>
네이버 파파고 '미니' 안내 화면 <네이버 제공>
말랑말랑 지니톡 <한글과컴퓨터 제공>
인공지능(AI) 시대가 본격화하면서 기계번역(컴퓨터가 수행하는 번역)의 패러다임이 바뀌고 있습니다. 주목해야 하는 것은 AI가 문맥을 파악해 단어의 순서, 의미, 맥락 등을 번역에 반영하는 '인공신경망 번역' 기술입니다. 이 기술이 바로 언어의 장벽을 낮추는 '번역의 혁신', 그 출발점에 있기 때문입니다.
국내외 IT업체들이 앞다퉈 뛰어들고 있는 '인공신경망 번역'(NMT;Neural Machine Translation)은 사용자가 입력한 문장을 단어·구 단위로 쪼갠 뒤 통계적으로 가장 본래 의미에 가깝다고 판단되는 번역결과를 내놓는 기존 통계기반 번역(SMT;Statistical Machine Translation)과 달리, 문장을 통째로 번역합니다.
AI가 전체 문맥을 파악한 뒤 단어의 순서, 의미, 맥락 등을 반영합니다. 전체 문장의 맥락에 대한 이해가 떨어지는 SMT 한계를 극복할 수 있는 이유가 바로 여기에 있습니다. 전체 문맥을 파악해 어두운 '밤'과 먹는 '밤'을 정확히 분간해내는 수준의 정교한 번역이 가능하기 때문입니다.
NMT가 작동되는 원리는 번역하려는 문장(입력 문장)과 결과 문장(출력 문장)을 컴퓨터에 주면, 컴퓨터가 결과 문장이 나오게 하는 중간값을 반복적인 기계학습을 통해 스스로 습득하는 것입니다.
이러한 NMT의 핵심은 컴퓨터가 학습하는 데이터의 양이라고 할 수 있습니다. 얼마나 많은 입·출력 문장 데이터를 확보해 컴퓨터에 넣어줄 수 있는가에 따라 컴퓨터의 기계학습 능력은 풍부해질 수 있습니다. 얼마나 풍부한 학습데이터가 확보됐는가에 따라 번역 성능이 좌우되는 것이죠.
현재 네이버, 구글, 한글과컴퓨터 등 국내외 IT업체들은 'NMT 선도기업' 타이틀을 거머쥐기 위해 이 분야에 적극적으로 뛰어들고 있습니다. 국내 1위 포털 네이버는 작년 8월 그동안 축적한 방대한 데이터를 무기로 자사의 번역 앱인 파파고 베타버전에 NMT를 도입했습니다. 현재 한국어와 영어, 중국어 간체, 일본어를 지원 중이며, 스페인어, 프랑스어, 인도네시아어, 태국어, 중국어 번체, 베트남어 등 6개 언어가 연내 추가될 예정입니다. 양방향으로 NMT 방식을 적용 중인 영어-한국어, 한국어-중국어 번역의 경우, 번역 가능한 글자 수는 200자 이내로 제한되고 있습니다. 네이버는 올 상반기 중 이 제한 글자 수를 늘릴 계획이라고 밝혔습니다.
구글은 작년 9월, 자사 번역 앱에 NMT 방식을 도입했습니다. 구글은 영어와 중국어 간 번역을 시작으로 한국어, 일본어, 프랑스어, 독일어, 스페인어, 터키어 등 8개 언어 조합에 시범 적용(영어를 중심으로)했습니다. 최근에는 힌디어, 러시아어, 베트남어에 추가 적용했습니다. 현재 구글 번역 서비스를 제공 중인 103개 언어 전체에 이 기술을 도입하는 게 이 회사 목표입니다. 지난해 11월 NMT 방식을 접목한 한국어-영어 번역의 경우, 번역 결과를 얻으려면 구글 번역 웹사이트에서 5000자 이내로 글자를 입력해야 합니다. 문서 파일(pdf, txt, doc, ppt, xls, rtf 파일 지원)을 구글 번역 웹사이트에서 문서로 등록하면 글자 수 제한 없이 NMT 번역이 적용된 결과를 얻을 수 있습니다.
한글과컴퓨터는 2015년 자회사 한컴인터프리를 통해 한국전자통신연구원(ETRI)이 개발한 통번역 서비스 '지니톡' 기술을 이전받아, 작년 7월 '한컴 말랑말랑 지니톡'을 선보였습니다. 회사는 최근 지니톡 한·영 번역에 NMT 기술을 적용했습니다. ETRI 등 정부기관이 축적한 공공 데이터가 기계학습 데이터로 이용되고 있습니다. 한컴은 문법 기반 번역(RBMT) 기술을 함께 적용, 사용 빈도가 낮은 문장의 번역 정확도가 떨어지는 인공신경망 번역 기술의 단점을 보완, 서비스 차별화를 노린다는 계획입니다.
현재 NMT는 초창기인 만큼, 아직은 인간 번역사를 따라잡기는 어렵다는 평가를 받고 있긴 합니다. 실제 지난 2월 서울 세종대에서 국제통역번역협회 주최로 열린 인간 번역사 대 AI 번역기의 한글-영어 번역 대결에서, 인간 번역사가 문학 지문 30점, 비문학 지문 30점 만점에 평균 합계 49점을 받았습니다. 반면 3대 번역기(구글·네이버·시스트란 기계 번역기) 중 한 대는 28점, 나머지 두 대는 20점 이하를 받았습니다. 대결은 인간 대표 전문 번역가 4명이 각각 한 지문씩 맡아 번역하고, 구글·네이버·시스트란 기계 번역기는 동시에 지문 4개를 모두 번역하는 방식으로 진행됐습니다.
특히 문학 지문에서 인간 번역사에 비해 기계 번역 능력이 크게 떨어지는 것으로 나타났습니다. 인간 번역사처럼 비유적 표현, 행간의 의미까지 읽어내는 수준으로 진화하려면 갈 길이 멀어 보입니다. AI 기반 인공신경망 번역 서비스 업체들 간 치열한 경쟁에 따른 기술 진화로, 이 같은 문제점이 얼마나 빨리 극복될 수 있을지 주목됩니다.