네이버 파파고, ‘한국어·중국어’ 간에도 인공신경망 번역(NMT) 적용

papago네이버랩스가 개발한 모바일 통역앱 파파고는 지난 10월 '한국어·영어'에 이어 '한국어·중국어' 언어 간에도 인공신경망 번역을 적용했다고 15일 밝혔다.  
 
인공신경망 번역(NMT : Neural Machine Translation)은 인공지능(AI)이 스스로 빅데이터를 학습하고 번역하는 최신 번역 기술이다. 과거 통계기반 번역(SMT : Statistical Machine Translation)이 단어와 몇 개의 단어가 모인 구(Phrase) 단위로 쪼개 번역했다면, 인공신경망 번역은 문장을 통째로 번역하는 방식이다.  인공지능이 전체 문맥을 파악한 뒤 문장 안에서 단어와 순서, 의미, 문맥에서의 의미 차이 등을 반영해, 스스로 인간이 구사하는 언어와 유사하게 번역해주는 것이다.
 
실제로 파파고에 적용된 ‘한국어·중국어’의 인공신경망 번역을 기존의 적용 전 통계기반 번역과 비교한 결과, 한국어→중국어는 약 160%, 중국어→한국어는 약 233%까지 번역 정확도가 크게 개선된 것으로 나타났다.
 
예를 들어 '나는 밤마다 밤을 먹는다’라는 문장을 번역할 때 통계기반 번역에서는 ‘밤’이라는 단어를 시간이 지나 어두워진 상황을 의미하는 ‘夜’로 번역할지 밤나무의 나무 열매를 뜻하는 ‘栗子’으로 번역할지 구분이 쉽지 않다. 하지만 인공신경망 번역에서는 문장 전체의 맥락을 이해해 ‘夜’와 ‘栗子’을 상황에 맞게 번역해준다.
 

나는 밤마다 밤을 먹는다.
[인공신경망 번역(적용 후)] 我每夜都吃栗子.
[통계기반 번역(적용 전)] 我每晚都夜吃.

 
중국어를 한국어로 번역하는 경우에도 인공신경망 번역이 통계기반 번역보다 번역 결과가 자연스럽고 부드러워진다.  이는 인공신경망 번역이 전체적 문맥을 파악해 가장 적합한 번역을 하고 이를 문법 규칙에 따라 재배열하기 때문이다.
 

他不相信我们告诉他的事是真的.
[인공신경망 번역(적용 후)] 그는 우리가 그에게 말한 것이 사실이라고 믿지 않는다.
[통계기반 번역(적용 전)] 그는 믿지 않는 일은 우리는 그에게 진짜다. 

 
네이버랩스는 현재 파파고에서 지원하는 한국어, 영어, 중국어(간체), 일본어 이외에 내년에는 스페인어, 프랑스어, 인도네시아어, 태국어, 중국어(번체), 베트남어 등 6개 언어 번역을 추가하는 한편 파파고에 적용된 인공신경망 번역 기술을 네이버 서비스 전반에 확대 적용할 계획이다. 

[김상헌 기자  ebiz@itnews.or.kr]