문장으로 이해하는 번역 가능해져AI기반 신경망 기계 번역 방식 덕분백수를 숫자 100으로 인식하는 등오역도 여전해 개선 노력 필요할 것
출시 10년째를 맞이한 ‘구글 번역’은 현재 전세계 5억명이 사용하는 구글의 대표 서비스다. 103개 언어를 지원하고 있으며 매월 10억건 이상의 번역 요청을 처리한다.
29일 구글은 신경망 기계번역(NMT)을 적용한 구글 번역을 소개하는 자리를 마련했다. 이 기술은 지난 16일 전세계에 서비스 되고 있는 구글 번역에 적용됐다.
◇자연스러운 번역 가능···문장으로 이해한다
구글 번역은 웹과 모바일 앱에서 이용할 수 있다. 모바일 앱의 경우 텍스트를 직접 입력하는 방식 외에도 사진을 찍어 원하는 부분을 번역하거나 음성 인식 번역도 가능하다.
음성으로 “가장 가까운 버스 정류장이 어디입니까”라고 입력하자 “Where is the nearest bus stop”이라고 번역했다. 이외에도 간단한 문장은 대체로 완벽하게 번역했다. 음성 인식률도 좋은 편이다. “괜찮다” “훑어보다” 등의 발음도 문제없이 인식 됐다. 번역된 문장도 읽어주기 때문에 더욱 편리하다.
아직 한국어는 적용되지 않았지만 ‘워드 렌즈’ 기능도 유용하다. 번역하고 싶은 언어를 카메라로 인식하면 영어로 변환해 주는 기능이다.
예를 들어 중국 여행 중에 무슨 뜻인지 알 수 없는 경고 문구를 보게 됐을 때 ‘워드 렌즈’ 기능을 이용하면 영어로 바로 번역할 수 있다. 영어로 번역된 문장을 다시 한국어로 번역할 수 있다.
단어 번역은 정확하지만 문장이 어색하거나 문법에 맞지 않는 번역 결과가 나타나는 문제도 어느 정도 해결됐다.
이전에는 구문 기반 기계번역(PBMT)은 문장을 어구나 단어로 쪼개 개별 번역하는 방식이었지만 AI 기술 기반인 신경망 기계 번역 도입을 통해 문장 단위 번역이 가능해졌기 때문이다.
신경망 기계 번역 기술은 데이터를 통해 스스로 학습하게 돼 있다. 해당 언어와의 관련성을 배우면서 번역의 정확성을 높이는 방식이다. 전체 문맥 파악이 가능하고 적합한 단어를 찾은 뒤 문법 규칙에 따라 인간이 말하는 문장처럼 번역한다.
이날 오후 2시30분 발표된 박근혜 대통령 3차 담화문 전문도 매끄럽게 번역됐다. 영한 번역은 어떨지 마르크스 ‘자본론’의 일부를 번역 해봤다. 반말과 존댓말의 구분이 명확하지 않았지만 전체 의미를 비교적 자연스럽게 번역했다.
◇‘백수’가 숫자 ‘100’?···아직 완벽하지 않아
이전과 비교해 구글 번역의 기능이 고도화 된 것은 사실이지만 아직 부족한 모습도 보였다. 같은 문장을 반복해서 입력했는데 각각 다른 문장이 번역돼 나왔다. 번역 결과를 보고 적합한 문장을 이용자가 골라야 한다는 뜻이다.
또 존댓말과 반말의 구분이나 젊은 층이 쓰는 특정 언어, 동음이의어에 대한 처리는 부족해 보였다. 특히 이중의미를 가진 단어 번역도 좀 더 정교해질 필요가 있어 보인다. “직장을 잃어서 백수가 되었다”라고 입력하자 ‘백수’를 숫자 ‘100’으로 인식해 번역하는 오류를 보였다. “날 말리지 마”라고 입력하자 처음에는 “Don’t leave me”라고 번역했다가 다음에는 “Do not make me dry”라고 번역했다.
구글은 완벽한 번역을 자신하고 있지만 ‘감성’을 담은 번역이 가능할지도 의문이다. 문학이나 명언, 시 등의 감정이 담긴 문장들을 그 의미와 함께 번역할 수 있는지가 문제다.
구글은 구글 번역의 궁극적인 목표는 “언어의 장벽을 없애는 것”이라고 밝혔다. 신경망 기계번역 기술 덕분에 구글 번역 오류는 55~85%가량 현저히 감소했다고 자신했다. 하지만 궁극적인 언어장벽을 없애기 위해서는 지금 눈에 보이는 문제들부터 해결해야 할 것이다.

뉴스웨이 한재희 기자
han324@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지
댓글