성서에 재미있는 이야기가 나옵니다. 노아의 홍수 이후 오만한 인간들이 신의 힘을 넘보기 위해 하늘로 향하는 거대한 탑을 건설하는데, 그것이 바로 바벨탑입니다. 모두 같은 언어를 사용하는 것이 주효했다고 합니다. 의사소통이 빠르니 모두들 일치단결하여 '으쌰, 으쌰' 열심히 탑을 건설했다고 해요. (근면성실의 대가이자 한강의 기적 주역인 한민족이 분명히 그 당시에도 산업역군의 일원으로 큰 역할을 했으리라 조심스럽게 추측해봅니다)

 

그렇게 바벨탑은 하늘을 향해 나아가고, 하느님은 이에 불안을 느껴 인간의 언어를 마구 뒤섞어 버렸다고 합니다. 갑자기 말이 통하지 않으니 얼마나 충격이 컸을까요. 결국 바벨탑 공사는 중지되었고 인간들은 세계 곳곳에 흩어졌다고 합니다. 그렇다면 세계 곳곳으로 흩어진 인간들은 어떤 운명을 맞이했을까요?

모두들 나름 행복했겠지만 명암은 분명히 갈렸습니다. 누구는 영어를 사용하며 21세기 지구촌의 맹주로 군림하고 있으며, 누구는 영어 하나 배우겠다고 어학연수다, 사교육이다 천문학적인 돈을 끌어다 바치고 있으니까요.

하지만 바로 지금, 다시 한 번 바벨탑이 건설되려고 합니다. 15일(현지시각) 구글 번역팀은 자사 블로그를 통해 ‘신경망 기계번역’(Neural Machine Translation)’을 통해 총 8개 언어에 대한 번역 서비스에 적용한다고 밝혔습니다. 놀랍게도 한국어도 여기에 포함되었습니다.

신경만 기계번역은 문장을 통째로 번역하는 방식입니다. 즉 단어를 떼어내어 의미를 맞추는 것이 아니라 맥락을 파악할 수 있다는 뜻입니다. 한 번 써보겠습니다.

구글 번역기를 통해 구글 블로그 내용 일부를 해석하겠습니다. 마침 구글 블로그에 구글포토에 대한 내용이 있습니다. 첫 문장을 구글 번연기에 넣어보겠습니다.

▲ 출처=구글

내용은 [Google Photos is a home for all your photos and videos, but what about those old prints that are some of your most treasured memories? Such as photos of grandma when she was young, your childhood pet, and that hairstyle you wish you could forget. We all have those old albums and boxes of photos, but we don’t take the time to digitize them because it’s just too hard to get it right. We don’t want to mail away our original copy, buying a scanner is costly and time consuming, and if you try to take a photo of a photo, you end up with crooked edges and glare.] 입니다.

먼저 구글 번역기의 해석을 볼까요. [Google 포토는 모든 사진과 동영상의 집이지만 가장 소중한 추억의 일부인 오래된 인쇄물은 어떻습니까? 할머니가 어렸을 때의 할머니 사진, 어린 시절의 애완 동물, 그리고 그 헤어 스타일을 잊어 버리 셨으면합니다. 우리 모두는 그 오래된 앨범과 사진 상자를 갖고 있지만, 디지털화하기에는 너무 시간이 걸리기 때문에 시간을 들이지 않아도됩니다. 우리는 원본 사진을 멀리 보내고 싶지 않습니다. 스캐너를 구입하는 것은 많은 비용과 시간을 필요로 하며 사진의 사진을 찍으려고하면 구부러진 가장자리와 눈부심이 생깁니다.]로 나옵니다.

▲ 출처=구글 번역기

오, 대단합니다. 지금까지의 구글 번역이 약 40% 수준의 이해도를 보장했다면, 현재의 구글 번역기는 평문의 경우 90% 수준의 이해도까지 진출한 느낌입니다. 읽기에 어색함이 느껴지지 않아요. 주어와 서술의 관계도 제대로 잡혀있고 무엇보다 자연스러운 문장의 연결이 눈길을 끕니다.

물론 [우리는 원본 사진을 멀리 보내고 싶지 않습니다]라는 표현이나 [사진의 사진을 찍으려고하면 구부러진 가장자리와 눈부심이 생깁니다]는 약간 이상하지만요.

그렇다면 토종의 자존심. 파파고를 통해 기술 생태계를 창출하려는 네이버 랩스의 실력을 한 번 살펴보겠습니다. 그런데 이런. 네이버 랩스는 최대 300자만 지원이 됩니다. 그래서 [Google Photos is a home for all your photos and videos, but what about those old prints that are some of your most treasured memories?] 부분만 해석하겠습니다.

▲ 출처=네이버랩스

이런 결과가 나왔네요. 네이버랩스는 [구글 번역기는 당신의 모든 사진과 비디오를 위한 집이지만, 당신의 가장 소중한 추억들 중 일부는 어떤가요?]입니다. 그냥 봐도 구글 번역기의 승리입니다. 구글포토를 왜 구글 번역기라고 인지하는지 모르겠네요. 주어와 서술 관계에 있어서도 구글 번역기가 앞서고 있습니다.

▲ 출처=구글

자, 그렇다면 다른 글을 한 번 보겠습니다. 구글어스에 대한 내용이 있네요. [The world has so many beautiful and amazing places to visit. If we're lucky, we're able to travel and see a few of them. But even the most active travelers can only see a fraction. What if we could see them all? Ten years ago, Google Earth began as an effort to help people everywhere explore our planet. And now, with more than two billion downloads, many have. Today, we are introducing Google Earth VR as our next step to help the world see the world. With Earth VR, you can fly over a city, stand at the top of the highest peaks, and even soar into space.] 이라는 글입니다.

구글 번역기는 [세상은 너무나 아름답고 놀랍도록 많은 곳을 방문합니다. 우리가 운이 좋으면 여행 할 수 있고 그들 중 몇 개를 볼 수 있습니다. 그러나 가장 활동적인 여행자조차도 일부만 볼 수 있습니다. 우리가 그들을 모두 볼 수 있다면 어떨까요? 10 년 전, Google 어스는 모든 사람들이 지구를 탐험 할 수 있도록 돕기 위해 시작되었습니다. 그리고 지금은 20 억 건이 넘는 다운로드로 많은 사람들이 다운로드 할 수 있습니다. 오늘 전 세계가 세계를 구경 할 수있는 다음 단계로 Google 어스 VR을 소개합니다. Earth VR을 사용하면 도시를 날고 가장 높은 봉우리 꼭대기에 서서 우주로 날아갈 수 있습니다]로 봤습니다.

▲ 출처=구글 번역기

네이버랩스는? 300자 제한에 걸리니 초반만 보면 [The world has so many beautiful and amazing places to visit. If we're lucky, we're able to travel and see a few of them. But even the most active travelers can only see a fraction]를 [세계는 방문하기에 너무나 많은 아름다운 장소들과 멋진 장소들을 가지고 있습니다. 우리가 운이 좋다면, 우리는 여행을 할 수 있고 몇가지를 볼 수 있습니다. 하지만 가장 활동적인 여행객들조차 극히 일부만 볼 수 있다]로 했습니다.

▲ 출처=네이버랩스

자, 2가지 글을 번역하며 알 수 있는 것은...구글 번역기의 경우 일단 주술관계가 다른 한글과 영어에 있어 한글번역이 상당히 좋아졌으나, 아직 눈에 거슬리는 대목은 있다는 점입니다. [세상은 너무나 아름답고 놀랍도록 많은 곳을 방문합니다]라는 지점은 어색해요. 네이버랩스의 [세계는 방문하기에 너무나 많은 아름다운 장소들과 멋진 장소들을 가지고 있습니다]라는 해석이 더 잘 읽힙니다.

간단히 살펴보았습니다. 그렇다면 한글에서 영어로 해석하는 것은 어떨까요? [비선실세 최순실 논란과 관련해 박근혜 대통령의 퇴진을 요구하는 백만개의 촛불이 타올랐다]는 글을 구글 번역기에 돌리면 [A million candles were demanded for President Park's resignation in connection with the controversy over Choi Sun-sil]로 나옵니다. 비선실세 등의 표현이 다소 묘하지만 일단 의미는 받아들여집니다. 그러나 한글어를 영어로 하는 것보다 영어를 한국어로 돌리는 것이 더 나아 보입니다.

짧은 체험기를 마치며, 이런 생각이 듭니다. 구글 번역기가 통번역가의 일자리를 빼앗는 것이 아닐까? 미래에는 그럴 수 있겠지만 당장은 어려울 것 같습니다. [galaxy s7 edge]의 경우 우리는 스마트폰 브랜드라는 것을 알 수 있지요. 하지만 구글 번역기는 [갤럭시 S7 가장자리]라고 해석합니다. 틀린 말은 아닙니다. [은하수 S7 가장자리]라고 하지 않는 것이 어디입니까. 그래도 완벽한 통번역의 수준은 당연히 아니죠.

▲ 출처=구글 번역기

이 부분은 맥락을 이해하는 기능에서 벗어나, 언어의 문화적 관습과 사회적 인식을 완벽하게 체화해야 처리할 수 있는 영역입니다. 즐 구글의 신경망 기계번역이 어순이 다른 언어들의 빠른 맥락처리를 가능하게 만들지만, '문화와 습관의 약속'에 있어서는 갈 길이 멀다는 뜻입니다. 물론 이 것도 정말 대단한 일이니까요.

종합하자면 이제부터 영어해석을 할 때, 구글 번역기를 사용하세요. 하지만 100% 믿지는 말고 맥락이 풀어낸 의미들을 사회문화적 차원에서 한 번 검수하면 됩니다. 이렇게 되면 나름의 효과를 누릴 수 있을 것으로 보입니다. 아, 몇 번 돌려보니 한글에서 영어보다는, 영어에서 한글로 넘기는 것이 더욱 좋습니다. 한글을 일본어로 돌려 다시 영어로 옮기면 약간 나아지더군요. 일각에서는 대만어로 한 번 바꾸라는 말도 나오는 데, 솔직히 효능은 잘 모르겠습니다.

참고로 비속어는 잘 나오지 않습니다. 스크린 샷을 첨부할 수 없는 점 양해를...더불어 아직 군데군데 번역이 되지 않으면 자기 마음대로 생략되니까 그것도 주의하시기 바랍니다.

마지막으로, 구글 번역기와 네이버랩스가 비교되는데...네이버랩스는 아직 베타입니다. 그리고 네이버는 춘천 데이터 센터 각에 방대한 한글 정보를 모아둔 최강의 보물창고집단이에요. 조만간 구글 번역기를 뛰어넘을 수 있는 더욱 강력한 앵무새를 기대합니다. 경쟁해주세요. 우리를 위하여. 감사합니다.

▲ 출처=네이버랩스