발번역은 이제 옛말, 똑똑해진 자동번역기술

TREND/트렌드 Pick!

(디자인 출처: In icons by microvector / Freepick)



영어번역이 귀찮아 인터넷 자동번역기를 사용했던 경험, 모두 한 번쯤은 있지 않을까요? 영하이라이터 역시 야후 바벨피쉬나 구글 번역을 이용했었지만, 엉터리로 번역될 때가 많아 사용을 꺼렸던 적이 있는데요. 당시 사람들은 번역기를 돌린 것 같다는 의미로 ‘발번역’이란 단어를 어투가 부자연스러운 사람을 비꼴 때, 사용하곤 했습니다. 하지만 이제 그 오명에서 벗어날 수 있을 것 같습니다. 구글, 네이버 등 글로벌 포털이  AI(Artificial Intelligence, 인공지능)를 적용함으로써 번역서비스 품질 향상을 위해 뜨거운 경쟁 중이기 때문입니다. AI 등장으로 번역 시장이 급격한 성장세를 맞이함으로써 다시 조명받고 있는 자동번역기술, 어떻게 똑똑해졌는지 알아보겠습니다. 




자동번역기술은 어떻게 번역할까



컴퓨터를 이용해 언어를 다른 나라 언어로 번역하는 개념은 1947년 미국의 수학자 워런 위버가 처음 제시했습니다. 당시 자동번역기술은 사전을 통해 각 단어에 알맞은 단어를 찾아 어순에 맞게 조금 바꿔주는 데 그쳤습니다. 그런데 1980년대에 들어 단어를 단순히 사전에 알맞게 바꿔 문장을 재구성하는 것을 넘어, 번역기가 언어 의미를 이해해야 한다는 인식이 퍼지면서 자동번역기술의 나아가야 할 방향이 새롭게 만들어집니다.


그렇다면 언어의 의미를 알기 위해서 번역기가 우선적으로 할 일은 무엇일까요? 컴퓨터는 주어진 문장을 형태소 단위로 쪼갭니다. 그다음 각 형태소에 알맞은 새로운 단어를 찾는 것이 첫 번째 일입니다. 이 과정의 걸림돌은 바로 동음이의어입니다. 예를 들면 ‘배’라는 단어는 타는 배와 먹는 배, 신체 일부인 배 등 한 단어 안에 완전히 다른 의미가 있는 단어입니다. 이 경우 명사는 각 뜻에 자주 쓰이는 동사나 형용사에 맞추어 유추할 수 있기에 각각 ‘타다’, ‘먹다’ 등 쉽게 연상되는 단어끼리 연결해 저장합니다. 하지만 ‘배가 작다’와 같은 문장은 먹는 배와 타는 배 중에 어떤 의미를 가지는지 쉽게 파악할 수가 없습니다. 또 동음이의어를 제외하더라도 한국어는 형태소 변화가 많이 일어나고 문장의 문법도 일관성을 보이지 않기 때문에 번역하기가 어려운 언어입니다. 


이렇게 오류가 자주 나는 기존 번역기는 SMT(Statistical Machine Translation, 통계 기반 기계번역)와 RBMT(Rule Based Machine Translation, 언어학적 규칙 기반 기계번역)를 사용했습니다. 한 문장에서 찾을 수 있는 여러 가지 의미 중 통계와 알고리즘을 기반으로 가장 적절하다 싶은 결과를 보여주는 기술입니다. 번역에 있어서 통계와 알고리즘만으로 복잡한 문제를 해결하기에는 한계가 있습니다. 단순히 통계자료 기반 통역을 넘어 언어 맥락을 이해하는 것이 번역 기술이 발전할 수 있는 방법입니다.
 


 

AI 기반한 NMT 자동번역기술은 어떻게 번역할까

 


2015년 말에 이르러 AI 기반의 NMT(Neural Machine Translation, 인공 신경망 기계번역)가 번역 시장에 뛰어듭니다. NMT 기술은 기존의 SMT 기술과 비교했을 때 완성도 높은 번역이 가능한 기술입니다. SMT 기술이 문장을 단어나 구문 단위로 쪼갰다면, NMT 기술은 문장을 통째로 번역할 수 있다는 점에서 차이를 보입니다. 그 덕분에 문장 안에서의 맥락을 컴퓨터가 온전히 알 수 있습니다.


알파고에 사용하던 머신러닝 기술도 NMT 기술에 적용됐습니다. 머신러닝기술은 컴퓨터가 주어진 데이터를 통해 스스로 학습하는 기술로 SMT와 RMBT 기술보다 더 적은 양의 데이터를 이용하면서 정확하고 자연스러운 번역을 가능하게 합니다. 버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 어느 인터뷰에서 “NMT 기술을 통해 번역오류도 최소 55%부터 최대 85%까지 감소했다”고 말했는데요. 머신러닝기술은 사례가 쌓여갈수록 더욱 발전하기 때문에 우리가 꿈꾸는 완벽한 번역은 이제 시간문제입니다. 그렇다면 우리가 쉽게 접할 수 있는 NMT 기술이 접목된 번역기는 어떤 것들이 있는지 알아볼까요?

 

 

하나세계 최강 번역기, 구글


  • ▲ 구글 번역기 애플리케이션과 사용화면

    (출처: 구글 공식 블로그)

  • ▲ 구글번역 사용 화면

    (출처: 구글번역기 사이트 캡처)

  • ▲ 구글번역의 한영번역 기능 

    (출처: 구글 번역기 사이트 캡처)

  • ▲ 구글번역의 영한번역 기능 

    (출처: 구글 번역기 사이트 캡처)

 

 

하루 5억여 명이 1000억 회 이상 이용하는 세계 최다 사용 번역기인 구글 번역은 2007년 서비스 시작 이후 번역 서비스 중에서 가장 방대한 데이터베이스를 가지고 있습니다. 지원 가능한 언어도 무려 100개 이상이라고 합니다. 또 번역된 문장이 영어로 어떻게 발음해야 하는지도 같이 제공된다는 점이 특징입니다. 


구글 번역을 통해 SK하이닉스를 소개하는 문구 ‘변화는 안으로부터, 안에서 밖을 만들다’를 번역해보니 한영번역에서 약간 오류가 있었지만, 영한번역은 완벽히 처리했습니다. 여러 스펙트럼 언어를 다루는 만큼 비영어권 국가로 여행을 떠날 때 유용할 거라고 생각합니다. 독보적인 구글 번역만의 연륜은 누구도 무시하지 못하겠죠.

 


한국어에 친화적인 번역기, 파파고


  • ▲ 파파고 애플리케이션과 사용 화면

    (출처: 파파고 유튜브 공식 소개 영상)

  • ▲ 파파고 사용 화면

    (출처: 파파고 사이트 캡처)

  • ▲ 파파고 사용 화면

    (출처: 파파고 사이트 캡처)

  • ▲ 파파고 사용 화면

    (출처: 파파고 사이트 캡처)

 

 

6개국 언어를 번역할 수 있는 파파고는 다른 통역 서비스에 비해 지원하는 언어가 적은 편이지만, 우리나라 기업에서 만든 번역기인 만큼 한국어 사용자에게 가장 알맞고 자연스러운 번역을 제공합니다. 번역으로 인해 한국어 특유의 맛깔스러움이 사라지는 점을 아쉬워하는 사람들에게 맞춤형 서비스라고 할 수 있습니다. 문맥을 통해 신조어, 유행어, 속담, 심지어는 사투리까지도 번역할 수 있다고 합니다. 


파파고 번역기를 사용해본 결과, 구글 번역에 비해 영한번역이 취약했으나, 한국어는 더 자연스러운 외국어로 바꿨습니다. 구어체에 특화된 번역기인 만큼 외국인 친구에게 가볍게 말을 걸거나 문자를 보낼 때, 유용합니다. 

 

 

평창이 선택한 번역기, 지니톡

 

 


2018 평창 동계올림픽의 공식 번역기, ‘한컴 말랑말랑 지니톡’은 파파고와 마찬가지로 한국어 기반 번역기로 9개 언어로 자동통변역을 할 수 있습니다. 앞선 두 기술과 마찬가지로 지니톡 역시 AI를 활용합니다. 하지만 다른 번역기와 차별화되는 점은 우수한 번역능력과 탁월한 음성인식 기능입니다. 음성인식에 특화된 번역기인 만큼 소음을 가려낼 수도 있고, 인식 정확도가 90% 이상인 등 완성도가 높은 번역기라고 할 수 있습니다. 


지니톡은 현재 모바일 환경에서만 서비스가 이루어지고 있어 애플리케이션을 내려받기해 사용해봤습니다. 의사소통을 중심으로 하는 번역 서비스인만큼 완벽한 문장이 아닌 경우엔 약간의 오류가 있었고, 한영번역보다 영한번역이 더 정확한 번역을 제공했습니다. 음성인식에 특화된 만큼 외국인과 실시간으로 대화할 일이 생길 때 지니톡 번역기를 사용하면 편리하겠네요.



 

_ 자동번역기술과 융합기술



앞서 AI를 기반을 둔 NMT 자동번역기술과 각 번역기의 장단점을 알아봤다면, 지금부터는 번역을 더 편리하게 할 수 있는 융합기술은 어떤 것들이 있는지 알아보겠습니다.  

 

 

하나증강현실과 번역기의 만남

 

▲ AR을 이용한 구글번역기

(출처 : 유튜브 구글번역기 소개 영상, 구글플레이 구글번역 홈페이지)



구글 번역과 파파고는 사진 속에 있는 문자를 텍스트화시켜 번역하는 서비스를 지원하고 있습니다. 스마트폰 보급률이 높아지고 카메라 기능도 더욱 상향되고 있는 만큼, 광학문자인식 기술을 이용한 자동번역기술은 활용도가 높아 우리 생활에 많은 도움을 줄 것 같네요. 거기에 AR(Augmented Reality, 증강현실)’과 기술까지 동원돼 카메라가 문자를 인지하면 다른 언어로 번역해 실시간으로 촬영 이미지에 덧붙여 AR 출력까지 가능합니다. AR이 접목된 번역 기술이 더 발전된다면 이제 더 이상 우리가 못 읽을 단어는 없겠죠? 아마도 영어로 적힌 전공 서적으로 끙끙댈 일은 없을 것 같네요.


 

자동번역과 음성인식의 만남 

 

▲ 유튜브에서의 자동자막기술

(출처: SK하이닉스 클린룸 소개 영상 캡처)

 

 

가끔씩 다른 나라의 영상을 보게 될 때 자막이 없어서 불편했던 적이 있지 않은가요? 유튜브는 자동번역기술과 음성인식기술을 이용한 ‘자동자막기술’을 지원하고 있습니다. 아직은 많이 부족하지만, 음성인식이 날이 갈수록 정교해지고 있습니다. 번역기술과 마찬가지로 음성인식기술 또한 통계시스템을 기반으로 하므로 더 많은 사람이 이용해야 더욱 발전할 수 있습니다. 애플 시리도 마찬가지죠. 처음 출시됐을 때보다 지금 우리 말을 잘 알아듣는 것도 그 때문입니다. 머지않아 우리가 언어의 장벽으로 이해할 수 없는 유튜브 영상은 점차 사라지게 될 것 같습니다.

 

  

번역을 넘어 통역으로


 


자동자막기술과 마찬가지로 실시간 통역기술 또한 음성인식을 바탕으로 개발되고 있습니다. 마이크로소프트의 스카이프는 화상통화를 통해 실시간 통역 기능을 구현해내는 데 성공했습니다. 상대방이 말을 하면 즉시 통역돼 자막창에 뜨게됩니다. 지금은 영어와 스페인어만을 지원하지만, 곧 다른 언어를 기반으로 한 통역도 지원한다고 합니다. 


구글도 실시간으로 활용할 수 있는 통역 서비스를 만들고 있습니다. 외국인과 일대일 대화를 할 때 사용할 수 있도록, 통역한 언어의 음성을 들려주는 기술을 개발하는 데 집중하고 있습니다. 이 기술이 성공적으로 개발된다면 이제 통역사가 없이도 다른 나라 사람과 자유롭게 대화를 할 수 있는 날이 멀지 않은 것 같습니다.




자동번역기술 시장은 NMT 기술 등장 이후로 기업 간에 더 나은 번역 서비스를 선보이기를 위한 열띤 경쟁을 펼치고 있습니다. 다양한 IT제품과 접목되고 업종간 융합도 활발히 이뤄지고 있는데요. 아직은 시적 표현이나 비언어적 커뮤니케이션, 사용자가 적은 언어를 번역할 때 나오는 부자연스러움을 해결해야 하는 과제가 남아있습니다. 자동번역기술이 언어 장벽을 뛰어넘어, 전 세계 사람들과 자유롭게 대화할 수 있는 세상이 기다려집니다.



유정목

저작자 표시 비영리 변경 금지
신고
< 공유하기
첫 댓글을 남겨보세요
1 ··· 3 4 5 6 7 8 9 10 11 ··· 1121


티스토리 툴바