읽는 재미의 발견

새로워진 한국일보로그인/회원가입

  • 관심과 취향에 맞게 내맘대로 메인 뉴스 설정
  • 구독한 콘텐츠는 마이페이지에서 한번에 모아보기
  • 속보, 단독은 물론 관심기사와 활동내역까지 알림
자세히보기
네이버 파파고, 이제 웹 페이지 통째로 번역해준다
알림

네이버 파파고, 이제 웹 페이지 통째로 번역해준다

입력
2018.04.27 17:01
0 0
네이버 파파고 제공
네이버 파파고 제공

네이버의 번역 서비스 ‘파파고’가 인공신경망번역(NMT) 기술을 활용해 27일부터 웹사이트 번역을 시작한다. 뿐만 아니라 올해 러시아어ㆍ독일어ㆍ이탈리아어ㆍ아랍어를 추가해 총 14개 언어 번역을 지원할 예정이다.

네이버는 27일 서울 강남구 D2스타트업팩토리에서 자사의 파파고 번역 엔진을 설명하는 기술 스터디를 열었다. 김준석 파파고 리더와 신중휘 테크리더가 이 자리에 참석해 파파고의 현재 상황과 기술 설명, 추후 서비스 업데이트 계획 등을 설명했다.

네이버가 새로 선보이는 NMT 기술은 단어나 구 단위로 번역해 품질이 떨어지던 기존 번역 체계와 다르게 문장 전체를 번역한다. 세상에 존재하는 많은 번역문을 미리 학습해 전체적인 맥락과 어순을 고려할 수 있게 된 것이다. 예를 들어 ‘밤(夜)에 밤(栗)을 먹었다’는 문장을 입력했을 때, 기존 번역기로는 두 ‘밤’의 차이를 인식하지 못하지만 파파고는 정확하게 구분해 번역해낼 수 있다. 김 리더는 “고성능 장비가 등장한 뒤 빅데이터와 딥러닝 기술을 활용해 문장 단위 번역이 가능해졌다”면서 “NMT 기술을 사용했을 때 이전에 비해 2배 이상의 번역 품질을 보여주고 있다”고 말했다.

물론 NMT 서비스도 항상 완벽한 것은 아니다. 기존 번역 예시를 기준으로 하다 보니, 의역된 문장이나 번역된 지 오래된 문장이 다수일 경우 대응성이 떨어지는 것이다. 예를 들어 ‘일본은 선진국이다’라는 일본어 문장을 우리나라에 발간한 만화책에서 ‘우리나라는 선진국이다’라고 번역했다면, 이를 학습한 파파고가 ‘일본’을 ‘한국’이라고 번역하는 중대한 오류를 저지를 수 있다. 또한 트럼프 미국 대통령처럼 호칭이 계속해서 바뀌는 경우도 오류가 생길 수 있다. 신 테크리더는 이에 대해 “기존 데이터를 빼는 게 아니라, 최근 데이터를 더 많이 학습시키는 방식으로 오류를 줄이려고 노력하고 있다”면서 “특히 독도 등 민족 문화적ㆍ정치적 이슈에 대해서는 선행적으로 대응하려고 한다”고 설명했다.

네이버 파파고 웹번역 실행 화면. 웹 페이지 주소만 넣으면 글씨체까지 그대로 번역을 해준다.
네이버 파파고 웹번역 실행 화면. 웹 페이지 주소만 넣으면 글씨체까지 그대로 번역을 해준다.

NMT 기술을 활용하는 파파고에서는 이제 웹 페이지 전체를 번역해준다. 파파고 홈페이지에서 번역하고 싶은 사이트 주소(URL)을 붙여 넣으면 된다. 신 테크리더는 “일반 문장보다 페이지 전체 번역이 어려운 이유는 웹페이지가 단순한 글의 나열으로 이루어진 것이 아니기 때문”이라고 밝혔다. 글 중간에 부분적으로 색깔ㆍ글씨체가 다르거나, 단어에 외부 링크가 걸려 있는 경우 문장 단위 번역이 오히려 걸림돌이 되기도 하는 것이다. 그러나 네이버는 서버 증설과 기술 개발로 이를 가능하게 했고, 앞으로 모바일과 앱 버전에서도 웹 번역을 지원할 예정이다.

파파고 팀은 6월 러시아 월드컵을 앞두고 5월 말쯤부터 러시아어 번역을 새로 선보인다. 이외에도 독일어 아랍어 등 총 4가지 언어를 연내 추가해 총 14가지 언어 번역을 지원할 예정이다. 김 리더는 “적어도 한국어 중심 번역에 있어서는 파파고의 번역 품질이 구글에 비해 뛰어난 것으로 평가하고 있다”면서 “앞으로 꾸준히 데이터를 늘려나가 세상의 변화에 실시간으로 대응할 수 있는 번역 서비스를 제공하겠다”고 밝혔다.

곽주현 기자 zooh@hankookilbo.com

기사 URL이 복사되었습니다.

세상을 보는 균형, 한국일보Copyright ⓒ Hankookilbo 신문 구독신청

LIVE ISSUE

기사 URL이 복사되었습니다.

댓글0

0 / 250
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.