9개 언어 알아듣고 문자로… 음성인식기 개발

전승민 동아사이언스 기자

입력 2017-04-19 03:00 수정 2017-04-19 03:00

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
“AI 딥러닝 활용 인식률 95%로 높여”… ETRI, 평창올림픽 통역서비스 추진

국내 연구진이 9개 언어를 알아듣고 자동으로 문자로 변환하는 ‘다국어 음성인식기술’ 개발에 성공했다. 자동 통역, 인공지능(AI) 비서, 실시간 영화 자막, 무인 콜센터 등 다양한 서비스 개발에 활용할 수 있는 원천기술이 될 것으로 보인다.

한국전자통신연구원(ETRI)은 김상훈 책임연구원 등 연구팀이 기존보다 성능을 한층 높인 새로운 ‘9개 언어 음성인식기’를 개발했다고 18일 밝혔다.

음성인식기술은 애플의 ‘시리’와 삼성의 ‘빅스비’ 같은 스마트폰 음성인식 서비스에 이미 쓰이고 있다. 하지만 인식률 90% 정도로는 사용하는 데 불편함이 크다. 이번에 개발한 기술은 인식률을 95%로 높여 오차를 한층 줄였다는 데 의미가 있다. 게다가 영어, 한국어, 일본어, 중국어, 프랑스어, 스페인어, 독일어, 러시아어, 아랍어까지 9개 언어를 지원한다. 일상적인 대화의 경우 인식기가 끊임없이 인식하면서 실시간 문자로 바꿔 준다. 연구진은 “한국어의 경우 구글 등 세계적인 업체의 음성인식기술보다 성능이 더 뛰어나고 다른 언어는 대등한 수준”이라고 설명했다.

연구진은 AI 기술의 하나인 ‘딥러닝’ 기법을 활용해 방대한 음성정보(빅데이터)를 자동 분석하는 방법으로 음성인식기술의 완성도를 높였다. 인터넷에 연결된 상태로 쓸 수 있는 ‘클라이언트 서버형’과 스마트폰 같은 휴대용 단말기에 설치할 수 있는 ‘탑재형’ 등 두 종류로 나누어 출시할 계획이다. 성능은 클라이언트 서버형이 더 뛰어나다. 탑재형은 인터넷 접속이 끊어진 곳에서도 간편하게 사용할 수 있는 장점이 있다.

ETRI는 이 기술을 기존의 자동통역 프로그램 ‘지니톡’에 적용해 시범서비스를 시작했다. 향후 평창 겨울올림픽 자동 통·번역 서비스 부문 공식 후원사인 한글과컴퓨터와 함께 올림픽 통역 서비스용으로도 개발할 예정이다. 2020년 도쿄 올림픽 개최까지 대상 언어를 14개로 확대하고 최종적으로 20개 이상 언어를 지원한다는 목표다.

전승민 동아사이언스 기자 enhanced@donga.com

라이프



모바일 버전 보기