말로 가전 제어하고 검색-주문하는 시대… 원거리 음성인식 기술 뜨거운 경쟁

김재희 기자

입력 2018-06-01 03:00 수정 2018-06-01 03:00

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
거실 어디서든, 다 알아듣네

《 최근 전자업체들이 멀리서도 사람 목소리를 알아들을 수 있는 원거리 음성인식 기술 개발에 열을 올리고 있다. 멀리서 명령하면 음성인식률이 떨어지는 경향이 있기 때문이다. 요즘 음성으로 집안 가전제품을 제어하거나 검색, 주문까지 하길 원하는 소비자가 늘어난 데 따른 것이다. 인공지능(AI) 비서 역할을 하는 ‘허브(Hub)’를 무엇으로 삼는지에 따라 원거리 음성인식 기술을 탑재하는 제품군도 스마트폰, 생활가전 등으로 다양화하고 있다. 》
 
LG전자는 지난달 3일 선보인 프리미엄 스마트폰 ‘G7 ThinQ(씽큐)’에 스마트폰 중 처음으로 최대 5m 밖에서도 사람의 목소리를 알아듣는 원거리 음성인식 기능을 탑재했다. 이 기술은 LG전자 공항로봇과 에어컨, 냉장고 등 원거리에서 음성으로 제어되는 제품에만 탑재됐다. 이를 스마트폰에도 적용하면서 스마트폰이 AI 스피커 역할을 할 수 있는 가능성을 열었다.

G7 씽큐에는 이미 다양한 AI 기능이 탑재된 상태다. LG전자의 모든 가전이 자동으로 스마트폰과 연동돼 음성으로 제어가 가능한 ‘Q링크’ 기능이 G7 씽큐부터 탑재됐다. 스마트폰이 먼 곳에 있을 때도 가전을 음성으로 제어할 수 있다. LG전자 관계자는 “LG전자 자체 음성인식 기능인 ‘Q보이스’에 ‘스피커폰으로 전화 받아줘’ 등 스마트폰이 멀리 있을 때 활용 가능한 음성명령어도 추가되고 있다”고 설명했다.

LG G7씽큐
G7 씽큐에 들어간 원거리 음성인식 기술의 핵심은 마이크, 그리고 원거리 음성인식 알고리즘이다. 마이크는 스마트폰 상단과 하단 두 곳에 탑재돼 있다. 보통 통화할 때는 입과 가까운 하단의 마이크가 음성 데이터를 받아들이고 상단 마이크는 주변 소음을 줄이는 보조 역할을 한다. G7 씽큐는 상단과 하단 마이크를 모두 이용해 소리 데이터를 더욱 풍성하게 받아들이도록 알고리즘을 설계했다.

원거리 음성인식률을 높이는 딥러닝 알고리즘도 탑재했다. 이 알고리즘은 두 번에 걸쳐 주변 소음을 제거하고 말하는 사람의 목소리만 강화한다. 멀리서 수집된 소리 데이터를 확보하기 위해 LG전자 세탁기, 에어컨 등이 확보한 원거리 음성 데이터를 활용했다. 이 데이터에 스마트폰 사용 환경에서 나올 수 있는 TV 소리, 차량 소음 등 다양한 잡음을 가상으로 넣어 음성과 잡음을 구분할 수 있는 알고리즘을 만든 것이다.

장석복 LG전자 인공지능연구소 책임연구원은 “스마트폰 사용자로부터 원거리 데이터를 수집해 학습하려면 시간이 걸린다. 다른 가전제품에서 얻은 데이터를 토대로 최적의 음성인식 모델을 만들어 이를 스마트폰에 적용할 수 있었다”고 말했다.

삼성전자는 집안 가전 제어와 검색, 주문 명령어 수행의 허브로 냉장고, 에어컨을 주목하고 있다. 냉장고, 에어컨 등 생활가전에 원거리 음성인식이 가능한 고감도 마이크와 원거리 음성인식 기술을 탑재하고 있는 것이다.

AI 스피커를 주력 상품으로 내놓는 기업들에도 원거리 음성인식 기술은 주요 숙제다. 아마존은 원거리 음성인식률을 높이기 위해 AI 스피커 ‘에코’에 7개의 마이크를 넣었다. 마이크가 많이 탑재될수록 받아들이는 소리 정보의 양이 많기 때문이다. 목소리와 가장 가까운 마이크를 찾아 그 마이크의 소리를 확대하고 나머지 마이크로 들어오는 소리는 죽이는 ‘빔 포밍’ 기술도 적용했다. ‘기가지니’를 선보인 KT는 ‘시끄러운 환경 속 음성인식 기술’을 개발해 선보일 예정이다.

김재희 기자 jetti@donga.com

라이프



모바일 버전 보기