말로 가전 제어하고 검색-주문하는 시대… 원거리 음성인식 기술 뜨거운 경쟁
김재희 기자
입력 2018-06-01 03:00 수정 2018-06-01 03:00
거실 어디서든, 다 알아듣네
LG전자는 지난달 3일 선보인 프리미엄 스마트폰 ‘G7 ThinQ(씽큐)’에 스마트폰 중 처음으로 최대 5m 밖에서도 사람의 목소리를 알아듣는 원거리 음성인식 기능을 탑재했다. 이 기술은 LG전자 공항로봇과 에어컨, 냉장고 등 원거리에서 음성으로 제어되는 제품에만 탑재됐다. 이를 스마트폰에도 적용하면서 스마트폰이 AI 스피커 역할을 할 수 있는 가능성을 열었다.
G7 씽큐에는 이미 다양한 AI 기능이 탑재된 상태다. LG전자의 모든 가전이 자동으로 스마트폰과 연동돼 음성으로 제어가 가능한 ‘Q링크’ 기능이 G7 씽큐부터 탑재됐다. 스마트폰이 먼 곳에 있을 때도 가전을 음성으로 제어할 수 있다. LG전자 관계자는 “LG전자 자체 음성인식 기능인 ‘Q보이스’에 ‘스피커폰으로 전화 받아줘’ 등 스마트폰이 멀리 있을 때 활용 가능한 음성명령어도 추가되고 있다”고 설명했다.
원거리 음성인식률을 높이는 딥러닝 알고리즘도 탑재했다. 이 알고리즘은 두 번에 걸쳐 주변 소음을 제거하고 말하는 사람의 목소리만 강화한다. 멀리서 수집된 소리 데이터를 확보하기 위해 LG전자 세탁기, 에어컨 등이 확보한 원거리 음성 데이터를 활용했다. 이 데이터에 스마트폰 사용 환경에서 나올 수 있는 TV 소리, 차량 소음 등 다양한 잡음을 가상으로 넣어 음성과 잡음을 구분할 수 있는 알고리즘을 만든 것이다.
장석복 LG전자 인공지능연구소 책임연구원은 “스마트폰 사용자로부터 원거리 데이터를 수집해 학습하려면 시간이 걸린다. 다른 가전제품에서 얻은 데이터를 토대로 최적의 음성인식 모델을 만들어 이를 스마트폰에 적용할 수 있었다”고 말했다.
삼성전자는 집안 가전 제어와 검색, 주문 명령어 수행의 허브로 냉장고, 에어컨을 주목하고 있다. 냉장고, 에어컨 등 생활가전에 원거리 음성인식이 가능한 고감도 마이크와 원거리 음성인식 기술을 탑재하고 있는 것이다.
AI 스피커를 주력 상품으로 내놓는 기업들에도 원거리 음성인식 기술은 주요 숙제다. 아마존은 원거리 음성인식률을 높이기 위해 AI 스피커 ‘에코’에 7개의 마이크를 넣었다. 마이크가 많이 탑재될수록 받아들이는 소리 정보의 양이 많기 때문이다. 목소리와 가장 가까운 마이크를 찾아 그 마이크의 소리를 확대하고 나머지 마이크로 들어오는 소리는 죽이는 ‘빔 포밍’ 기술도 적용했다. ‘기가지니’를 선보인 KT는 ‘시끄러운 환경 속 음성인식 기술’을 개발해 선보일 예정이다.
김재희 기자 jetti@donga.com
《 최근 전자업체들이 멀리서도 사람 목소리를 알아들을 수 있는 원거리 음성인식 기술 개발에 열을 올리고 있다. 멀리서 명령하면 음성인식률이 떨어지는 경향이 있기 때문이다. 요즘 음성으로 집안 가전제품을 제어하거나 검색, 주문까지 하길 원하는 소비자가 늘어난 데 따른 것이다. 인공지능(AI) 비서 역할을 하는 ‘허브(Hub)’를 무엇으로 삼는지에 따라 원거리 음성인식 기술을 탑재하는 제품군도 스마트폰, 생활가전 등으로 다양화하고 있다. 》
G7 씽큐에는 이미 다양한 AI 기능이 탑재된 상태다. LG전자의 모든 가전이 자동으로 스마트폰과 연동돼 음성으로 제어가 가능한 ‘Q링크’ 기능이 G7 씽큐부터 탑재됐다. 스마트폰이 먼 곳에 있을 때도 가전을 음성으로 제어할 수 있다. LG전자 관계자는 “LG전자 자체 음성인식 기능인 ‘Q보이스’에 ‘스피커폰으로 전화 받아줘’ 등 스마트폰이 멀리 있을 때 활용 가능한 음성명령어도 추가되고 있다”고 설명했다.
LG G7씽큐
G7 씽큐에 들어간 원거리 음성인식 기술의 핵심은 마이크, 그리고 원거리 음성인식 알고리즘이다. 마이크는 스마트폰 상단과 하단 두 곳에 탑재돼 있다. 보통 통화할 때는 입과 가까운 하단의 마이크가 음성 데이터를 받아들이고 상단 마이크는 주변 소음을 줄이는 보조 역할을 한다. G7 씽큐는 상단과 하단 마이크를 모두 이용해 소리 데이터를 더욱 풍성하게 받아들이도록 알고리즘을 설계했다.원거리 음성인식률을 높이는 딥러닝 알고리즘도 탑재했다. 이 알고리즘은 두 번에 걸쳐 주변 소음을 제거하고 말하는 사람의 목소리만 강화한다. 멀리서 수집된 소리 데이터를 확보하기 위해 LG전자 세탁기, 에어컨 등이 확보한 원거리 음성 데이터를 활용했다. 이 데이터에 스마트폰 사용 환경에서 나올 수 있는 TV 소리, 차량 소음 등 다양한 잡음을 가상으로 넣어 음성과 잡음을 구분할 수 있는 알고리즘을 만든 것이다.
장석복 LG전자 인공지능연구소 책임연구원은 “스마트폰 사용자로부터 원거리 데이터를 수집해 학습하려면 시간이 걸린다. 다른 가전제품에서 얻은 데이터를 토대로 최적의 음성인식 모델을 만들어 이를 스마트폰에 적용할 수 있었다”고 말했다.
삼성전자는 집안 가전 제어와 검색, 주문 명령어 수행의 허브로 냉장고, 에어컨을 주목하고 있다. 냉장고, 에어컨 등 생활가전에 원거리 음성인식이 가능한 고감도 마이크와 원거리 음성인식 기술을 탑재하고 있는 것이다.
AI 스피커를 주력 상품으로 내놓는 기업들에도 원거리 음성인식 기술은 주요 숙제다. 아마존은 원거리 음성인식률을 높이기 위해 AI 스피커 ‘에코’에 7개의 마이크를 넣었다. 마이크가 많이 탑재될수록 받아들이는 소리 정보의 양이 많기 때문이다. 목소리와 가장 가까운 마이크를 찾아 그 마이크의 소리를 확대하고 나머지 마이크로 들어오는 소리는 죽이는 ‘빔 포밍’ 기술도 적용했다. ‘기가지니’를 선보인 KT는 ‘시끄러운 환경 속 음성인식 기술’을 개발해 선보일 예정이다.
김재희 기자 jetti@donga.com
비즈N 탑기사
- 김숙 “내 건물서 거주+월세 수입 생활이 로망”
- “20억 받으면서 봉사라고?”…홍명보 감독 발언에 누리꾼 ‘부글’
- 세계적 유명 모델이 왜 삼성역·편의점에…“사랑해요 서울” 인증샷
- “사람 치아 나왔다” 5000원짜리 고기 월병 먹던 中여성 ‘경악’
- “모자로 안가려지네”…박보영, 청순한 미모로 힐링 여행
- 엄마 편의점 간 사이 ‘탕’…차에 둔 권총 만진 8살 사망
- 8시간 후 자수한 음주 뺑소니 가해자…한문철 “괘씸죄 적용해야”
- 교보생명, 광화문글판 가을편 새단장…윤동주 ‘자화상’
- 힐러리 “내가 못 깬 유리천장, 해리스가 깨뜨릴 것”
- ‘SNS 적극 활동’ 고현정…“너무 자주 올려 지겨우시실까봐 걱정”
- 보온성과 스타일을 한 번에… 올겨울 필드룩 추천
- 역사의 향취에 가슴 뭉클, 만발한 국화향에 마음 흠뻑
- 헝가리 와인의 재발견… 한국 음식에도 잘 어울려
- ‘이시바 쇼크’ 엔화 가치 석달만에 최저… ‘슈퍼 엔저’ 재연 가능성
- “회춘이 돈 된다”… ‘노화 늦추기’ 넘어 ‘세포 재탄생’ 본격 연구
- HUG 7000억 자본확충 제동… 전세보증 차질 우려
- 공공디자인으로 사회문제 해결-삶의 질 향상 ‘일석이조’
- “직장인 위로하려 했는데, 덕분에 퇴사했단 말에 가슴 철렁”
- 대출금리 올리더니…5대銀 예대차, 두 달 연속 확대
- 비혼에 급증하는 중·고령 1인가구…“‘생활동반자’ 인정해야”