KT, 인공지능 스피커에 특정인 목소리 합성

신동진 기자

입력 2018-05-23 03:00 수정 2018-05-23 03:00

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
첫 상용화… 억양 등 학습

KT가 인공지능(AI) 스피커에 특정 인물의 목소리를 합성할 수 있는 ‘개인화 음성합성 기술(P-TTS)’을 상용화했다고 22일 밝혔다. 국내에서 AI 스피커에 P-TTS를 상용화한 것은 이번이 처음이다.

P-TTS는 딥러닝 기술을 이용해 며칠간 수집한 음성 데이터만으로 특정 인물의 목소리를 합성하는 기술이다.

단순히 문장을 발음하는 수준을 넘어 개인별 발화 습관이나 억양까지 학습해 사람처럼 자연스럽게 말할 수 있다. 이전에도 연예인 목소리를 합성한 사례는 있었지만 대상 문장이 제한적이거나 음성 합성 후 데이터를 정제하는 후처리 과정이 필요했다. 이번에 상용화한 기술은 어떤 문장도 1초 내로 합성할 수 있고 후처리도 필요하지 않다.

KT는 기가지니에 박명수 목소리를 적용한 ‘박명수를 이겨라’ 퀴즈 게임을 25일부터 시작한다. 기가지니에 “지니야, 박명수를 이겨라”라고 말하면 박명수 목소리로 시사상식, 수도 맞히기 등 매일 새로운 퀴즈를 풀 수 있는 게임이다.

김채희 KT AI사업단장(상무)은 “앞으로 기가지니에 동화책을 읽어 달라고 명령하면 부모 목소리로 책을 읽어 주는 서비스도 마련할 계획”이라고 말했다.

신동진 기자 shine@donga.com


라이프



모바일 버전 보기