아이폰서 안되는 ‘통화 녹음’, 이 앱 쓰면 된다 [신무경의 Let IT Go]

신무경 기자

입력 2020-08-31 12:00 수정 2020-08-31 16:57

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
AI 스타트업 아틀라스랩스 류석준 대표 인터뷰
일반적인 앱 녹음 아닌 ‘통신 서버’ 통한 녹음 방식
통신사에 자체 AI 라이선싱하며 음성인식 기술 발전
B2C 앱 스위치 성장성 덕에 40억 투자 유치까지


애플 아이폰 운영체제(iOS)는 통화 녹음 기능을 제공하지 않는 것으로 잘 알려져 있다. 기자도 아이폰을 사용한 적이 있었는데 전화 취재를 할 때 유용한 녹음 기능이 제공되지 않아 불편했던 기억이 있다. 취재원의 발언을 기억에 의존하면 기사화할 때 정확성이 떨어지는 경우가 이따금 있기 때문. 통화 녹음 기능은 필자를 포함해 많은 사람들을 안드로이드 폰으로 갈아타게 만든 이유 중 하나일 것이다.

애플이 2020년 세계개발자회의(WWDC)에서 통화 녹음 서비스를 탑재할 것이라는 소문이 돌았을 때 사람들은 열광했다. 애플은 매년 WWDC에서 새 iOS를 발표한다. 하지만 6월 열린 WWDC에서 이 같은 소문은 말 그대로 소문으로 그치고 말았다. 통화 녹음 기능을 기다리고 있던 많은 아이폰 유저들은 실망했을지도 모른다.

그런 아이폰 유저들에게 일말의 희망(?)의 빛을 보여주는 스타트업이 있다. 이달 13일 미래에셋벤처, TBT, SV인베스트먼트로부터 40억 원의 투자 유치를 받은 아틀라스랩스다. 아틀라스랩스는 아이폰 이용자들도 통화 내용을 녹음할 수 있도록 한 앱 ‘스위치’를 비공개 테스트(CBT) 중이다. 스위치는 통화 녹음뿐만 아니라 해당 통화 내역을 자동으로 문자 변환해 화면으로 보여준다. 연내 일반 유저들을 대상으로 한 아이폰용, 안드로이드폰용 앱을 선보인다. 애플이 보안상의 이유로 막아놓은 서비스를 어떻게 한국의 스타트업이 뚫었을까. 이날 서울 강남구 공유 오피스 패스트파이브에 입주해있는 아틀라스랩스 류석준 대표(36·사진)를 만나 물었다.




―애플이 통화 중 녹음을 제공하지 않는데 스위치는 어떻게 녹음이 가능한가.

기술적인 배경이 다르기 때문에 가능하다. 우리 기술은 애플에서 개인정보보호 정책상 막고 있는 앱을 통한 녹음 방식이 아니다. 대신 자체 보유한 통신 서버에서 녹음한다. 통신 서버를 운용하고자 별정통신사업자(이동통신 3사와 같은 기간통신사업자의 회선설비를 임차해 기간통신서비스, 전기통신서비스를 제공하는 업자)로 등록하기도 했다. 070으로 잘 알려진 인터넷전화(VoIP) 사업을 하고 있다고 이해하면 된다.

스위치를 내려받으면 이용자는 070으로 시작되는 인공지능(AI) 번호를 부여받게 된다. 이를 통해 전화를 하면 통신 서버에 음성이 암호화된 상태로 저장된다. 개인정보보호 이슈가 없도록 오디오 데이터를 암호화해 본인 외에는 식별할 수 없다. 그런 뒤 자체 음성인식 기술을 적용해 녹음된 음성을 텍스트로 변환한 뒤 이용자들에게 보여준다.

(인터넷 통신을 하려면 인터넷 주소, 즉 URL이 필요하다. URL을 입력하면 ‘도메인 네트워크 시스템(DNS) 서버’를 통해 상대방의 인터넷 주소(IP)를 획득해 해당 웹페이지를 보여준다. VoIP에서는 전화번호를 입력하면 ‘소프트스위치’라는 시스템을 통해 상대방의 IP 주소를 획득한 뒤 통화를 연결해준다. 아틀라스랩스는 이 소프트스위치 시스템단에서 녹음을 하고 있는 것이다.)

이는 그동안 KT DS와 같은 이통사 전산시스템을 구축해주는 기업과 기업 대 기업(B2B) 프로젝트를 진행하면서 음성인식 기술 노하우를 쌓은 덕분이기도 하다.




―스위치 앱은 어떻게 구현되나.

스위치 앱은 스마트폰을 구매하면 기본으로 설치되어 있는 전화(통화) 앱과 유사하다. 앞서 말했듯 스위치에 가입하면 이용자들은 070으로 시작되는 AI 번호를 부여받는다. 이용자 입장에서는 010으로 시작되는 본인의 전화번호를 포함해 두 개의 번호를 갖게 된다고 보면 된다. 사용자는 업무용 번호와 개인용 번호를 분리해 쓸 수 있기도 하다. 두 개 폰을 사용하는 사람들은 통신비용을 절약할 수도 있다.

스위치 앱을 통해 상대방에게 전화를 걸면, 즉 발신하면 통화 녹음이 시작된다. 반대로 상대방이 나의 010 번호로 전화를 걸어올 때, 즉 수신할 때에도 통화 녹음을 하고 싶으면 부여된 070 번호로 착신되도록 이통사에 착신전환부가서비스를 사전 신청 해둬야 한다.

통화가 종료되면 서로 음성으로 대화한 내역을 카톡 대화창처럼 보여준다. 현재 테스트 단계로 8000여 명의 이용자들이 활동하고 있다.



―스위치로 이용자들은 어떤 효용을 얻을 수 있을까.

실시간 음성 대화는 사람 간 커뮤니케이션 방식 중에서도 가장 효율적인 방법이다. 신종 코로나바이러스 감염증(코로나19)으로 원격근무가 활발해진 요즘 실시간 음성 대화의 중요성은 더욱 커지고 있다. 하지만 이메일이나 채팅과 달리 전화는 데이터로 기록되지 않고 검색이나 검토가 불가능해 많은 어려움이 있었다.

현재의 전화 업무를 생각해보자. 전화를 하며 메모하거나 녹음을 하는 등 추가적 노력이 필요하다. 그러다보니 이동 중이거나 외부에 있을 때 메모하기 어려워 불편하다. 녹음을 했다 해도 원하는 워딩을 찾기까지 모든 내용을 다 들어야해 시간이 오래 걸린다.

스위치는 이런 불편함을 해소해준다. 자동으로 통화를 녹음한 뒤 음성 인식 기술을 통해 바로 기록해준다. 이후 텍스트 검색으로 원하는 통화 내용을 바로 찾을 수 있다. 기록된 통화 내용은 연락처별로 관리할 수도 있다. 향후에는 일정 관리, 통화 내역 요약 등 전화로 고객을 관리하는 직업에 필수적인 앱이 되려한다.


―통신 서버를 통한 녹음 방식이라면 한국인들이 더 많이 쓰는 안드로이드폰 서비스로도 먼저 내놓을 수 있는데 아이폰을 택한 이유가 있나.

아이폰의 경우 통화 음질이 균질한 편이라 먼저 서비스를 출시했다. 반면 안드로이드폰은 제조사 등에 따라 통화 음질에 편차가 크다.




―본인의 커리어는 금융인데 어떻게 AI 사업을 하게 됐나.

1980년대 부모님이 미국으로 이민을 가서 사업을 했다. 어린 시절 할머니께서 아버지께 늘 했던 말씀이 있었다. ‘회사는 얼마나 성장 했나’ ‘몇 명이나 먹여 살리고 있나’ 등등. 그 과정에서 비즈니스라는 게 사업뿐만 아니라 사람과 사회를 잘 살게 만들어주는 것이라 이해했던 것 같다.

미 펜실베니아대에서는 경제학, 정치학을 공부했다. 자연히 경제를 어떻게 개선시킬 수 있는지 고민을 많이 하게 됐다. 경제를 발전시키는 방법으로 내린 나의 결론은 인구, 돈, 생산성 등 3가지를 개선하는 것이었다. 특히 요즘 같은 시대에 생산성을 늘리기 위해서는 기술이 필요하다고 생각했다.

첫 커리어는 UBS 투자은행에서 시작했다. 펜실베니아대 와튼스쿨 출신들은 금융 쪽에서 많이 일해 나도 멋모르고 들어갔다. 하지만 금융은 돈을 움직이는 것에 불과했고 무엇을 만드는 건 없었다. ‘금융에서 배운 것을 가지고 무언가를 만들 수 있는 건 없을까’ 고민하던 차에 투자펀드 버트럼 캐피탈로 자리를 옮겼다. 이 회사는 기업을 인수한 뒤 해당 업체를 위한 기술을 보강해주는 비즈니스 모델을 갖고 있었다. 신발과 옷을 만드는 회사를 인수했다면 여기에 웹사이트, 모바일 앱을 만들어주는 식이다. 여기서 일하며 ‘나는 투자보다 제품을 만드는 게 더 좋다’는 생각을 했다. 창업을 하고 싶었는데 마침 시드펀드를 운용하는 미들랜드 캐피탈에서 일할 기회가 있었다. 360억 원 가량의 자금의 투자펀드를 운용하며 투자처를 물색하고자 한국, 동남아 등을 많이 다녔다. 창업자들을 만나면서 직접 창업을 하고 싶다는 열망은 커졌다.

투자펀드를 마무리하고 로스앤젤레스(LA)에서 크라우드펀딩 스타트업을 했다. 생각보다 잘 안 됐다. 다음 사업을 고민하던 차, 한국에서 많은 변화가 일어나고 있음을 목격했다. 2015년 당시 대기업이 주도하던 경제가 바뀌어 가고 있었고, 빡빡한 업무 문화들도 개선되고 있었다. 이용자들이 쓰는 앱 등에서도 제품 노하우가 쌓여가고 있었다.

나아가 2016년 구글 딥마인드의 알파고와 이세돌 9단의 대국이 있으면서 AI에 대한 관심이 급증하기 시작했다. 기계가 알아서 배우는 머신러닝이 사람들의 생산성을 얼마나 빨리 개선할 수 있을지 관심이 높아진 것이다. 개인적으로는 ‘기계에게 사람의 언어를 가르쳐주면 엄청나게 사회의 생산성을 높일 수 있겠구나’ 하는 생각을 갖게 만드는 시기였다.


―음성인식 기술은 어떻게 확보했나.

많은 음성인식 스타트업들이 한국전자통신연구원(ETRI)에서 기술 이전을 받는다. 우리는 다르다. 음성인식 분야에서 세계적으로 잘 알려진 오픈소스(무료로 개방된 소프트웨어) 프로젝트 ‘칼디’를 활용한다. 애플 시리, 아마존 알렉사 등은 칼디를 기반으로 엔진을 만들었다. 우리는 2017년 칼디를 기반으로 한 첫 한국어 칼디 엔진을 만들었다. 우리가 B2B 시장에서 조금 더 빨리 성장할 수 있었던 이유는 칼디를 빠르게 학습했기 때문이라 말할 수 있다.



―투자 유치 현황은.

2015년 11월 최초로 엔젤투자를 받은 뒤 2017년에도 한 번 엔젤투자를 받았다. 이 자금을 기반으로 음성인식 기술을 개발해왔다. 동시에 대기업과 프로젝트를 진행하며 개발한 기술을 라이선싱해 매출을 벌었다. 이렇게 올해 손익분기점(BEP)을 맞추려고 했다. 이런 상황에서 B2C 시장에서의 가능성을 엿봤다. 이왕이면 카피캣을 물리치고 마케팅을 통해 새로운 시장을 빠르게 개척해나가고 싶었다. 이를 위해서는 자금이 필요했다. 이번 40억 원 투자유치는 그 일환이다. 투자유치는 3년 간 사업을 함께 해온 핵심 엔지니어링팀의 역량을 인정받은 덕분이다.



―해외 시장 진출 계획은.

최초의 시작은 미국에서 했다. 미국에서 원격근무를 하던 개발자도 있었다. 한국 시장에 집중하면서 한국에 핵심 인력들이 다 있게 됐다. 인력만 25명이다. 스위치 서비스 준비는 거의 다 됐다. 다음 시장은 일본으로 보고 있다. 향후 미국에서도 사업을 진행할 생각이다.

신무경 기자 yes@donga.com

라이프



모바일 버전 보기