“AI 경쟁, 합성데이터가 게임체인저” [더 퓨처스]

김선미 기자

입력 2022-09-30 03:00 수정 2022-09-30 03:44

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
‘씨앤에이아이’ 이원섭 대표

21일 서울 서초구 ‘씨앤에이아이’ 사무실에서 이 회사 이원섭 대표가 환하게 웃고 있다. 안철민 기자 acm08@donga.com

깊은 밤 당신은 지방 국도를 운전하고 있다. 갑자기 천둥 번개를 동반한 폭우가 쏟아지더니 야생 고라니가 도로로 뛰어든다. 이토록 운전하기에 위험천만한 상황은 현실에서 다양한 형태로 벌어질 수 있다. 폭우가 폭설이 될 수도, 고라니가 토끼가 될 수도 있다.

테슬라, 엔비디아 등 글로벌 빅테크들은 인공지능(AI)을 요즘 새로운 방법으로 학습시키고 있다. 실제 이미지를 얻으려면 시간과 비용이 많이 들지만 고라니를 토끼로 바꿔 넣는 식의 합성 데이터를 만들면 무궁무진한 ‘경우의 수’를 통해 미래를 대비할 수 있기 때문이다. MIT 테크놀로지 리뷰는 미래를 이끌 ‘2022년 10대 기술’ 중 하나로 AI를 위한 합성 데이터를 꼽았다. 국내에서는 2019년 설립된 AI 합성데이터 스타트업 ‘씨앤에이아이(CN.AI)’가 이 시장에 도전하고 있다. 이 회사 이원섭 대표(36)를 만났다.

―어떻게 AI 시장에 눈을 떴나.

“미국 인디애나대 경제학과 졸업을 앞두고 있던 2013년, 당시 삼성전자의 SCSA(삼성 컨버전스 소프트웨어 아카데미) 채용 소식을 접했다. 인문계 졸업생을 뽑아 융합형 소프트웨어 엔지니어로 키우는 제도였다. ‘기술에 정통한 인문계 출신’이 되면 나만의 미래를 만들 수 있을 것 같아 도전했다. 삼성전자 소프트웨어 개발자로 일하며 AI를 접했다.”

―삼성전자를 나와 창업했는데….

“삼성전자의 사내외 벤처육성 프로그램인 C랩에서 AI 관련 과제를 수행하다가 ‘AI로 내 사업을 하면 승산이 있겠다’는 확신이 들었다. 원본 이미지와 영상에서 사람이나 사물을 지운 뒤 배경을 채워 복원하는 ‘이미지 인페인팅’ 기술을 개발했다.”


―그런 합성 데이터 기술을 개발한 계기는….


“AI의 성능은 ‘좋은’ 데이터를 ‘많이’ 확보해야 높일 수 있는데, 대기업조차 데이터를 다 사 모으려면 ROI(투자자본수익률)가 안 나온다. 개인정보 보호 이슈가 커져 데이터 확보가 점점 어려워진다. 합성 데이터는 기존의 판도를 뒤엎는 ‘게임 체인저’가 될 것이다.”

시장조사 회사 가트너는 2026년에 합성 데이터 활용이 실제 데이터를 추월할 것으로 본다. 2030년 시장 규모가 86억 달러(약 12조 원)에 달한다는 전망(그랜드뷰 리서치)도 있다.

―합성 데이터는 어떻게 쓰이나.

“의료, 금융, 제조 등 다양한 분야에서 활용되고 있다. 예를 들어 위암을 진단하는 AI 엔진이 약 95%의 정확도를 보이려면 수십만 장의 위암 환자 내시경 이미지가 필요하지만 합성 데이터를 활용하면 수만 장이면 된다.”

―그래도 합성 데이터는 ‘가짜’ 아닌가.

“지난해 나이지리아의 데이터 사이언스 연구팀은 아프리카 옷에 대한 데이터가 서양에 비해 절대적으로 부족한 사실에 주목해 가상의 아프리카 옷 이미지들을 AI로 만들어냈다. 합성 데이터는 현실의 데이터 불균형과 편견을 해결해주는 미래지향적 기술이다.”

―CN.AI의 차별적 경쟁력은….

“어려운 문제에 도전하는 수준 높은 46명의 인재들이다. 최근엔 개발자들의 요청에 따라 사옥 1층에 피아노를 두고 원하는 때에 칠 수 있도록 했다. 사람이 행복하게 일해야 AI가 상용화하는 미래를 꿈꿀 수 있다.”


―꿈꾸는 미래를 위해 어떤 준비를 하고 있나.


“지금이 우리보다 앞선 나라들을 따라잡을 수 있는 골든타임이다. 경쟁력 있는 K콘텐츠가 글로벌 미디어 시장에 선보일 때 합성 데이터와 만나면 파괴적인 힘을 낼 수 있다. 그걸 준비하고 있다.”


김선미 기자 kimsunmi@donga.com

라이프