얼굴 보정, 포토샵 말고 AI에 맡기세요
김민수 동아사이언스 기자
입력 2019-12-13 03:00 수정 2019-12-13 03:00
ETRI, 시각AI 핵심 알고리즘 개발… 얼굴사진 특화한 다양한 편집 가능
사람은 사물의 형태와 특성을 직관적으로 판단하지만 인공지능(AI)은 복잡한 학습 과정을 거쳐야 제 기능을 발휘할 수 있다. AI가 영상 속 이미지에서 특징을 찾아내 핵심 정보를 추출하고 이를 분석해 정답을 내놓으려면 수많은 데이터를 반복 학습해야 한다. 이 같은 AI 기술은 정지해 있는 사물이나 움직이는 물체를 행동을 빠르게 추적하고 판단해야 하는 자율주행차 등에 적용되는데 대부분 외국 기술에 의존하고 있다.
한국전자통신연구원(ETRI)은 인공지능연구소 시각지능연구실 연구진이 시각 AI 기술의 핵심 알고리즘을 개발했다고 12일 밝혔다. 시각 AI를 학습시키는 데 필요한 도심환경 사물 560종을 대상으로 사물인식 학습 데이터 20만 장도 함께 공개한다. ETRI가 공개한 알고리즘과 학습 데이터를 활용하면 원하는 서비스나 새로운 혁신적인 기능을 구현할 수 있어 국내 AI 산업에 든든한 인프라가 될 것으로 보인다.
이번에 개발한 시각 AI 알고리즘은 사진 속 물체의 특징을 찾아내 정보를 추출하고 분석하는 AI 기술로 ‘백본 네트워크(VoV Net)’을 통해 공개된다. AI 알고리즘을 개발자들과 쉽게 공유할 수 있는 웹사이트 ‘깃허브(Github)’에 코드와 사용설명서를 올리는 방식으로 공유한다. 연구진은 시각 AI 학습에 필요한 높은 품질의 사진 데이터도 함께 공개했다. 데이터에는 도심의 폐쇄회로(CC)TV에 찍히는 전봇대, 신호등, 자동차 등이 포함됐다.
박종열 ETRI 시각지능연구실장은 “백본 네트워크를 활용하면 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능을 구현할 수 있다”며 “공개한 학습 데이터도 단순히 임의의 사물로 구성된 데이터보다 시각 AI 구현과 학습에 더 효과적일 것”이라고 말했다.
연구진은 포토샵 같은 이미지 전문 편집 프로그램을 쓰지 않아도 사람의 얼굴 사진을 쉽고 자연스럽게 편집할 수 있는 AI 기술도 공개했다. 사진 속 인물이 하고 있지 않은 액세서리를 추가하거나 머리 모양, 표정까지도 간단한 작업으로 AI가 자동으로 편집해 주는 기술이다. 얼굴 사진에 특화한 다양한 편집이 가능한 알고리즘인 셈이다.
이 기술에는 딥러닝의 일종인 ‘갠(GAN)’ 기술이 활용됐다. 이 기술은 진짜 같은 가짜 데이터를 만들어내는 데 효과적이지만 사용자의 의도나 조건을 완벽하게 반영하지 못한다는 단점이 있었다. 연구진은 이 기술을 보완해 사용자가 원하는 최적의 결과를 낼 수 있도록 했다.
이 기술을 활용하려면 인물 사진과 사용자가 원하는 입력 값만 알고리즘에 넣으면 된다. 사용자가 원하는 조건에 적합하면서도 해당 사진 속 주변 환경에 자연스럽게 어울리는 이미지를 만들 수 있다. 박 실장은 “국내 시각 AI 기술이 급속도로 성장하고 있지만 외국 의존도가 높은 게 현실”이라며 “이번에 관련 기술을 공개해 국내 산학연이 시각 AI 기반 다양한 산업생태계를 조성할 수 있도록 적극 지원할 것”이라고 밝혔다.
김민수 동아사이언스 기자 reborn@donga.com
ETRI 연구팀이 개발한 ‘SC-FEGAN’ 기술을 이용해 액세서리를 착용하지 않았던 사진(왼쪽)을 귀고리 착용 사진(오른쪽)으로 바꿨다. 사람이 한 일은 간단한 스케치를 추가한 것뿐이다. ETRI 제공
사람은 사물의 형태와 특성을 직관적으로 판단하지만 인공지능(AI)은 복잡한 학습 과정을 거쳐야 제 기능을 발휘할 수 있다. AI가 영상 속 이미지에서 특징을 찾아내 핵심 정보를 추출하고 이를 분석해 정답을 내놓으려면 수많은 데이터를 반복 학습해야 한다. 이 같은 AI 기술은 정지해 있는 사물이나 움직이는 물체를 행동을 빠르게 추적하고 판단해야 하는 자율주행차 등에 적용되는데 대부분 외국 기술에 의존하고 있다.
한국전자통신연구원(ETRI)은 인공지능연구소 시각지능연구실 연구진이 시각 AI 기술의 핵심 알고리즘을 개발했다고 12일 밝혔다. 시각 AI를 학습시키는 데 필요한 도심환경 사물 560종을 대상으로 사물인식 학습 데이터 20만 장도 함께 공개한다. ETRI가 공개한 알고리즘과 학습 데이터를 활용하면 원하는 서비스나 새로운 혁신적인 기능을 구현할 수 있어 국내 AI 산업에 든든한 인프라가 될 것으로 보인다.
이번에 개발한 시각 AI 알고리즘은 사진 속 물체의 특징을 찾아내 정보를 추출하고 분석하는 AI 기술로 ‘백본 네트워크(VoV Net)’을 통해 공개된다. AI 알고리즘을 개발자들과 쉽게 공유할 수 있는 웹사이트 ‘깃허브(Github)’에 코드와 사용설명서를 올리는 방식으로 공유한다. 연구진은 시각 AI 학습에 필요한 높은 품질의 사진 데이터도 함께 공개했다. 데이터에는 도심의 폐쇄회로(CC)TV에 찍히는 전봇대, 신호등, 자동차 등이 포함됐다.
박종열 ETRI 시각지능연구실장은 “백본 네트워크를 활용하면 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능을 구현할 수 있다”며 “공개한 학습 데이터도 단순히 임의의 사물로 구성된 데이터보다 시각 AI 구현과 학습에 더 효과적일 것”이라고 말했다.
연구진은 포토샵 같은 이미지 전문 편집 프로그램을 쓰지 않아도 사람의 얼굴 사진을 쉽고 자연스럽게 편집할 수 있는 AI 기술도 공개했다. 사진 속 인물이 하고 있지 않은 액세서리를 추가하거나 머리 모양, 표정까지도 간단한 작업으로 AI가 자동으로 편집해 주는 기술이다. 얼굴 사진에 특화한 다양한 편집이 가능한 알고리즘인 셈이다.
이 기술에는 딥러닝의 일종인 ‘갠(GAN)’ 기술이 활용됐다. 이 기술은 진짜 같은 가짜 데이터를 만들어내는 데 효과적이지만 사용자의 의도나 조건을 완벽하게 반영하지 못한다는 단점이 있었다. 연구진은 이 기술을 보완해 사용자가 원하는 최적의 결과를 낼 수 있도록 했다.
이 기술을 활용하려면 인물 사진과 사용자가 원하는 입력 값만 알고리즘에 넣으면 된다. 사용자가 원하는 조건에 적합하면서도 해당 사진 속 주변 환경에 자연스럽게 어울리는 이미지를 만들 수 있다. 박 실장은 “국내 시각 AI 기술이 급속도로 성장하고 있지만 외국 의존도가 높은 게 현실”이라며 “이번에 관련 기술을 공개해 국내 산학연이 시각 AI 기반 다양한 산업생태계를 조성할 수 있도록 적극 지원할 것”이라고 밝혔다.
김민수 동아사이언스 기자 reborn@donga.com
비즈N 탑기사
- ‘투머치 토커’의 모자…민희진 폭주에 박찬호 소환 왜
- 백일 아기 비행기 좌석 테이블에 재워…“꿀팁” vs “위험”
- 최저임금 2만원 넘자 나타난 현상…‘원격 알바’ 등장
- “배우자에게 돈 보냈어요” 중고거래로 명품백 먹튀한 40대 벌금형
- 이렇게 63억 건물주 됐나…김지원, 명품 아닌 ‘꾀죄죄한’ 에코백 들어
- 상하이 100년간 3m 침식, 中도시 절반이 가라앉고 있다
- 김지훈, 할리우드 진출한다…아마존 ‘버터플라이’ 주연 합류
- “도박자금 마련하려고”…시험장 화장실서 답안 건넨 전직 토익 강사
- 몸 속에 거즈 5개월 방치…괄약근 수술 의사 입건
- 일본 여행시 섭취 주의…이 제품 먹고 26명 입원
- 한국에 8800억 투자 獨머크 “시장 주도 기업들 많아 매력적”
- 직장인 1000만명 이달 월급 확 준다…건보료 ‘20만원 폭탄’
- 1인 가구 공공임대 ‘면적 축소’ 논란…국토부 “면적 기준 폐지 등 전면 재검토”
- “만원으로 밥 먹기 어렵다”…평균 점심값 1만원 첫 돌파
- 고금리-경기침체에… 개인회생 두달새 2만2167건 역대 최다
- 美-중동 석유공룡도 뛰어든 플라스틱… 역대급 공급과잉 우려[딥다이브]
- 카드사 고위험업무 5년 초과 근무 못한다…여전업권 ‘내부통제 모범규준’ 시행
- 작년 서울 주택 인허가, 목표치 33% 그쳐… 2, 3년뒤 공급난 우려
- 은행연체율 4년9개월만에 최고… 새마을금고 ‘비상등’
- 작년 4대그룹 영업이익 24.5조, 66% 감소…현대차그룹만 늘어