‘이루다’ 개발사 “데이터베이스·딥러닝 대화 모델 폐기 결정” : 비즈N

‘이루다’ 개발사 “데이터베이스·딥러닝 대화 모델 폐기 결정”

뉴스1

입력 2021-01-15 11:40 수정 2021-01-15 11:41

댓글보기

폰트

뉴스듣기

기사공유 |

인공지능(AI) 챗봇 이루다. 성희롱 및 장애인·성소수자 혐오발언에 이어 개인정보 취급·처리가 부적절했다는 논란에 휩싸이며 출시 3주만인 지난 12일 서비스를 잠정 중단했다. © 뉴스1

개인정보 취급·처리가 부적절했다는 논란에 휩싸인 인공지능(AI) 챗봇 ‘이루다’ 개발사가 이루다의 데이터베이스(DB) 및 이루다의 학습에 사용된 딥러닝 대화 모델을 폐기하기로 했다.

스캐터랩은 15일 “자사는 현재 개인정보보호위원회와 한국인터넷진흥원(KISA)의 조사를 받고 있으며 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행한다는 방침”이라고 밝혔다.

이어 “기존 ‘연애의 과학’과 ‘텍스트앳’에서 이용자의 동의를 받고 수집됐던 기존 데이터는 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 이용자의 데이터를 모두 삭제할 예정이며 이는 향후 딥러닝 대화 모델에도 이용되지 않는다”고 덧붙였다.

그러면서 “관련 후속 조치는 각 애플리케이션(앱) 공지를 통해 안내받을 수 있으며 향후 신규 가입 및 서비스 이용시에는 개인정보 수집과 이용 동의 절차를 강화할 계획”이라고 했다.

회사는 “이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 포함돼 있지 않다. 또 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고 AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다”면서도 “이용자들의 불안감을 고려해 이번 폐기를 결정했다”고 했다.

이루다는 스캐터랩이 연애의 과학 이용자들로부터 수집한 카카오톡 대화 내용 100억건에서 비식별화 과정을 거친 1억개의 문장을 말했다.

이용자들은 스캐터랩이 이용자들의 연인 간 사적 대화 내용을 제대로 된 고지 없이 수집·활용했고, 이루다를 통해 공개된 이 개인정보가 제대로 익명화(비식별화)되지 않았다며 데이터 전량 폐기를 주장해왔다.

스캐터랩은 실명을 포함한 민감정보가 그대로 노출된 카카오톡 대화 내용 1700건을 오픈소스 플랫폼에 15개월 동안 공유했다는 사실에 대해서도 인정하고 사과한 바 있다.

이루다는 성희롱 및 장애인·성소수자 혐오발언에 이어 개인정보 취급·처리가 부적절했다는 논란에 휩싸이며 출시 3주만인 지난 12일 서비스를 잠정 중단했다.

(서울=뉴스1)