‘┐H새끼’, ‘GR하는’ 변형 욕설까지 걸러낸다…KISO 자동 필터링시스템 공개

뉴시스

입력 2023-06-19 18:09 수정 2023-06-19 18:09

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
한국인터넷자율정책기구, 욕설·비속어 자동 탐지·치환해주는 서비스 공개
네이버·카카오 60만 욕설 DB 무상 공여



온라인 플랫폼에 올라온 게시물과 댓글 등 욕설·비속어가 자동으로 필터링되는 시스템이 개발됐다. 전통적인 욕설 뿐만 아니라 특수문자가 포함된 변형 욕설도 탐지가 가능한 것이 특징이다.

한국인터넷자율정책기구(KISO)는 욕설·비속어를 자동으로 탐지·치환해주는 KISO 이용자보호시스템을 19일 정식 공개했다.

이 서비스는 다양한 온라인 플랫폼에서 이용자가 작성한 게시물과 댓글 등에 욕설·비속어가 포함돼 있으면 데이터 분석을 통해 자동으로 탐지하고, 치환이 필요한 단어를 실시간으로 알려주는 응용프로그램 인터페이스(API) 서비스이다.

KSS는 국내 주요 포털인 네이버와 카카오가 수집한 약 60만 건의 방대한 욕설 데이터베이스(DB)를 바탕으로 개발됐다. 네이버와 카카오는 사회적 책임(ESG) 활동의 일환으로 수년간 축적한 DB를 KISO에 무상으로 공여하면서 사회적 활용을 요청했다.

KSS는 데이터 분석을 통해 욕설 여부를 판단하며 DB에 포함된 단어의 경우 변형 욕설도 탐지가 가능하도록 설계됐다. 60만 건의 DB에는 다양한 형태의 변형 욕설·비속어도 포함돼 ‘┐H새끼, GR하는, 등1신’ 등과 같은 특수문자, 숫자 등이 포함된 혼합 형태의 단어들도 치환할 수 있다.

포털 회원사의 지속적인 DB 제공으로 최신의 상태로 업데이트해 신종 욕설·비속어에도 대응할 수 있다. 이용하는 기업은 KISO의 기술적 보호조치를 활용함으로써 비윤리적 표현 등 부적절한 단어를 걸러내지 못해 발생하는 이용자 불만에 공동으로 대응할 수 있다.

방대한 DB를 최신으로 유지하고 이용하는 데 드는 비용이 직접 유사 서비스를 개발하고 유지하는 것과 비교해 상대적으로 저렴하다는 것이 장점이다. 기존에도 욕설을 필터링해주는 시스템은 있었지만 중소 규모 인터넷 사업자는 자체적으로 DB를 만들고 유지 관리하는 데 많은 비용이 들어 어려움을 겪었다.

KISO는 깨끗한 온라인 환경을 조성하기 위해 독자적인 필터링 개발 여력이 없는 기업과 공공기관 등에 무상으로 배포할 방침이다.

지난해 12월부터 올해 5월 말까지 약 6개월간 진행된 KSS 베타테스트에서는 약 1080만 건의 게시글에서 16만 건의 욕설·비속어를 걸러냈다. 해당 베타테스트에는 공공기관을 비롯해 인공지능(AI), 온라인 커뮤니티, 패션, 부동산, 금융 등 다양한 온라인 플랫폼 운영 업체 47곳이 참여했다.

KISO 관계자는 “대형 포털이 오랜 기간 고객 응대를 하며 수집해 온 방대한 DB를 다양한 인터넷 서비스에 쉽게 활용할 수 있도록 개발했다”며 “KSS를 이용하면 사업자가 자체적으로 필터할 단어 리스트를 만들고 유지하는 수고를 덜 수 있고 평판도 개선될 것”이라고 말했다.

[서울=뉴시스]

라이프



모바일 버전 보기