‘┐H새끼’, ‘GR하는’ 변형 욕설까지 걸러낸다…KISO 자동 필터링시스템 공개
뉴시스
입력 2023-06-19 18:09 수정 2023-06-19 18:09
한국인터넷자율정책기구, 욕설·비속어 자동 탐지·치환해주는 서비스 공개
네이버·카카오 60만 욕설 DB 무상 공여
온라인 플랫폼에 올라온 게시물과 댓글 등 욕설·비속어가 자동으로 필터링되는 시스템이 개발됐다. 전통적인 욕설 뿐만 아니라 특수문자가 포함된 변형 욕설도 탐지가 가능한 것이 특징이다.
한국인터넷자율정책기구(KISO)는 욕설·비속어를 자동으로 탐지·치환해주는 KISO 이용자보호시스템을 19일 정식 공개했다.
이 서비스는 다양한 온라인 플랫폼에서 이용자가 작성한 게시물과 댓글 등에 욕설·비속어가 포함돼 있으면 데이터 분석을 통해 자동으로 탐지하고, 치환이 필요한 단어를 실시간으로 알려주는 응용프로그램 인터페이스(API) 서비스이다.
KSS는 국내 주요 포털인 네이버와 카카오가 수집한 약 60만 건의 방대한 욕설 데이터베이스(DB)를 바탕으로 개발됐다. 네이버와 카카오는 사회적 책임(ESG) 활동의 일환으로 수년간 축적한 DB를 KISO에 무상으로 공여하면서 사회적 활용을 요청했다.
KSS는 데이터 분석을 통해 욕설 여부를 판단하며 DB에 포함된 단어의 경우 변형 욕설도 탐지가 가능하도록 설계됐다. 60만 건의 DB에는 다양한 형태의 변형 욕설·비속어도 포함돼 ‘┐H새끼, GR하는, 등1신’ 등과 같은 특수문자, 숫자 등이 포함된 혼합 형태의 단어들도 치환할 수 있다.
포털 회원사의 지속적인 DB 제공으로 최신의 상태로 업데이트해 신종 욕설·비속어에도 대응할 수 있다. 이용하는 기업은 KISO의 기술적 보호조치를 활용함으로써 비윤리적 표현 등 부적절한 단어를 걸러내지 못해 발생하는 이용자 불만에 공동으로 대응할 수 있다.
방대한 DB를 최신으로 유지하고 이용하는 데 드는 비용이 직접 유사 서비스를 개발하고 유지하는 것과 비교해 상대적으로 저렴하다는 것이 장점이다. 기존에도 욕설을 필터링해주는 시스템은 있었지만 중소 규모 인터넷 사업자는 자체적으로 DB를 만들고 유지 관리하는 데 많은 비용이 들어 어려움을 겪었다.
KISO는 깨끗한 온라인 환경을 조성하기 위해 독자적인 필터링 개발 여력이 없는 기업과 공공기관 등에 무상으로 배포할 방침이다.
지난해 12월부터 올해 5월 말까지 약 6개월간 진행된 KSS 베타테스트에서는 약 1080만 건의 게시글에서 16만 건의 욕설·비속어를 걸러냈다. 해당 베타테스트에는 공공기관을 비롯해 인공지능(AI), 온라인 커뮤니티, 패션, 부동산, 금융 등 다양한 온라인 플랫폼 운영 업체 47곳이 참여했다.
KISO 관계자는 “대형 포털이 오랜 기간 고객 응대를 하며 수집해 온 방대한 DB를 다양한 인터넷 서비스에 쉽게 활용할 수 있도록 개발했다”며 “KSS를 이용하면 사업자가 자체적으로 필터할 단어 리스트를 만들고 유지하는 수고를 덜 수 있고 평판도 개선될 것”이라고 말했다.
[서울=뉴시스]
네이버·카카오 60만 욕설 DB 무상 공여
온라인 플랫폼에 올라온 게시물과 댓글 등 욕설·비속어가 자동으로 필터링되는 시스템이 개발됐다. 전통적인 욕설 뿐만 아니라 특수문자가 포함된 변형 욕설도 탐지가 가능한 것이 특징이다.
한국인터넷자율정책기구(KISO)는 욕설·비속어를 자동으로 탐지·치환해주는 KISO 이용자보호시스템을 19일 정식 공개했다.
이 서비스는 다양한 온라인 플랫폼에서 이용자가 작성한 게시물과 댓글 등에 욕설·비속어가 포함돼 있으면 데이터 분석을 통해 자동으로 탐지하고, 치환이 필요한 단어를 실시간으로 알려주는 응용프로그램 인터페이스(API) 서비스이다.
KSS는 국내 주요 포털인 네이버와 카카오가 수집한 약 60만 건의 방대한 욕설 데이터베이스(DB)를 바탕으로 개발됐다. 네이버와 카카오는 사회적 책임(ESG) 활동의 일환으로 수년간 축적한 DB를 KISO에 무상으로 공여하면서 사회적 활용을 요청했다.
KSS는 데이터 분석을 통해 욕설 여부를 판단하며 DB에 포함된 단어의 경우 변형 욕설도 탐지가 가능하도록 설계됐다. 60만 건의 DB에는 다양한 형태의 변형 욕설·비속어도 포함돼 ‘┐H새끼, GR하는, 등1신’ 등과 같은 특수문자, 숫자 등이 포함된 혼합 형태의 단어들도 치환할 수 있다.
포털 회원사의 지속적인 DB 제공으로 최신의 상태로 업데이트해 신종 욕설·비속어에도 대응할 수 있다. 이용하는 기업은 KISO의 기술적 보호조치를 활용함으로써 비윤리적 표현 등 부적절한 단어를 걸러내지 못해 발생하는 이용자 불만에 공동으로 대응할 수 있다.
방대한 DB를 최신으로 유지하고 이용하는 데 드는 비용이 직접 유사 서비스를 개발하고 유지하는 것과 비교해 상대적으로 저렴하다는 것이 장점이다. 기존에도 욕설을 필터링해주는 시스템은 있었지만 중소 규모 인터넷 사업자는 자체적으로 DB를 만들고 유지 관리하는 데 많은 비용이 들어 어려움을 겪었다.
KISO는 깨끗한 온라인 환경을 조성하기 위해 독자적인 필터링 개발 여력이 없는 기업과 공공기관 등에 무상으로 배포할 방침이다.
지난해 12월부터 올해 5월 말까지 약 6개월간 진행된 KSS 베타테스트에서는 약 1080만 건의 게시글에서 16만 건의 욕설·비속어를 걸러냈다. 해당 베타테스트에는 공공기관을 비롯해 인공지능(AI), 온라인 커뮤니티, 패션, 부동산, 금융 등 다양한 온라인 플랫폼 운영 업체 47곳이 참여했다.
KISO 관계자는 “대형 포털이 오랜 기간 고객 응대를 하며 수집해 온 방대한 DB를 다양한 인터넷 서비스에 쉽게 활용할 수 있도록 개발했다”며 “KSS를 이용하면 사업자가 자체적으로 필터할 단어 리스트를 만들고 유지하는 수고를 덜 수 있고 평판도 개선될 것”이라고 말했다.
[서울=뉴시스]
비즈N 탑기사
- 송강호 “‘기생충’ 이후 성적? 결과 아쉽더라도 주목적은 아냐”
- ‘건강 이상설’ 박봄, 달라진 분위기…갸름해진 얼굴선
- 주원 “20㎏ 산소통 매고 마주한 큰불…극도의 긴장감 느꼈다”
- “여대 출신 채용 거른다” 커뮤니티 글 확산…사실이라면?
- “하루 3시간 일해도 월 600만원”…아이돌도 지원한 ‘이 직업’ 화제
- 중증장애인도 기초수급자도 당했다…건강식품 강매한 일당 법정에
- 고현정, 선물에 감격해 하트까지…믿기지 않는 초동안 미모
- 삶의 속도와 온도[정덕현의 그 영화 이 대사]〈33〉
- 수영, 역대급 탄탄 복근…슈퍼카 앞 늘씬 몸매 자랑까지
- ‘벽에 붙은 바나나’ 소더비 경매서 86억원 낙찰
- “급성골수성백혈병(AML) 정복 초읽기”… 한미약품 항암 신약, 내성 생긴 AML 환자 ‘완전관해’
- 이건희, ‘S급 천재’ 강조했는데…이재용 시대 “인재 부족”
- 추억의 모토로라, 보급형폰 ‘엣지 50 퓨전’ 韓 출시…“0원폰 지원 가능”
- 해외직구 겨울 인기상품 17%는 안전 기준 ‘부적합’
- 월 525만5000원 벌어 397만5000원 지출…가구 흑자 사상최대
- 저축은행 3분기 누적 순손실 3636억…“전분기 대비 손실 감소”
- 중견기업 10곳 중 7곳 “상속세 최고세율 30%보다 낮춰야”
- ‘117년 만의 폭설’ 유통업계 배송 지연 속출…“미배송·불편 최소화 노력”
- ‘깜짝 금리 인하` 한은 “보호무역 강화에 수출·성장 약화”
- 경강선 KTX 개통…서울-강릉 반나절 생활권 열렸다