ETRI, 한국어 언어 모델 ‘AI 코버트’ 공개
동아일보
입력 2019-06-12 03:00 수정 2019-06-12 03:30
사람이 하는 말을 정확히 이해하고 적절한 대답을 찾도록 돕는 인공지능(AI)용 한국어 데이터베이스(언어모델)가 나왔다. 기존에 존재하던 구글의 한국어 모델보다 질의응답, 문장 내 개체 역할 인식 등 성능이 뛰어난 것으로 평가됐다.
한국전자통신연구원(ETRI)은 AI 서비스 개발을 위해 독자적으로 구축한 한국어 특화 딥러닝 언어모델 ‘코버트(KorBERT)’를 10일 홈페이지를 통해 공개했다고 11일 밝혔다. 언어모델은 AI가 언어를 학습할 수 있도록 구축한 일종의 데이터베이스다. 언어를 숫자로 표현한 뒤 AI 기술의 일종인 딥러닝을 이용해 학습한다. 이 과정에서 어떤 단어가 특정 조건에서 얼마나 많이, 자주 나타나는지를 확률로 계산해 언어와 함께 모았다. ETRI의 코버트는 최근 10년간의 신문기사와 백과사전 데이터를 추가로 학습시켜 학습량을 늘린 게 특징이다.
윤신영 동아사이언스 기자 ashilla@donga.com
한국전자통신연구원(ETRI)은 AI 서비스 개발을 위해 독자적으로 구축한 한국어 특화 딥러닝 언어모델 ‘코버트(KorBERT)’를 10일 홈페이지를 통해 공개했다고 11일 밝혔다. 언어모델은 AI가 언어를 학습할 수 있도록 구축한 일종의 데이터베이스다. 언어를 숫자로 표현한 뒤 AI 기술의 일종인 딥러닝을 이용해 학습한다. 이 과정에서 어떤 단어가 특정 조건에서 얼마나 많이, 자주 나타나는지를 확률로 계산해 언어와 함께 모았다. ETRI의 코버트는 최근 10년간의 신문기사와 백과사전 데이터를 추가로 학습시켜 학습량을 늘린 게 특징이다.
윤신영 동아사이언스 기자 ashilla@donga.com
비즈N 탑기사
- “도박자금 마련하려고”…시험장 화장실서 답안 건넨 전직 토익 강사
- 몸 속에 거즈 5개월 방치…괄약근 수술 의사 입건
- 일본 여행시 섭취 주의…이 제품 먹고 26명 입원
- “1인 안 받는 이유 있었네”…식탁 위 2만원 놓고 간 손님 ‘훈훈’
- 10만원짜리 사탕?…쓰레기통까지 뒤져 찾아간 커플
- 꿀로 위장한 고농축 대마 오일…밀수범 2명 구속 송치
- 송지아·윤후, 머리 맞대고 다정 셀카…‘아빠! 어디가?’ 꼬마들 맞아? 폭풍 성장
- 한소희 올린 ‘칼 든 강아지’ 개 주인 등판…“유기견이 슈퍼스타 됐다” 자랑
- 딱 한 장만 산 복권이 1등 당첨…20년간 월 700만원
- 기존 크림빵보다 6.6배 큰 ‘크림대빵’ 인기
- 담배 1갑당 5원 ‘연초부담금’ 사라진다…타당성 낮은 부담금 폐지
- “강북 상업지역 3배로 확대… 신도시급 개발”
- “쓸만한 콘텐츠 없네” GPT스토어 두달만에 시들
- 봄, 꽃그늘 아래로 걸어볼까…관광공사 4월 추천 여행지
- 갈수록 넘쳐나는 거품… 오비맥주 한맥, ‘크림 거품’ 생맥주로 승부수
- “아이폰 판매 감소, 경쟁 심화에도…애플, 中서 2배 성장 가능”
- “집값 떨어진 김에 자식에게”…서울 아파트 증여 늘었다
- 가성비 좋고 재미까지… 고물가 속 ‘빅사이즈 먹거리’ 뜬다
- “상생금융, 효과적 브랜딩이자 마케팅… 고객 어려움 돌봐야”
- 팀 쿡 “중국서 연내 비전프로 출시”