국내 수학 특화 AI, 챗GPT보다 성능 우수
최지원 기자
입력 2024-01-09 03:00
업스테이지-KT-콴다 공동개발
수학 능력 테스트서 최고 점수
국내 인공지능(AI) 개발 기업인 업스테이지가 개발한 수학 특화 AI 서비스가 세계 신기록을 달성했다. 업스테이지는 8일 KT, 콴다와 공동 개발 중인 ‘매스(Math)GPT’(가칭)가 수학 능력 평가 테스트에서 오픈AI의 챗GPT, 마이크로소프트의 AI 모델을 제치고 가장 높은 성능을 기록했다고 밝혔다.
매스GPT는 약 130억 개의 매개변수를 이용하는 AI로, 수학 학습 플랫폼 기업인 콴다의 데이터를 활용해 학습했다. 그 결과 1만2500개의 고난도 수학 경시 문제로 구성된 ‘MATH’, 8500개의 초등학교 수학 문제로 산술 연산을 시험하는 ‘GSM8K’ 테스트에서 최고 성능을 보였다. 특히 MATH 테스트에서는 GPT-4를 능가하는 점수를 획득했다.
회사는 “매스GPT를 통해 교육 영역에서도 성과를 확인했다. 금융, 유통, 의료 등 다양한 산업군에서 생성형 AI 혁신을 주도할 것”이라고 했다.
최지원 기자 jwchoi@donga.com
수학 능력 테스트서 최고 점수
국내 인공지능(AI) 개발 기업인 업스테이지가 개발한 수학 특화 AI 서비스가 세계 신기록을 달성했다. 업스테이지는 8일 KT, 콴다와 공동 개발 중인 ‘매스(Math)GPT’(가칭)가 수학 능력 평가 테스트에서 오픈AI의 챗GPT, 마이크로소프트의 AI 모델을 제치고 가장 높은 성능을 기록했다고 밝혔다.
매스GPT는 약 130억 개의 매개변수를 이용하는 AI로, 수학 학습 플랫폼 기업인 콴다의 데이터를 활용해 학습했다. 그 결과 1만2500개의 고난도 수학 경시 문제로 구성된 ‘MATH’, 8500개의 초등학교 수학 문제로 산술 연산을 시험하는 ‘GSM8K’ 테스트에서 최고 성능을 보였다. 특히 MATH 테스트에서는 GPT-4를 능가하는 점수를 획득했다.
회사는 “매스GPT를 통해 교육 영역에서도 성과를 확인했다. 금융, 유통, 의료 등 다양한 산업군에서 생성형 AI 혁신을 주도할 것”이라고 했다.
최지원 기자 jwchoi@donga.com
비즈N 탑기사
‘책 출간’ 한동훈, 정계 복귀 움직임에 테마株 강세
조선 후기 화가 신명연 ‘화훼도 병풍’ 기념우표 발행
붕괴 교량과 동일·유사 공법 3곳 공사 전면 중지
명동 ‘위조 명품’ 판매 일당 덜미…SNS로 관광객 속였다
“나대는 것 같아 안올렸는데”…기안84 ‘100 챌린지’ 뭐길래- ‘전참시’ 이연희, 득녀 5개월만 복귀 일상…아침 산책+운동 루틴
- 국내 기술로 개발한 ‘한국형 잠수함’ 기념우표 발행
- ‘아파트 지하주차장서 음주운전’ 인천시의원 송치
- 학령인구 감소 탓에 도심지 초교마저 학급 편성 ‘비상’
- 상속인 행세하며 100억 원 갈취한 사기꾼 일당 붙잡혀
은값 폭등에 60% 수익 낸 개미, 익절 때 왔나…“○○ 해소 땐 급락 위험”
“기침 없는데 고열·오한”…옆구리 통증있다면 ‘이것’ 의심
대기업 일자리도 마른다… 작년 8만개 줄어 역대 최대 감소
다크 초콜릿서 ‘노화 늦추는’ 성분 발견…“많이 먹으란 얘긴 아냐”
‘위고비’ 맞자 술·담배 지출 줄었다…비만약, 생활습관 개선 효과- 영유아 위협하는 ‘RSV’ 입원환자 증가…증상 세심히 살펴야
- 수입물가 1년 7개월 만에 최대 상승…환율 급등 영향에 5개월 연속↑
- 美 3연속 금리 인하, 韓銀은 1월 동결 가능성
- 멜론-배민도 쿠팡처럼 ‘탈퇴 지옥’… 해지하려면 7단계 거쳐야
- “탈퇴도 심사받나” 쿠팡 와우회원 잔여기간 지나야 승인에 분통








