메타, ‘라마3’ 공개…‘페북·인스타’에 들어간 AI 비서
뉴시스
입력 2024-04-19 15:30 수정 2024-04-19 15:31
'메타 AI' 페이스북·인스타그램·왓츠앱에 탑재
저커버그 "가장 지능적인 AI 비서"
메타가 최신 대규모 언어모델(LLM) ‘라마3(Llama 3)’ 기반의 인공지능(AI) 챗봇 ‘메타 AI’를 페이스북과 인스타그램, 왓츠앱에 탑재한다.
18일(현지시간) 미국 CNBC 방송과 파이낸셜타임스(FT) 등 현지 외신에 따르면 메타 AI는 자사 소셜미디어(SNS) 플랫폼 앱 검색창에 내장돼 사용자들이 무료로 질문하고 답을 구할 수 있다.
메타 AI 사용자들은 휴가 계획이나 레스토랑 추천 등의 도움을 받을 수 있다. 웹사이트 ‘meta.ai’에서는 수학 문제를 풀거나 전문적인 이메일을 작성하는 방법 등을 메타 AI에 물어볼 수 있다. 다만 이미지 생성 기능은 왓츠앱과 웹사이트에서 베타 버전만 제공된다.
현재 서비스 대상 국가는 미국과 캐나다, 뉴질랜드, 호주 등 영어권 12개국이다. 한국은 포함되지 않았다.
메타 AI의 기반이 되는 LLM ‘라마3’는 사전훈련과 미세조정을 마친 80억 개(8B)와 700억 개(70B) 매개변수 모델 두 가지로 공개됐다.
이 두 모델은 현재 동급의 오픈소스 모델 중 최고 수준의 성능인 것으로 평가받는다. ‘대규모 다중작업 언어이해(MMLU)’를 포함한 다양한 업계 표준 벤치마크에서 높은 성적을 받았으며 추론과 코드 생성, 지시 수행에 있어 전보다 성능이 크게 개선된 것으로 전해졌다.
라마3의 성능 향상은 모델의 사전 훈련과 사후 훈련 과정을 고도화함으로써 이뤄졌다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했다. 라마3는 15조 이상의 토큰으로 훈련됐으며, 이는 라마2 대비 7배 이상 많고, 코드량은 4배 더 많다.
또한 라마3의 사전 훈련에는 일상적인 질문부터 과학, 기술, 공학, 수학(STEM) 분야, 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용됐다. 이를 통해 모델이 보다 여러 영역에서 활용될 수 있도록 했다.
아울러 사전 훈련의 규모를 확대하고 보다 고도화된 ‘지시 미세조정’ 과정을 진행했다. 전문가와 자동화된 도구를 활용한 레드팀 훈련을 통해 부적절한 답변의 가능성도 최소화했다.
메타는 8B와 70B 매개변수 모델을 먼저 선보이며 연구원과 개발자의 피드백을 통해 지속 발전시켜나갈 방침이다. 현재 훈련 중인 더 큰 규모의 모델 역시 추후 오픈소스로 공개할 계획이다. 라마3를 더 긴 컨텍스트를 이해하는 다국어 멀티모달 모델로 발전시키고, 전반적인 성능을 지속 개선시키는 것이 궁극적인 목표다.
라마3 모델은 홈페이지에서 다운로드가 가능하며 AWS, 데이터브릭스, 구글 클라우드, 허깅페이스, IBM 왓슨x, 마이크로소프트 애저 등 다양한 플랫폼에도 공개될 예정이다. 하드웨어 측면에서는 AMD, AWS, 델, 인텔, 엔비디아와 퀄컴이 파트너로 함께한다.
마크 저커버그 메타 최고경영자(CEO)는 “메타 AI는 자유롭게 이용할 수 있는 가장 지능적인 AI 비서”라고 강조했다.
[서울=뉴시스]
저커버그 "가장 지능적인 AI 비서"
ⓒ뉴시스
메타가 최신 대규모 언어모델(LLM) ‘라마3(Llama 3)’ 기반의 인공지능(AI) 챗봇 ‘메타 AI’를 페이스북과 인스타그램, 왓츠앱에 탑재한다.
18일(현지시간) 미국 CNBC 방송과 파이낸셜타임스(FT) 등 현지 외신에 따르면 메타 AI는 자사 소셜미디어(SNS) 플랫폼 앱 검색창에 내장돼 사용자들이 무료로 질문하고 답을 구할 수 있다.
메타 AI 사용자들은 휴가 계획이나 레스토랑 추천 등의 도움을 받을 수 있다. 웹사이트 ‘meta.ai’에서는 수학 문제를 풀거나 전문적인 이메일을 작성하는 방법 등을 메타 AI에 물어볼 수 있다. 다만 이미지 생성 기능은 왓츠앱과 웹사이트에서 베타 버전만 제공된다.
현재 서비스 대상 국가는 미국과 캐나다, 뉴질랜드, 호주 등 영어권 12개국이다. 한국은 포함되지 않았다.
메타 AI의 기반이 되는 LLM ‘라마3’는 사전훈련과 미세조정을 마친 80억 개(8B)와 700억 개(70B) 매개변수 모델 두 가지로 공개됐다.
이 두 모델은 현재 동급의 오픈소스 모델 중 최고 수준의 성능인 것으로 평가받는다. ‘대규모 다중작업 언어이해(MMLU)’를 포함한 다양한 업계 표준 벤치마크에서 높은 성적을 받았으며 추론과 코드 생성, 지시 수행에 있어 전보다 성능이 크게 개선된 것으로 전해졌다.
라마3의 성능 향상은 모델의 사전 훈련과 사후 훈련 과정을 고도화함으로써 이뤄졌다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했다. 라마3는 15조 이상의 토큰으로 훈련됐으며, 이는 라마2 대비 7배 이상 많고, 코드량은 4배 더 많다.
또한 라마3의 사전 훈련에는 일상적인 질문부터 과학, 기술, 공학, 수학(STEM) 분야, 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용됐다. 이를 통해 모델이 보다 여러 영역에서 활용될 수 있도록 했다.
아울러 사전 훈련의 규모를 확대하고 보다 고도화된 ‘지시 미세조정’ 과정을 진행했다. 전문가와 자동화된 도구를 활용한 레드팀 훈련을 통해 부적절한 답변의 가능성도 최소화했다.
메타는 8B와 70B 매개변수 모델을 먼저 선보이며 연구원과 개발자의 피드백을 통해 지속 발전시켜나갈 방침이다. 현재 훈련 중인 더 큰 규모의 모델 역시 추후 오픈소스로 공개할 계획이다. 라마3를 더 긴 컨텍스트를 이해하는 다국어 멀티모달 모델로 발전시키고, 전반적인 성능을 지속 개선시키는 것이 궁극적인 목표다.
라마3 모델은 홈페이지에서 다운로드가 가능하며 AWS, 데이터브릭스, 구글 클라우드, 허깅페이스, IBM 왓슨x, 마이크로소프트 애저 등 다양한 플랫폼에도 공개될 예정이다. 하드웨어 측면에서는 AMD, AWS, 델, 인텔, 엔비디아와 퀄컴이 파트너로 함께한다.
마크 저커버그 메타 최고경영자(CEO)는 “메타 AI는 자유롭게 이용할 수 있는 가장 지능적인 AI 비서”라고 강조했다.
[서울=뉴시스]
비즈N 탑기사
- “여대 출신 채용 거른다” 커뮤니티 글 확산…사실이라면?
- “하루 3시간 일해도 월 600만원”…아이돌도 지원한 ‘이 직업’ 화제
- 중증장애인도 기초수급자도 당했다…건강식품 강매한 일당 법정에
- 고현정, 선물에 감격해 하트까지…믿기지 않는 초동안 미모
- 삶의 속도와 온도[정덕현의 그 영화 이 대사]〈33〉
- 수영, 역대급 탄탄 복근…슈퍼카 앞 늘씬 몸매 자랑까지
- ‘벽에 붙은 바나나’ 소더비 경매서 86억원 낙찰
- 범죄? 사고?…시흥 낚시터서 숨진채 발견된 40대 ‘미스터리’
- 도박현장서 압수한 현금 훔쳐 쓴 전직 경찰관 징역 2년
- 정차 중이던 차 들이박고도 직진…70대 여성 ‘운전미숙’ 추정
- 한국인 28살부터 33년간 흑자인생…43살 노동소득 4290만원 ‘정점’
- 서울 전세시장 숨 고르기…‘올파포’ 입주에 송파·강동 1억 ‘뚝’
- “예금자보호한도 확대에”…금융사 예보료 인상도 불가피
- 올해 종부세 대상 55만명·5조원 규모…12월16일까지 납부해야
- 눈가 주름=치매 조기 경고…많으면 최대 2.5배 더 위험
- 제주 ‘올해 최우수 공영관광지’ 어디일까?…“돌문화공원”
- “퇴근길에 대출상담 받으세요”… 저녁까지 문 여는 은행들
- “딸기 1kg 케이크부터 딸기 타워 빙수까지”… 겨울 딸기 맞이하는 업계
- 자체 칩-OS 탑재 화웨이, ‘스마트폰 굴기’ 시험대
- 종부세 대상 소폭 늘어난 55만명…1인당 평균 세액 145만원