엔비디아 최신 AI 칩 ‘블랙웰’, 발열 문제 불거져

전남혁 기자

입력 2024-11-18 17:06 수정 2024-11-18 17:09

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
엔비디아의 최신 인공지능(AI) 반도체 ‘블랙웰’이 과열 문제에 직면했다는 보도가 나왔다. 앞서 결함으로 양산이 지연된 이후 재차 성능 문제가 불거진 것이다.

17일(현지시간) 미 정보기술(IT) 전문매체 디인포메이션 등에 따르면 엔비디아는 블랙웰 칩을 서버 랙에 연결했을 때 과열 문제가 발생해 랙 공급업체에게 수차례 설계 변경을 요구한 것으로 알려졌다. AI 구동을 위해선 여러 개의 그래픽처리장치(GPU), 중앙처리장치(CPU)를 한데 묶은 완성용 서버가 필요하다. 이를 서버 랙이라 한다. 엔비디아는 3월 72개의 블랙웰 GPU를 탑재한 ‘GB200 NVL72’를 공개한 바 있다.

이렇게 완성된 ‘냉장고만한’ 랙의 무게는 1.5 t(톤)에 이르고, 자연스레 높은 전력과 발열 문제를 일으킨다. 블랙웰은 이전 세대 GPU에 비해 쉽게 열이 오르는데, 이 발열 문제를 잡기 위해 블랙웰을 연결한 랙 설계에 어려움을 겪고 있는 것으로 파악된다.

블랙웰의 성능 문제는 이번이 처음이 아니다. 엔비디아는 처음 블랙웰을 공개한 3월 올해 2분기(4~6월) 출시를 밝혔지만, 결함 문제가 발견돼 출시를 연기했다. 올해 8월 회사는 블랙웰을 11월~내년 1월 양산한다고 발표했다. 계속되는 성능 문제로 엔비디아 제품의 사전 주문을 마친 마이크로소프트(MS), 메타, 오픈AI 등 업체의 우려도 가중되는 것으로 알려졌다.



전남혁 기자 forward@donga.com


라이프



모바일 버전 보기