English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 성능 입증

2025/06/05 10:29:20

엔비디아가 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처 기반 AI 플랫폼으로 최신 MLPerf 훈련(MLPerf Training) 벤치마크 전 항목에서 최고 성능을 달성했다고 밝혔다.

 

엔비디아는 전 세계 기업들과 협력해 AI 팩토리를 구축하고 있으며, 최신 훈련, 추론 기술을 기반으로 차세대 AI 애플리케이션의 훈련과 배포 속도를 높이고 있다.

엔비디아 블랙웰 아키텍처는 이러한 새로운 애플리케이션의 고도화된 성능 요구사항을 충족하도록 설계됐다. 2018년 벤치마크가 도입된 이래 12번째로 진행된 최신 MLPerf 훈련 라운드에서, 엔비디아 AI 플랫폼은 모든 벤치마크 항목에서 최고 수준의 성능을 입증했다. 또한 가장 까다로운 거대 언어 모델(large language model, LLM) 중심 테스트인 라마 3.1 405B(Llama 3.1 405B) 사전 훈련에서 제출된 모든 결과도 엔비디아 플랫폼 위에서 실행됐다.

엔비디아 플랫폼은 유일하게 MLPerf 훈련 v5.0의 모든 벤치마크 항목에 결과를 제출했다. 엔비디아는 LLM, 추천 시스템, 멀티모달 LLM, 객체 감지, 그래프 신경망을 아우르는 광범위한 AI 워크로드에서 탁월한 성능과 범용성을 입증했다.

대규모 출품에는 엔비디아 블랙웰 플랫폼으로 구동되는 두 대의 AI 슈퍼컴퓨터가 사용됐다. 이는 각각 엔비디아 GB200 NVL72 랙 스케일 시스템으로 구성된 티케(Tyche), 엔비디아 DGX B200 시스템을 기반으로 한 닉스(Nyx)이다. 또한 엔비디아는 코어위브(CoreWeave), IBM과 협력해 총 2,496개의 블랙웰 GPU와 1,248개의 엔비디아 그레이스(Grace) CPU를 사용한 GB200 NVL72 결과도 제출했다.

새로운 라마 3.1 405B 사전 훈련 벤치마크에서 블랙웰 아키텍처는 동일한 규모의 이전 세대 대비 2.2배 향상된 성능을 기록했다.

라마 2 70B LoRA 미세 조정 벤치마크에서는 블랙웰 GPU 8개가 탑재된 엔비디아 DGX B200 시스템이 이전 라운드에서 동일 GPU 수로 제출한 결과보다 2.5배 더 높은 성능을 달성했다.

이러한 성능 도약은 블랙웰 아키텍처의 기술적 진보를 잘 보여준다. 여기에는 고밀도 수랭식 랙, 랙당 13.4 테라바이트(TB)의 코히어런트 메모리, 스케일업(scale-up)을 위한 5세대 엔비디아 NV링크(NVLink)와 엔비디아 NV링크 스위치(Switch) 상호연결 기술, 그리고 스케일 아웃(scale-out)을 위한 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹 등이 포함된다. 또한 엔비디아 네모 프레임워크(NeMo Framework) 소프트웨어 스택의 혁신은 에이전틱 AI 애플리케이션 실현에 핵심적인 기반이 되는 차세대 멀티모달 LLM 훈련의 기준을 높였다.

이러한 에이전틱 AI 기반 애플리케이션은 미래의 AI 팩토리에서 작동하게 되며, 이는 곧 에이전틱 AI 경제의 핵심 엔진으로 자리잡을 전망이다. 이러한 새로운 애플리케이션은 토큰과 지능 정보를 생성하며, 거의 모든 산업과 학문 분야에 걸쳐 가치를 창출할 수 있다.

엔비디아 데이터센터 플랫폼에는 GPU, CPU, 고속 패브릭, 네트워킹은 물론 엔비디아 쿠다-X(CUDA-X) 라이브러리, 네모 프레임워크, 엔비디아 텐서RT-LLM(TensorRT-LLM), 엔비디아 다이나모(Dynamo)와 같은 방대한 소프트웨어가 포함된다. 이처럼 정밀한 하드웨어와 소프트웨어 기술 조합은 조직이 AI 모델을 더 빠르게 훈련하고 배포할 수 있게 해 가치 실현 시간을 획기적으로 단축시킨다.

이번 MLPerf 라운드에는 코어위브와 IBM 외에도 다양한 엔비디아 파트너사들이 참여했다. 에이수스(ASUS), 시스코(Cisco), 델 테크놀로지스(Dell Technologies), 기가컴퓨팅(Giga Computing), 구글 클라우드(Google Cloud), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 람다(Lambda), 레노버(Lenovo), 네비우스(Nebius), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology), 슈퍼마이크로(Supermicro) 등이 다양한 벤치마크 결과를 제출했다.

Tweet

#엔비디아, #블랙웰


케이벤치 많이 본 기사
  [뉴스] 삼성전자, 갤럭시 언팩에서 '갤럭시 워치 울트라' 히어로 색상 선보인다
  [뉴스] 갤럭시 워치4 시리즈, 원UI 8 워치 이후 OS 지원 중단
  [뉴스] 갤럭시S26 탑재 루머 2나노 기반 '엑시노스 2600' 프로토타입 생산 시작
  [기획] 크리에이터 여정을 함께 할 스토리지, 샌디스크 '크리에이터'시리즈 신제품 7종 발표
  [기획] AI 적극 활용하는 유능한 비즈니스 노트북, MSI 프레스티지 프로 16 AI B2HVEG-U9 UHD+ OLED
  [뉴스] SK텔레콤 새 효도폰 '갤럭시 와이드8' 출시 임박했나?
  [뉴스] 삼성 2025년 보급형 스마트폰 '갤럭시 A07 4G' 하반기 출시
  [뉴스] 2026년 플래그십 AI 성능 대폭 향상.. 스냅드래곤 8 엘리트2 + 24
  [뉴스] 차기 '에어팟 프로3' 올해 출시 불투명… 내년으로 밀리나
  [기획] 우드 패널로 고급스러움 UP한 어항형 미니타워 케이스, 마이크로닉스 WIZMAX 우드리안 Pro
  [기획] 틈새를 노리고 가성비를 더했다, AMD 라데온 RX 9060 XT 16GB 성능 확인
  [기획] '퍼플과 그레이' 두 가지 매력, COX C108 유무선 기계식 키보드
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  엔비디아, 영상용 AI 조명 신기술 디퓨전렌더러 공개
  엔비디아, 유럽 의료/생명과학 기업에 AI 기술 제공
  엔비디아, 유럽 최초 엑사스케일 슈퍼컴퓨터 주피터에 기술 공급
  8GB 그래픽카드 성능 논란, 24Gb GDDR7 메모리로 해결한다
  에이서, 엔비디아 RTX AI PC 캠퍼스 세미나 성료
  엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 성능 입증
  엔비디아 RTX 프로 6000 블랙웰, 게이밍 최고 성능 확인
  엔비디아, 슈퍼컴퓨터 다우드나에 베라 루빈 아키텍처 지원
  엔비디아, 스웨덴 내 차세대 AI 인프라 구축
  엔비디아 지포스 RTX 5060/5060 Ti '펌웨어' 배포, 블랙스크린 이슈 해결
  HPE, 엔비디아와의 협업으로 AI 팩토리 포트폴리오 강화
  엔비디아 또 당했나? RTX 5060 가격에 라데온 RX 9060 XT 8GB 투입
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
삼성파운드리, '닌텐도 스위치2' 흥행 돌풍에 큰 수익 기대
갤럭시S26 탑재 루머 2나노 기반 '엑시노스 2600' 프로토타입 생산 시작
삼성 '갤럭시Z 폴드7·플립7' 국내 모델 인증 통과
삼성전자, 갤럭시 언팩에서 '갤럭시 워치 울트라' 히어로 색상 선보인다
SK텔레콤 새 효도폰 '갤럭시 와이드8' 출시 임박했나?
갤럭시 워치4 시리즈, 원UI 8 워치 이후 OS 지원 중단
삼성 '갤럭시 탭 S11 울트라' 긱벤치 포착.. 미디어텍 Dimensity 9400+ 탑재 확인
구글, '안드로이드 16' 정식 버전 출시
차세대 UWB 탑재 '에어태그 2' 출시 정황, iOS 26 베타 코드에서 발견
삼성전자, '갤럭시Z 폴드7·플립7' 올해 생산 목표 하향 조정?
뉴스
기사
RTX 4060 Ti도 넘어섰다. ASUS TUF 지포스 RTX 5060 8GB OC
RX 7700 XT 넘어섰나? ASUS PRIME 라데온 RX 9060 XT 16GB OC
'퍼플과 그레이' 두 가지 매력, COX C108 유무선 기계식 키보드
크리에이터 여정을 함께 할 스토리지, 샌디스크 '크리에이터'시리즈 신제품 7종 발표
우드 패널로 고급스러움 UP한 어항형 미니타워 케이스, 마이크로닉스 WIZMAX 우드리안 Pro
가성비 화이트 데스크 홈 게이밍 모니터, 제이씨현 UDEA EDGE ED2732PF 유케어 165 홈게임 화이트
[컴퓨텍스 2025] AI 신기술과 장인정신이 공존하는 MSI
AI 적극 활용하는 유능한 비즈니스 노트북, MSI 프레스티지 프로 16 AI B2HVEG-U9 UHD+ OLED
틈새를 노리고 가성비를 더했다, AMD 라데온 RX 9060 XT 16GB 성능 확인
새로운 대화법, 패링으로 돌아온 지옥 상남자, 둠: 더 다크 에이지스 그래픽카드 4종 테스트