English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

엔비디아, RTX AI PC 성능 강화로 게이머, 크리에이터, 개발자 지원

2024/05/23 13:59:21

– AI 컴퓨팅 기술 분야의 선두주자인 엔비디아가 5월 22일  마이크로소프트 빌드(Microsoft Build) 2024에서 새로운 AI 성능 최적화와 윈도우(Windows)용 통합을 발표했다. 이는 엔비디아 지포스 RTX(NVIDIA GeForce RTX) AI PC와 엔비디아 RTX 워크스테이션에서 최고의 성능을 제공할 수 있도록 지원한다.



거대 언어 모델(large language models, LLMs)은 생성형 AI에서 가장 흥미로운 새 활용 사례를 지원한다. 이제 새로운 엔비디아 R555 게임 레디 드라이버(Game Ready Driver)를 사용하는 ONNX 런타임(ONNX Runtime, ORT)과 다이렉트ML(DirectML)을 통해 최대 3배 빠르게 실행된다. ORT와 다이렉트ML은 윈도우 PC에서 로컬로 AI 모델을 실행하는 데 사용되는 고성능 툴이다.

WebNN은 웹 개발자들이 AI 모델을 배포할 수 있는 애플리케이션 프로그래밍 인터페이스다. 이는 이제 다이렉트ML을 통해 RTX로 가속화돼 웹 앱에 빠른 AI 기반 기능을 통합할 수 있게 됐다. 또한 파이토치(PyTorch)는 다이렉트ML 실행 백엔드를 지원해 윈도우 개발자들이 윈도우에서 자체적으로 복잡한 AI 모델을 훈련하고 추론할 수 있도록 지원한다. 엔비디아와 마이크로소프트는 RTX GPU의 성능을 확장하기 위해 협력하고 있다.

이러한 발전은 전 세계 1억 대 이상의 RTX AI PC와 워크스테이션에서 500개 이상의 애플리케이션과 게임을 가속화하는 엔비디아의 세계 선도적인 AI 플랫폼을 기반으로 한다.

RTX AI PC: 게이머, 크리에이터 그리고 개발자를 위해 향상된 AI
엔비디아는 2018년, 텐서 코어(Tensor Core)를 탑재한 최초의 AI 가속 전용 PC GPU인 지포스 RTX 20 시리즈와 최초로 널리 채택된 윈도우용 AI 모델인 엔비디아 DLSS를 출시했다. 최신 GPU는 초당 최대 1,300조 회의 AI 전용 연산 성능을 제공한다.

앞으로 몇 달 안에 새로운 전력 효율적 시스템 온 칩(systems-on-a-chip, SoC)과 RTX GPU를 탑재한 코파일럿+(Copilot+) PC가 출시될 예정이다. 게이머, 크리에이터, 마니아, 개발자는 이 PC를 통해 마이크로소프트의 새로운 코파일럿+ 기능과 함께 까다로운 로컬 AI 워크로드를 처리할 수 있는 향상된 성능을 제공받게 된다.

RTX AI PC를 사용하는 게이머를 위해 엔비디아 DLSS는 프레임 속도를 최대 4배까지 끌어올린다. 또한 엔비디아 에이스(ACE)는 AI 기반 대화, 애니메이션, 음성으로 게임 캐릭터에 생동감을 불어넣는다.

콘텐츠 크리에이터를 위해 RTX는 어도비 프리미어(Adobe Premiere), 블랙매직 디자인 다빈치 리졸브(Blackmagic Design DaVinci Resolve)와 블렌더(Blender) 같은 앱에서 AI 기반 제작 워크플로우를 지원한다. 이를 통해 지루한 작업을 자동화하고 워크플로우를 간소화할 수 있다. 3D 노이즈 제거와 가속 렌더링부터 텍스트-이미지 변환과 비디오 생성에 이르기까지, 이러한 툴은 아티스트가 자신의 비전을 현실에 구현할 수 있도록 지원한다.

게임 모더(modder)를 위해 엔비디아 옴니버스(Omniverse) 플랫폼에 구축된 엔비디아 RTX 리믹스(Remix)는 클래식 PC 게임의 RTX 리마스터 제작을 위한 AI 가속 툴을 제공한다. 게임 에셋을 캡처하고, 생성형 AI 툴로 머티리얼(materials)을 개선하며, 풀 레이 트레이싱을 통합하는 것이 그 어느 때보다 쉬워졌다.

라이브 스트리머를 위해 엔비디아 브로드캐스트(Broadcast) 앱은 고품질 AI 기반 배경 제거와 노이즈 제거 기능을 제공한다. 엔비디아 RTX 비디오(Video)는 스트리밍 비디오 품질을 향상시키기 위해 AI 기반 업스케일링과 자동 HDR(high-dynamic range)을 제공한다.

생산성 향상을 통해 RTX GPU 기반 LLM은 AI 어시스턴트와 코파일럿을 더 빠르게 실행하고 여러 요청을 동시에 처리할 수 있다.

또한 RTX AI PC를 사용하면 개발자가 엔비디아의 AI 개발자 툴을 사용해 디바이스에서 직접 AI 모델을 빌드하고 미세 조정할 수 있다. 여기에는 엔비디아 AI 워크벤치(Workbench), 엔비디아 cuDNN, 리눅스(Linux)용 윈도우 서브시스템(Subsystem)의 쿠다(CUDA)가 포함된다. 또한 개발자는 RTX 가속 AI 프레임워크와 엔비디아 텐서RT(TensorRT), 엔비디아 맥신(Maxine)과 RTX 비디오와 같은 소프트웨어 개발 키트에 액세스할 수 있다.

AI 역량과 성능의 결합은 게이머, 크리에이터와 개발자에게 향상된 경험을 제공한다.

웹 개발자를 위한 더 빠른 LLM과 새로운 기능
마이크로소프트는 최근 AI 추론을 위한 크로스 플랫폼 라이브러리인 ORT용 생성형 AI 확장 기능을 출시했다. 이 확장 기능에는 파이-3(Phi-3), 라마 3(Llama 3), 젬마(Gemma), 미스트랄(Mistral)과 같은 LLM 양자화를 비롯한 최적화 기술이 추가됐다. ORT는 다이렉트ML을 비롯한 다양한 소프트웨어와 하드웨어 스택을 통해 추론을 위한 다양한 실행 공급자를 지원한다.

다이렉트ML 백엔드가 포함된 ORT는 광범위한 윈도우 PC 에코시스템에 대한 안정성과 프로덕션급 지원을 통해 윈도우 AI 개발자에게 AI 기능을 빠르게 개발할 수 있는 경로를 제공한다. ORT용 생성형 AI 확장에 대한 엔비디아의 최적화로 개발자들은 이전 드라이버에 비해 RTX에서 최대 3배 빠른 성능을 경험할 수 있다. 현재 R555 게임 레디, 스튜디오(Studio) 그리고 엔비디아 RTX 엔터프라이즈(Enterprise) 드라이버에서 사용할 수 있다.

 
최신 R555 지포스 드라이버와 함께 ORT와 다이렉트ML 실행 공급자를 사용하는 세 가지 LLM에 대한 추론 성능을 이전 R550 드라이버와 비교한 결과. INSEQ=2000는 문서 요약 워크로드를 나타낸다. 모든 데이터는 배치 크기 1을 사용해 지포스 RTX 4090 GPU로 캡처했다. int4 양자화를 위한 생성형 AI 확장 지원과 엔비디아 최적화를 통해 LLM의 성능이 최대 3배 빨라졌다.

개발자들은 새로운 R555 드라이버로 RTX 하드웨어의 모든 기능을 활용해 소비자에게 더 나은 AI 경험을 빠르게 제공할 수 있다. 여기에는 다음과 같은 내용이 포함된다:

 LLM의 INT4 가중치 전용 양자화 처리를 위한 DQ-GEMM 메타커맨드(metacommand) 지원
 라마 2, 라마 3, 미스트랄과 파이-3 모델에 대한 새로운 RMSNorm 정규화 방법
 그룹과 다중 쿼리 어텐션 메커니즘(multi-query attention mechanisms), 슬라이딩 윈도우 어텐션(sliding window attention)을 통한 미스트랄 지원
 인플레이스(In-place) KV 업데이트로 어텐션 성능 향상
 컨텍스트 단계 성능 향상을 위해 8의 배수가 아닌 텐서의 GEMM 지원

또한, 엔비디아는 브라우저 내에서 직접 RTX GPU의 강력한 성능을 제공할 수 있도록 WebNN 내에서 AI 워크플로우를 최적화했다. WebNN 표준은 웹 앱 개발자들이 텐서 코어와 같은 온디바이스 AI 가속기로 딥 러닝 모델을 가속화하는 데 도움이 된다.

WebNN은 브라우저 내 모델 실행을 위해 다이렉트ML과 자바스크립트(Javascript) 라이브러리인 ORT 웹을 사용한다. 이는 이제 개발자 프리뷰에서 사용할 수 있으며, 여러 플랫폼에서 AI 애플리케이션에 더 쉽게 액세스할 수 있다. 이러한 가속화를 통해 스테이블 디퓨전(Stable Diffusion), SD 터보(SD Turbo), 위스퍼(Whisper)와 같은 인기 모델이 웹GPU(WebGPU)에 비해 최대 4배 빠르게 실행되며 이제 개발자들이 사용할 수 있다. 마이크로소프트 빌드 참석자는 5월 23일 목요일 오전 3시(한국시간)에 진행되는 윈도우 PC에서의 RTX AI 활용을 통한 개발 가속화 오프라인 세션에서 RTX를 활용한 개발 방법에 대해 자세히 알아볼 수 있다.

Tweet

#엔비디아, #인공지능


케이벤치 많이 본 기사
  [뉴스] 갤럭시S26 전용 2나노 '스냅드래곤 8 엘리트 2'…TSMC보다 저렴
  [뉴스]삼성 3단 폴더블폰 '갤럭시 G 폴드' 이렇게 생겼나?
  [뉴스]애플, 개발자용 iOS 26 베타 3 출시.. 리퀴드 글래스 디자인 일부 조
  [뉴스] ‘갤럭시Z 폴드7·플립7’ 출시일 확정?… 7월 25일 글로벌 출시
  [뉴스]'갤럭시Z 폴드7·플립7·플립7 FE' 모델까지.. 전체 사양 유출
  [뉴스] 케이스 제조사, '갤럭시Z 폴드7·플립7' 케이스 사전 예약
  [기획] 최신 게임을 위한 게이밍 솔루션 노트북, MSI 벡터 16 HX AI A2XWHG-U9 QHD+
  [뉴스] 삼성 '갤럭시 워치 울트라8·워치 울트라2' 전체 사양 나왔다
  [기획] 스텔라 블레이드, 어디까지 가능할까? MAXSUN 인텔 Arc B580 iCraft D6 12GB
  [기획] [리뷰] 풀 실리콘 사운드 뎀퍼로 완성한 COX CSK88 유무선 기계식 키보드
  [뉴스] 아이폰17 프로, 6년 만에 로고 위치 변경.. 맥세이프 코일 때문?
  [기획] AI와 함께하는 콘텐츠의 중심, 삼성전자 43인치 AI 스마트 모니터 M7 LS43FM701 삼탠바이미
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  메타, AI 강화 위해 애플 핵심 임원 영입
  AWS, 국내 AI 도입 확산세 확인
  2분기 PC시장 신제품 출시 뉴스 분석,AMD 5500X3D/9600X3D부터 60급 그래픽카드와 지포스 5050까지
  지포스 RTX 5050 판매시작? 일부 파트너, 소매판매 공지
  프롬(PROM), 시성비 시대의 숏폼 AI 스토리텔링 컨퍼런스 개최
  지미션, LLM 기반 문서처리 솔루션 ‘DXHUND’ 출시
  정식 버전 공개된 DLSS 트랜스포머 모델, 메모리 사용량 평균 20% 개선
  지포스 RTX 30/40/50 사용자는 어도비 크리에이티브 클라우드가 최대 2개월 무료
  에릭슨, AI/자율 네트워크 시대 통신사업자 혁신 가속화 지원
  다나와, 2025년 상반기 AI 노트북 204% 급증
  24년 하드웨어 전문기자가 바라는 새정부의 소버린 AI 정책의 방향, 칩부터 모델링 산업융합까지 우리 것으로
  엔비디아, DLSS4에 적용된 '트랜스포머 모델' 베타 종료 선언
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
퀄컴-삼성파운드리 2나노 협력 없던 일로? TSMC, 스냅드래곤 8 엘리트2 독점 생산
삼성 '갤럭시 워치 울트라8·워치 울트라2' 전체 사양 나왔다
‘갤럭시Z 폴드7·플립7’ 출시일 확정?… 7월 25일 글로벌 출시
차기 '갤럭시S26 울트라' 카메라 사양 유출.. 5년 만에 망원 카메라 업그레이드
아이폰17 프로, 새로운 맥세이프 디자인 유출
아이폰17 프로, 6년 만에 로고 위치 변경.. 맥세이프 코일 때문?
갤럭시S26 전용 2나노 '스냅드래곤 8 엘리트 2'…TSMC보다 저렴
케이스 제조사, '갤럭시Z 폴드7·플립7' 케이스 사전 예약
삼성 '갤럭시Z 플립7' 공식 액세서리 유출
아이폰17 프로 맥스, 아이폰 최초 '5000mAh' 배터리 탑재 루머
뉴스
기사
AI와 함께하는 콘텐츠의 중심, 삼성전자 43인치 AI 스마트 모니터 M7 LS43FM701 삼탠바이미
최신 게임을 위한 게이밍 솔루션 노트북, MSI 벡터 16 HX AI A2XWHG-U9 QHD+
스튜디오 레퍼런스의 실현, 노이만 NDH30 오픈백 스튜디오 헤드폰
각종 작업과 모바일 게임 멀티테스킹 플레이, 그 중심에 있는 것은?
최고 성능 CPU로 스텔라 블레이드와 게임 4종 즐기기, 인텔 코어 울트라9 285K 성능은?
스텔라 블레이드, 어디까지 가능할까? MAXSUN 인텔 Arc B580 iCraft D6 12GB
[리뷰] 풀 실리콘 사운드 뎀퍼로 완성한 COX CSK88 유무선 기계식 키보드
국산 브랜드(OEM) 그래픽카드 전성시대, 이엠텍/렉스텍/유니텍/에버탑 - 우리나라 그래픽카드 시장 변화 이야기 [PC흥망사 12-3]
속도 보다 타이밍, ESSENCORE KLEVV DDR5-6000 CL28 BOLT V WHITE
멀티스탠드와 USB 타입C 지원하는 가성비 24인치 모니터, 제이씨현 UDEA EDGE ED2449KC 유케어 IPS 홈엔터 100 피벗