English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

엔비디아, 구글과 협력해 AI 모델 젬마 최적화

2024/02/23 09:49:54

엔비디아가 구글(Google)과 협력해 모든 엔비디아(NVIDIA) AI 플랫폼에서 AI 모델 젬마(Gemma)를 위한 최적화를 실시했다고 밝혔다. 이를 통해 비용을 절감하고 도메인별 용도에 따라 작업 속도를 혁신적으로 높였다.

 

어디서나 실행 가능한 젬마는 구글의 새로운 경량 오픈 언어 모델로, 20억(2B) 파라미터와 70억(7B) 파라미터 크기로 제공된다.

젬마는 구글의 멀티모달 모델인 제미나이(Gemini) 개발에 사용된 동일한 연구와 기술을 기반으로 구축됐다. 엔비디아는 구글과 긴밀히 협력해 엔비디아 텐서RT-LLM(TensorRT-LLM)으로 젬마의 성능을 가속화했다. 텐서RT-LLM은 데이터센터, 클라우드 혹은 엔비디아 RTX GPU가 탑재된 PC에서 대규모 언어 모델(LLM) 추론을 최적화하는 오픈 소스 라이브러리이다.

이를 통해 개발자는 전 세계 고성능 AI PC에 탑재된 1억 개 이상의 엔비디아 RTX GPU를 활용할 수 있다.

개발자들은 클라우드 상의 엔비디아 GPU에서도 젬마를 실행할 수 있다. 여기에는 H100 텐서 코어(H100 Tensor Core) GPU를 기반으로 하는 구글 클라우드 A3인스턴스(A3 instances)가 포함되며, 초당 4.8테라바이트의 141GB HBM3e 메모리를 갖춘 엔비디아 H200 텐서 코어 GPU도 합류할 예정이다. 구글은 올해 안에 이를 배포할 예정이라고 전했다.

엔비디아는 네모 프레임워크(NeMo Framework)가 적용된 엔비디아 AI 엔터프라이즈(AI Enterprise)와 텐서RT-LLM을 비롯한 광범위한 도구를 갖추고 있다. 엔터프라이즈 개발자들은 이들을 추가로 활용해 젬마를 미세 조정하고 최적화된 모델을 프로덕션 애플리케이션에 배포할 수 있다.

여기에서 개발자를 위한 추가 정보와 함께 텐서RT-LLM이 젬마의 추론을 개선하는 방법에 대해 자세히 알아볼 수 있다. 여기에는 젬마의 여러 모델 체크포인트와 FP8 정량화 버전 모델이 포함되며 모두 텐서RT-LLM으로 최적화돼 있다.

또한, 엔비디아 AI 플레이그라운드(AI Playground)를 통해 브라우저에서 직접 젬마 2B와 젬마 7B를 체험해 볼 수 있다.

엔비디아 기술 데모인 챗 위드 RTX에 곧 젬마가 추가로 지원될 예정이다. 챗 위드 RTX는 검색 증강 생성(Retrieval-augmented generation, RAG)과 텐서RT-LLM 소프트웨어를 사용해 로컬 RTX 기반 윈도우(Windows) PC에서 사용자에게 생성형 AI 기능을 제공하는 기술이다.

사용자는 챗 위드 RTX를 통해 PC의 로컬 파일을 LLM에 쉽게 연결하고 자신의 데이터로 챗봇을 개인화 할 수 있다.

챗 위드 RTX는 로컬에서 모델이 실행되므로 결과가 빠르게 제공되며 사용자 데이터가 디바이스에 유지된다. 클라우드 기반 LLM 서비스에 대신 챗 위드 RTX를 사용하면 민감한 데이터를 제3자와 공유하거나 인터넷에 연결할 필요 없이 로컬 PC에서 처리할 수 있다.

Tweet

#엔비디아, #구글, #인공지능, #젬마


케이벤치 많이 본 기사
  [기획] 티포스가 통하면 시장이 움직인다 '팀그룹' 한국 메모리 시장서 존재감 각인
  [기획] 깔끔하고 심플한 가성비 어항형 PC 케이스, 다크플래쉬 DS500 RGB
  [기획] ASUS PRIME 지포스 RTX 5060 Ti 16GB OC, 게이머의 기대 충족했을까?
  [뉴스] 엔비디아 DGX 스파크가 PC로 나온다? 컴퓨텍스에서 발표 전망
  [뉴스] 인텔 CPU 가격 내렸다, 코어 울트라 7 265K/KF '25% 가격인하'
  [뉴스] GTA 6, 2026년 5월 26일로 출시일 연기 확정 및 2차 트레일러 공개
  [뉴스] 삼성파운드리 2나노 수율 개선.. '갤럭시S26' 엑시노스 2600 탑재 가
  [뉴스] 삼성전자, '갤럭시Z 폴드7'에 혁신 기술 '올인'…역대급 두께·베젤 적용
  [뉴스] 삼성 '갤럭시Z 폴드7' 폴더블 한계 넘나…3.9mm 초슬림 바디
  [뉴스] 닌텐도 스위치 2, 불법 복제시 기기 벽돌 된다? 닌텐도 약관 변경
  [뉴스] 원UI 7 핵심 기능 '나우 바' 갤럭시 워치 확대
  [기획] SK하이닉스 메모리와 AMD 최적화, GeIL DDR5-5600 CL46 PRISTINE V AMD
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  엔비디아 DGX 스파크가 PC로 나온다? 컴퓨텍스에서 발표 전망
  엔비디아, RTX GPU와 쿠다 12.8로 LM 스튜디오 성능 대폭 향상
  다나와, RTX 5060 Ti 그래픽카드 1천원 래플 이벤트 진행
  수싸움 시작됐다, 엔비디아 지포스 RTX 5060 성능 공개 미뤄..
  메타빌드, LLaMON 생성형 AI플랫폼과 연계SW 클라우드로 공공, 의료 ACx시장 공략 본격화
  아이플라이텍(iFLYTEK), AINOTE Air2 와디즈 펀딩 8일 오픈
  아이나비시스템즈, AI 기반 스마트 안전 등산로 플랫폼 개발 국책과제 최종 선정
  TG삼보, 리모와 AI 헬스케어 MOU 체결
  엔비디아 '둠: 더 다크 에이지스' 번들 프로모션 시작, 프리미엄 에디션 증정
  엔비디아, 18/24GB VRAM 탑재 'RTX 50 슈퍼' 변종 개발 중
  엔비디아, OCI에 블랙웰 GPU 지원..에이전틱 AI-추론 모델 혁신 가속화
  대원씨티에스-딥엑스, AI 반도체 및 지능형 관제 인프라 세미나 성료
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
삼성, 이르면 7월 말 차기 '원UI 8' 업데이트 출시.. 업데이트 대상 기기는?
보급형 '갤럭시Z 플립 Xe' 엑시노스 대신 스냅드래곤 칩셋 탑재?
삼성 '갤럭시S25 엣지' 미국에서 사전 예약 시작.. 국내에선 '더블 스토리지' 혜택 제공
삼성 '원UI 8 워치' 새로운 유출.. 사용자 경험 전면 개편
인텔 CPU 가격 내렸다, 코어 울트라 7 265K/KF '25% 가격인하'
삼성 '갤럭시Z 폴드7' 폴더블 한계 넘나…3.9mm 초슬림 바디
원UI 7 핵심 기능 '나우 바' 갤럭시 워치 확대
GTA 6, 2026년 5월 26일로 출시일 연기 확정 및 2차 트레일러 공개
'갤럭시Z 폴드7·플립7' 배터리 인증 통과…플립 배터리 용량 'UP'
소니 플래그쉽 무선 헤드폰 'WH-1000XM6' 이미지 유출.. 폴딩 디자인 부활
뉴스
기사
초소형 외장 SSD의 기준이 될 Seagate Ultra Compact SSD
ASUS PRIME 지포스 RTX 5060 Ti 16GB OC, 게이머의 기대 충족했을까?
티포스가 통하면 시장이 움직인다 '팀그룹' 한국 메모리 시장서 존재감 각인
최신 게임, 최적의 환경을 제공하는 게이밍 노트북, MSI 소드 17 HX B13VGKG-i9 QHD WIN11
SK하이닉스 메모리와 AMD 최적화, GeIL DDR5-5600 CL46 PRISTINE V AMD
게이밍 환경을 위한 메인스트림 라라랜드 PC 구성, 어느정도 돌아갈까? R5 9600X+RX 9070
어항케이스와 우드패널의 완벽한 조합, 마이크로닉스 WIZMAX 우드리안 MAX
깔끔하고 심플한 가성비 어항형 PC 케이스, 다크플래쉬 DS500 RGB
한 눈에 들어오는 고주사율 홈 게이밍 모니터, 제이씨현 UDEA EDGE ED2420GT 유케어 IPS 홈게임 180
대만산은 싸구려 취급하던 한국산 그래픽카드 전성시대,우리나라 그래픽카드시장 변화 이야기 [PC흥망사 12-1]