English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

엔비디아, 구글 딥마인드와 협력 거대 언어 모델 혁신 추진

2024/05/17 12:12:30

엔비디아가 14일 열린 구글(Google) 연례 개발자 콘퍼런스인 구글 I/O 2024에서 세 가지 새로운 협업 내용을 발표했다. 이번 협업으로 엔비디아(NVIDIA)와 구글은 세계적 수준의 성능을 갖춘 AI 기반 애플리케이션을 더 쉽게 만들 수 있도록 개발자를 지원할 예정이다.

 

텍스트, 이미지, 사운드와 같은 여러 유형의 데이터를 처리하는 모델이 점점 더 보편화되면서 생성형 AI를 구동하는 거대 언어 모델(large language model, LLM)에 대한 혁신이 가속화되고 있다.

그러나 이러한 모델을 구축하고 배포하는 것은 여전히 어려운 과제다. 개발자는 모델을 빠르게 경험하고 평가해 사용 사례에 가장 적합한 모델을 결정한 다음, 비용 효율적일 뿐만 아니라 최상의 성능을 제공하는 방식으로 모델을 최적화할 수 있는 방법이 필요하다.

엔비디아는 이번 행사에서 구글이 선보인 두 가지 새로운 모델인 젬마 2(Gemma 2)와 팔리젬마(PaliGemma)를 최적화하기 위해 텐서RT-LLM(TensorRT-LLM)을 사용하고 있다. 이 두 모델들은 모두 제미나이(Gemini)를 만드는 데 사용된 동일한 연구와 기술을 기반으로 구축됐으며, 각각 특정 영역에 중점을 둔다.

 젬마 2는 광범위한 사용 사례를 위한 차세대 젬마 모델로, 획기적인 성능과 효율성을 위해 설계된 완전히 새로운 아키텍처가 특징이다.

 팔리젬마는 PaLI-3에서 영감을 받은 개방형 시각 언어 모델(VLM, vision language model)이다. 이는 SigLIP 시각 모델과 젬마 언어 모델을 포함한 개방형 구성 요소를 기반으로 구축됐으며, 이미지, 짧은 비디오 캡션, 시각적 이미지 질의응답, 이미지 내 텍스트 이해, 객체 감지나 분할과 같은 시각 언어 작업을 위해 설계됐다. 팔리젬마는 광범위한 시각 언어 작업에서 최고 수준의 미세 조정 성능을 탑재했고 엔비디아 JAX-툴박스(JAX-Toolbox)에서도 지원된다.

젬마 2와 팔리젬마는 대규모 AI 모델 배포를 간소화하는 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼의 일부인 엔비디아 NIM 추론 마이크로서비스와 함께 제공될 예정이다. 새로운 두 모델에 대한 NIM 지원은 팔리젬마를 시작으로 API 카탈로그에서 사용할 수 있으며, 곧 엔비디아 NGC와 깃허브(GitHub)에서 컨테이너로 출시될 예정이다.

구글은 데이터 과학자에게 가장 인기 있는 개발자 플랫폼 중 하나인 구글 코랩(Colab)에서 오픈 소스 GPU 데이터 프레임 라이브러리인 래피즈 cuDF(RAPIDS cuDF)가 기본으로 지원된다고 발표했다. 매월 천만 명에 달하는 구글 코랩의 월간 사용자들은 이제 코드 변경 없이 단 몇 초 만에 엔비디아 L4 텐서 코어(Tensor Core) GPU를 사용해 판다스(pandas) 기반 파이썬(Python) 워크플로우를 최대 50배까지 가속화할 수 있다.

구글 코랩을 사용하는 개발자는 래피즈 cuDF를 통해 탐색적 분석(exploratory analysis)과 생산 데이터 파이프라인의 속도를 높일 수 있다. 판다스는 직관적인 API로 인해 세계에서 가장 인기 있는 데이터 처리 도구 중 하나이지만 데이터 규모가 커질수록 애플리케이션에 문제가 종종 생긴다. 5~10GB 크기의 데이터라도 CPU에서 간단한 작업을 완료하는 데 몇 분이나 걸리기도 하기 때문에, 탐색적 분석과 생산 데이터 파이프라인의 속도가 느려질 수 있다.

이 경우 래피즈 cuDF는 GPU에서 판다스 코드를 원활하게 가속하고, 그렇지 않은 경우 CPU-판다스(CPU-pandas)로 되돌아가 이 문제를 해결하도록 설계됐다. 코랩에서 기본적으로 사용할 수 있는 래피즈 cuDF를 통해 모든 개발자는 어디서나 가속화된 데이터 분석을 활용할 수 있다.

엔비디아와 구글은 엔비디아 RTX 그래픽을 사용해 AI PC를 활용하는 파이어베이스 젠킷(Firebase Genkit)에 대한 협업도 발표했다. 이는 개발자가 새로운 젬마 모델 제품군을 비롯한 생성형 AI 모델을 웹과 모바일 애플리케이션에 쉽게 통합해 맞춤형 콘텐츠, 시맨틱 검색(semantic search), 문의에 대한 답변을 제공할 수 있도록 지원한다. 개발자는 로컬 RTX GPU로 작업 줄기(work stream)를 시작한 다음, 작업을 구글 클라우드(Google Cloud) 인프라로 원활하게 이동할 수 있다.

개발자들은 모바일 개발자들이 주로 쓰는 프로그래밍 언어인 자바스크립트(JavaScript)를 사용하는 젠킷으로 앱을 더욱 쉽게 개발할 수 있다.

엔비디아와 구글 클라우드는 AI의 발전을 위해 다양한 분야에서 협력하고 있다. 곧 출시될 그레이스 블랙웰(Grace Blackwell) 기반 DGX 클라우드 플랫폼과 JAX 프레임워크 지원부터 구글 쿠버네티스 엔진(Kubernetes Engine)에 엔비디아 네모(NeMo) 프레임워크 도입까지, 양사의 풀스택(full-stack) 파트너십은 사용자가 구글 클라우드에서 엔비디아 기술을 사용해 AI로 수행할 수 있는 작업의 가능성을 확장하고 있다.

Tweet

#엔비디아, #구글, #인공지능, #딥마인드


케이벤치 많이 본 기사
  [뉴스] 윈도우 6월 보안 업데이트 이후 일부 PC '부팅 불가'
  [뉴스] 아이폰18 프로, HIAA 기술 적용된 펀치 홀 디스플레이 탑재
  [뉴스] 애플 '아이폰17' 6.3인치 디스플레이 탑재 확정?
  [기획] 틈새를 노리고 가성비를 더했다, AMD 라데온 RX 9060 XT 16GB 성능 확인
  [기획] 고민하고 선택한 내 PC의 두뇌 'CPU', 벌크와 정품 차이점은?
  [뉴스] 삼성 2나노 엑시노스 2600, 싱글코어 성능 스냅드래곤 8 엘리트 2보다 25% 낮아
  [뉴스] '갤럭시Z 폴드7·플립7'…구글 AI 프로 무료 체험 혜택 제공
  [기획] RX 7700 XT 넘어섰나? ASUS PRIME 라데온 RX 9060 XT 16GB OC
  [기획] 최신 게임을 위한 게이밍 솔루션 노트북, MSI 벡터 16 HX AI A2XWHG-U9 QHD+
  [뉴스] 애플, 개발자용 iOS 26 베타 2 출시.. 변경 사항은?
  [뉴스] 공식 발표 안된 '갤럭시Z 폴드7' 더미 유닛, 中 온라인 쇼핑몰서 판매
  [기획] '퍼플과 그레이' 두 가지 매력, COX C108 유무선 기계식 키보드
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  슈퍼브에이아이, 국내 최초 산업 특화 비전 파운데이션 모델 '제로(ZERO)' 공개
  로지텍, AI 기반 올인원 화상회의 솔루션 랠리 보드 65 국내 정식 출시
  ReBAR가 꺼져있다, 활성화 시 엔비디아 GPU 10% 성능 향상
  애플, '갤럭시S26' 탑재설 AI 검색 엔진 퍼플렉시티 인수 검토
  데이터브릭스, AI 애플리케이션 및 에이전트를 위한 차세대 운영 데이터베이스 ‘레이크베이스’ 공개
  나인톡, ‘인사말 자동생성 AI’ 도입으로 대량 카톡 메시지 혁신
  AI 인프라 기업 ㈜코코링크 고밀도 컴퓨팅 서버 ‘Klimax-408’ 신제품 출시 기자간담회 개최
  슈퍼마이크로, AMD 인스팅트 MI350 탑재 AI 솔루션 출시
  국내 최대 게임 AI 콘퍼런스 'Game AI Con', C2C 2025와 함께 7월 개최
  엔비디아 리플렉스, 150개 이상 게임에서 지원
  2026년 플래그십 AI 성능 대폭 향상.. 스냅드래곤 8 엘리트2 + 24GB 램 조합 대거 등장
  에이수스, 에이수스-인텔 AI 서버 세미나 진행
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
삼성 2나노 엑시노스 2600, 싱글코어 성능 스냅드래곤 8 엘리트 2보다 25% 낮아
아이폰18 프로, HIAA 기술 적용된 펀치 홀 디스플레이 탑재
차기 '갤럭시Z 폴드7·플립7'… 7월 9일 미국 뉴욕에서 공개 확정?
윈도우 6월 보안 업데이트 이후 일부 PC '부팅 불가'
엑시노스 2600, 삼성 자체 개발 GPU 탑재 루머.. 화웨이 엔지니어 영입
애플, 일반 테스터용 'iOS 18.6' 퍼블릭 베타 1 출시
공식 발표 안된 '갤럭시Z 폴드7' 더미 유닛, 中 온라인 쇼핑몰서 판매
'갤럭시 A34 5G' 원UI 7 업데이트 문제있나? 배포 일시 중단
삼성 '갤럭시Z 플립7' 공식 렌더링 첫 유출.. 풀스크린 커버 디스플레이 '눈길'
'갤럭시Z 폴드7·플립7'…구글 AI 프로 무료 체험 혜택 제공
뉴스
기사
RX 7700 XT 넘어섰나? ASUS PRIME 라데온 RX 9060 XT 16GB OC
'퍼플과 그레이' 두 가지 매력, COX C108 유무선 기계식 키보드
크리에이터 여정을 함께 할 스토리지, 샌디스크 '크리에이터'시리즈 신제품 7종 발표
틈새를 노리고 가성비를 더했다, AMD 라데온 RX 9060 XT 16GB 성능 확인
새로운 대화법, 패링으로 돌아온 지옥 상남자, 둠: 더 다크 에이지스 그래픽카드 4종 테스트
스튜디오 레퍼런스의 실현, 노이만 NDH30 오픈백 스튜디오 헤드폰
고민하고 선택한 내 PC의 두뇌 'CPU', 벌크와 정품 차이점은?
최신 게임을 위한 게이밍 솔루션 노트북, MSI 벡터 16 HX AI A2XWHG-U9 QHD+
최고 성능 CPU로 스텔라 블레이드와 게임 4종 즐기기, 인텔 코어 울트라9 285K 성능은?
각종 작업과 모바일 게임 멀티테스킹 플레이, 그 중심에 있는 것은?