English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

엔비디아, 구글 딥마인드와 협력 거대 언어 모델 혁신 추진

2024/05/17 12:12:30

엔비디아가 14일 열린 구글(Google) 연례 개발자 콘퍼런스인 구글 I/O 2024에서 세 가지 새로운 협업 내용을 발표했다. 이번 협업으로 엔비디아(NVIDIA)와 구글은 세계적 수준의 성능을 갖춘 AI 기반 애플리케이션을 더 쉽게 만들 수 있도록 개발자를 지원할 예정이다.

 

텍스트, 이미지, 사운드와 같은 여러 유형의 데이터를 처리하는 모델이 점점 더 보편화되면서 생성형 AI를 구동하는 거대 언어 모델(large language model, LLM)에 대한 혁신이 가속화되고 있다.

그러나 이러한 모델을 구축하고 배포하는 것은 여전히 어려운 과제다. 개발자는 모델을 빠르게 경험하고 평가해 사용 사례에 가장 적합한 모델을 결정한 다음, 비용 효율적일 뿐만 아니라 최상의 성능을 제공하는 방식으로 모델을 최적화할 수 있는 방법이 필요하다.

엔비디아는 이번 행사에서 구글이 선보인 두 가지 새로운 모델인 젬마 2(Gemma 2)와 팔리젬마(PaliGemma)를 최적화하기 위해 텐서RT-LLM(TensorRT-LLM)을 사용하고 있다. 이 두 모델들은 모두 제미나이(Gemini)를 만드는 데 사용된 동일한 연구와 기술을 기반으로 구축됐으며, 각각 특정 영역에 중점을 둔다.

 젬마 2는 광범위한 사용 사례를 위한 차세대 젬마 모델로, 획기적인 성능과 효율성을 위해 설계된 완전히 새로운 아키텍처가 특징이다.

 팔리젬마는 PaLI-3에서 영감을 받은 개방형 시각 언어 모델(VLM, vision language model)이다. 이는 SigLIP 시각 모델과 젬마 언어 모델을 포함한 개방형 구성 요소를 기반으로 구축됐으며, 이미지, 짧은 비디오 캡션, 시각적 이미지 질의응답, 이미지 내 텍스트 이해, 객체 감지나 분할과 같은 시각 언어 작업을 위해 설계됐다. 팔리젬마는 광범위한 시각 언어 작업에서 최고 수준의 미세 조정 성능을 탑재했고 엔비디아 JAX-툴박스(JAX-Toolbox)에서도 지원된다.

젬마 2와 팔리젬마는 대규모 AI 모델 배포를 간소화하는 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼의 일부인 엔비디아 NIM 추론 마이크로서비스와 함께 제공될 예정이다. 새로운 두 모델에 대한 NIM 지원은 팔리젬마를 시작으로 API 카탈로그에서 사용할 수 있으며, 곧 엔비디아 NGC와 깃허브(GitHub)에서 컨테이너로 출시될 예정이다.

구글은 데이터 과학자에게 가장 인기 있는 개발자 플랫폼 중 하나인 구글 코랩(Colab)에서 오픈 소스 GPU 데이터 프레임 라이브러리인 래피즈 cuDF(RAPIDS cuDF)가 기본으로 지원된다고 발표했다. 매월 천만 명에 달하는 구글 코랩의 월간 사용자들은 이제 코드 변경 없이 단 몇 초 만에 엔비디아 L4 텐서 코어(Tensor Core) GPU를 사용해 판다스(pandas) 기반 파이썬(Python) 워크플로우를 최대 50배까지 가속화할 수 있다.

구글 코랩을 사용하는 개발자는 래피즈 cuDF를 통해 탐색적 분석(exploratory analysis)과 생산 데이터 파이프라인의 속도를 높일 수 있다. 판다스는 직관적인 API로 인해 세계에서 가장 인기 있는 데이터 처리 도구 중 하나이지만 데이터 규모가 커질수록 애플리케이션에 문제가 종종 생긴다. 5~10GB 크기의 데이터라도 CPU에서 간단한 작업을 완료하는 데 몇 분이나 걸리기도 하기 때문에, 탐색적 분석과 생산 데이터 파이프라인의 속도가 느려질 수 있다.

이 경우 래피즈 cuDF는 GPU에서 판다스 코드를 원활하게 가속하고, 그렇지 않은 경우 CPU-판다스(CPU-pandas)로 되돌아가 이 문제를 해결하도록 설계됐다. 코랩에서 기본적으로 사용할 수 있는 래피즈 cuDF를 통해 모든 개발자는 어디서나 가속화된 데이터 분석을 활용할 수 있다.

엔비디아와 구글은 엔비디아 RTX 그래픽을 사용해 AI PC를 활용하는 파이어베이스 젠킷(Firebase Genkit)에 대한 협업도 발표했다. 이는 개발자가 새로운 젬마 모델 제품군을 비롯한 생성형 AI 모델을 웹과 모바일 애플리케이션에 쉽게 통합해 맞춤형 콘텐츠, 시맨틱 검색(semantic search), 문의에 대한 답변을 제공할 수 있도록 지원한다. 개발자는 로컬 RTX GPU로 작업 줄기(work stream)를 시작한 다음, 작업을 구글 클라우드(Google Cloud) 인프라로 원활하게 이동할 수 있다.

개발자들은 모바일 개발자들이 주로 쓰는 프로그래밍 언어인 자바스크립트(JavaScript)를 사용하는 젠킷으로 앱을 더욱 쉽게 개발할 수 있다.

엔비디아와 구글 클라우드는 AI의 발전을 위해 다양한 분야에서 협력하고 있다. 곧 출시될 그레이스 블랙웰(Grace Blackwell) 기반 DGX 클라우드 플랫폼과 JAX 프레임워크 지원부터 구글 쿠버네티스 엔진(Kubernetes Engine)에 엔비디아 네모(NeMo) 프레임워크 도입까지, 양사의 풀스택(full-stack) 파트너십은 사용자가 구글 클라우드에서 엔비디아 기술을 사용해 AI로 수행할 수 있는 작업의 가능성을 확장하고 있다.

Tweet

#엔비디아, #구글, #인공지능, #딥마인드


케이벤치 많이 본 기사
  [뉴스]팝스타 두아 리파, 삼성전자에 '초상권 침해' 소송… 220억 원 규모
  [기획] 앱 마켓의 경계를 허무는 ‘올인원 스토어’, 원스토어가 제시하는 차세대 플랫폼 비전
  [기획] 멤브레인으로 완성한 조약돌 키보드, COX CM87KD/CM105KD 조약돌
  [기획] 타워형 공랭 쿨러의 진화, 써멀라이트 Peerless Assassin 120 SE EXTREM
  [뉴스]삼성, 엑시노스 기반 ‘갤럭시S26’ 모델에 새로운 ‘3D TIM’ 냉각 기
  [뉴스] 삼성, 실수로 차기 ‘갤럭시 워치9’ 존재 확인
  [뉴스] 전면 디자인 변경 ‘갤럭시 A27’ 삼성 공식 웹사이트서 포착
  [기획] 붉은사막 쾌적 플레이 조건은 GPU, 정답은 SAPPHIRE 라데온 RX 9070 XT NITRO+ OC D6 16G 이엠텍
  [기획] 5만원대 AIO 수냉 쿨러로 핵심만 담아냈다, 마이크로닉스 ICEROCK CL-360
  [뉴스]삼성, ‘갤럭시 A37·A57’ 4월 업데이트 2차 배포 시작
  [기획] AI 에이전트와 온디바이스 AI의 만남, HP가 제시하는 ‘일의 미래’ 청사진과 차세대 AI PC 라인업 및 워크스테이션 공개
  [뉴스] 갤럭시S26 울트라, 최신 업데이트에서 카메라 왜곡 문제 해결
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  서린씨앤아이, 국제인공지능대전 AI EXPO KOREA에서 리드텍 제품군 소개
  디토닉, ‘지능과 속도’ 모두 잡은 핵심 특허 2종 동시 등록
  미루웨어, AI EXPO 2026에 기가바이트, 인피니틱스 AI 솔루션 대거 선보여
  엔비디아, ‘스타워즈: 은하계 레이서’ 등 최신 게임에 DLSS 적용 확대
  에이수스, AI Expo 2026에서 NVIDIA 기반의 AI 솔루션 및 산업용 PC 대거 공개
  인텔리시스, 컨슈머인사이트, 서울대와 '디지털 트윈 패널' 공동 개발 MOU 체결
  AI 전문가들 ‘구글 포 코리아 2026’ 모여 구글의 AI 성과 및 비전 공유
  엔비디아, ‘디아블로 IV: 증오의 군주’ ‘이환’ 등 최신 게임에 DLSS 적용 확대
  엔비디아, 서울대서 ‘빌드 어 클로’ 개최.. 차세대 AI 인재 대상 에이전틱 실습 프로그램 운영
  엔비디아, ‘네모트론-페르소나-코리아’ 공개… 한국형 AI 데이터 활용 기반 확대
  매스웍스, 매트랩 및 시뮬링크 R2026a로 임베디드 시스템 개발에 신뢰할 수 있는 AI 구현
  카카오워크, 대화창에서 바로 번역하는 '실시간 AI 번역' 서비스 도입
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
삼성, 갤럭시S25 시리즈용 'One UI 8.5' 정식 버전 배포 시작
앱 실행 더 빨라지나, MS 윈도우11에 새로운 CPU 부스트 기능 테스트
갤럭시S26 울트라, 최신 업데이트에서 카메라 왜곡 문제 해결
삼성, 최신 폴더블폰 ‘One UI 8.5’ 정식 업데이트 시작
갤럭시S27 울트라, 가변 조리개 탑재 ‘200MP’ 메인 카메라 장착
삼성, 실수로 차기 ‘갤럭시 워치9’ 존재 확인
삼성, 갤럭시S27 시리즈용 ‘One UI 9.5’ 개발 정황 포착
전면 디자인 변경 ‘갤럭시 A27’ 삼성 공식 웹사이트서 포착
삼성 메시지 '미국'만 7월 종료.. 국내 사용자는 영향 없을 듯
삼성, 2세대 ‘갤럭시 링’ 내년 초 출시 목표
뉴스
기사
붉은사막 쾌적 플레이 조건은 GPU, 정답은 SAPPHIRE 라데온 RX 9070 XT NITRO+ OC D6 16G 이엠텍
봄과 함께 턴 오버, 이젠 내 차례 '인텔 코어 울트라 5 250K(F) Plus' 메인스트림 PC 구성 추천
멤브레인으로 완성한 조약돌 키보드, COX CM87KD/CM105KD 조약돌
[현장체험] 일상으로 들어온 웨어러블 로봇, 위로보틱스 '윔(WIM)', 하드웨어를 넘어 '구독형 서비스'로 진화하다
5만원대 AIO 수냉 쿨러로 핵심만 담아냈다, 마이크로닉스 ICEROCK CL-360
더 선명한 듀얼 모드, 485Hz로 진화한 게이밍 모니터, ASUS ROG Strix XG27UCGR
AI 에이전트와 온디바이스 AI의 만남, HP가 제시하는 ‘일의 미래’ 청사진과 차세대 AI PC 라인업 및 워크스테이션 공개
앱 마켓의 경계를 허무는 ‘올인원 스토어’, 원스토어가 제시하는 차세대 플랫폼 비전
타워형 공랭 쿨러의 진화, 써멀라이트 Peerless Assassin 120 SE EXTREM
엘리스그룹, 'AI 풀스택' 전략 공개... K-PMDC로 인프라 자립화 이끈다