엔비디아(CEO 젠슨 황)는 구글 클라우드(Google Cloud)가 빠르게 확장되고 있는 생성형 AI 애플리케이션 구축 작업을 더욱 가속화하기 위해 새로 출시된 L4 GPU와 버텍스(Vertex) AI를 통합한다고 밝혔다.
프라이빗 프리뷰에서 G2 가상 머신을 제공한다고 발표한 구글 클라우드는 엔비디아의 L4 텐서 코어 GPU를 제공하는 최초의 클라우드 서비스 제공업체(CSP)가 됐다. 대규모 생성형 AI 모델의 구축, 조정, 배포를 지원하는 버텍스 AI에서 최적화된 지원과 함께 L4 GPU를 제공할 예정이다.
개발자는 새로운 애플리케이션을 신속하고 비용 효율적으로 실행하는 데 도움이 되는 최첨단 기술에 액세스할 수 있게 된다. 엔비디아 L4 GPU는 모든 워크로드를 위한 범용 GPU로, L4 GPU의 향상된 AI 비디오 기능은 CPU 대비 120배 높은 AI 기반 비디오 성능과 99% 개선된 에너지 효율성을 제공한다.
구글 클라우드는 생성형 AI 애플리케이션을 제공하는 다양한 기업을 위한 인프라를 제공한다. 대부분의 생성형 AI는 전문가들이 업무를 더 빠르고 효율적으로 수행할 수 있도록 설계됐다. 애플리케이션의 성공적인 실행에 있어 신속한 추론이 핵심적인 역할을 한다.
또한 생성형 AI는 사람들을 연결하고 즐거운 시간을 보낼 수 있도록 도와주는 수많은 새로운 앱의 탄생을 촉진하고 있다. AI 기반 텍스트 투 디지털아트(text to digital art) 변환 앱인 드림(Dream)을 제공하는 웜보(WOMBO)는 구글 클라우드에서 엔비디아의 L4 추론 플랫폼에 대한 얼리 액세스를 이용하고 있다.
디스크립트(Descript)는 크리에이터가 불필요한 단어를 제거하고 자막을 추가하며 몇 번의 클릭만으로 소셜 미디어 클립을 만들 수 있는 AI 기반 편집 기능을 제공한다. 또한 디스크립트의 생성형 AI 음성 복제 기능을 사용하면 타이핑만으로 오디오 실수를 수정하고 전체 보이스오버 트랙을 만들 수도 있다.
엔비디아 L4 GPU는 구글 클라우드에서 비공개 프리뷰로 제공된다. 여기에서 액세스를 신청할 수 있다.
여기서 젠슨 황이 소개하는 생성형 AI용 엔비디아 추론 플랫폼과 구글 클라우드의 통합에 대한 내용이 담긴 GTC 기조연설을 시청할 수 있다.