English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

엔비디아, 실시간 대화형 AI 지원하는 텐서RT 최신 버전 공개

2019/12/19 10:00:08

엔비디아(CEO 젠슨 황)가 실시간 대화형 AI를 지원하는 추론 소프트웨어의 최신 버전인 엔비디아 텐서RT 7(NVIDIA TensorRT 7)을 발표했다. 이는 전세계 개발자들이 대화형 AI 애플리케이션을 제공하는데 사용되어, 그간 인간과 AI간 상호작용에 걸림돌이 됐던 추론 레이턴시(지연시간)를 크게 개선할 것으로 기대된다.

 

엔비디아 텐서RT 7은 엔비디아의 7세대 추론 소프트웨어 개발 키트로, 보다 스마트한 인간과 AI간 상호작용을 가능케 해, 음성 에이전트(voice agent), 챗봇, 추천 엔진 등의 애플리케이션을 실시간으로 구현할 수 있게 됐다.

미국 시장조사기관 주니퍼 리서치(Juniper Research)에 따르면, 전세계 디바이스에서 약 32억5천만 개의 디지털 음성 비서가 사용되고 있는 것으로 추정된다. 2023년까지 그 숫자가 세계 총 인구 수를 뛰어 넘는 80억 개까지 증가할 것으로 예상된다.

 

텐서RT 7은 AI 음성 애플리케이션을 구현하는데 필요한 트랜스포머(transformer) 기반 RNN(Recurrent Neural Network, 순환신경망)을 자동으로 최적화하고 가속화하도록 설계된 최신 딥 러닝 컴파일러를 제공한다. 이를 통해, 대화형 AI의 구성요소가 CPU에서 실행될 때 보다 10배 이상 빨라진다. 동시에, 지연시간은 실시간 상호작용에 필요한 수준인 300 밀리 초 임계값 미만으로 단축된다.

텐서RT 7은 RNN이라는 순환 루프 구조(recurrent loop structures)를 사용하는 시계열(time-series) 시퀀스 데이터 시나리오(sequence-data scenarios)를 예측하는 용도로 활용되는 AI 모델 세계가 더 빠르게 확장될 수 있도록 지원한다. RNN은 대화형 AI 음성 네트워크 외에도 차량이나 위성의 도착 시간 계획, 전자 의료 기록에 기입될 상황 예측, 금융자산 예측, 사기행위 감지 등의 목적에도 사용될 수 있다.

RNN 구성과 기능이 결합되는 상황이 폭발적으로 증가하면서, 실시간 성능 기준을 충족하는 생산 코드(production code)를 빠르게 배포해야 하는 상황이 발생하게 됐다. 이로 인해 업무를 진행하는데 수개월이 지연되고 개발자들은 코드 최적화 작업을 수동으로 해야 했다. 그 결과, 대화형 AI 실행능력을 갖춘 소수 업체들만 대화형 AI를 구현할 수 있었다.

 

텐서RT의 최신 딥 러닝 컴파일러를 통해, 전세계 개발자들은 맞춤형 자동 음성인식 네트워크와 텍스트-투-스피치(text-to-speech)용 웨이브RNN(WaveRNN)과 타코트론 2(Tacotron 2) 등의 네트워크를 자동 최적화할 수 있는 능력을 갖추게 됐고, 이를 통해 최고 수준의 성능을 최저 지연시간에 제공할 수 있게 됐다.

이 최신 컴파일러는 BERT와 같은 자연어 처리용 트랜스포머를 최적화하는 기능도 제공한다.

 

텐서RT 7은 하이퍼스케일 데이터 센터, 내장형 또는 자동차용 GPU 플랫폼을 통해 훈련된 추론 신경망을 빠르게 최적화, 검증, 배포할 수 있다.

텐서RT를 비롯한 여러 엔비디아 쿠다-X AI 라이브러리(NVIDIA CUDA-X AI libraries), 엔비디아 GPU 등이 포함된 엔비디아 추론 플랫폼은 이미지 분류, 사기 탐지, 분할, 오브젝트 탐지, 추천 엔진 등 저지연, 고처리량 추론 기능을 대화형 AI 이외의 애플리케이션에서도 구현한다.

엔비디아 추론 플랫폼은 알리바바(Alibaba), 아메리칸 익스프레스(American Express), 바이두(Baidu), 페이팔(PayPal), 핀터레스트(Pinterest), 스냅(Snap), 텐센트(Tencent), 트위터(Twitter) 등 세계적인 선도 엔터프라이즈 및 소비자 기술 기업들 사이에서 널리 사용되고 있다.

Tweet

#엔비디아


케이벤치 많이 본 기사
  [기획] 앱 마켓의 경계를 허무는 ‘올인원 스토어’, 원스토어가 제시하는 차세대 플랫폼 비전
  [뉴스] 삼성 갤럭시 A54, One UI 8.5 베타 2차 업데이트 공개
  [기획] 멤브레인으로 완성한 조약돌 키보드, COX CM87KD/CM105KD 조약돌
  [기획] 더 선명한 듀얼 모드, 485Hz로 진화한 게이밍 모니터, ASUS ROG Strix XG27UCGR
  [기획] [현장체험] 일상으로 들어온 웨어러블 로봇, 위로보틱스 '윔(WIM)', 하드웨어를 넘어 '구독형 서비스'로 진화하다
  [기획] 붉은사막 쾌적 플레이 조건은 GPU, 정답은 SAPPHIRE 라데온 RX 9070 XT NITRO+ OC D6 16G 이엠텍
  [기획] 봄과 함께 턴 오버, 이젠 내 차례 '인텔 코어 울트라 5 250K(F) Plus' 메인스트림 PC 구성 추천
  [뉴스] 삼성, 갤럭시S27 시리즈용 ‘One UI 9.5’ 개발 정황 포착
  [뉴스] 삼성, 실수로 차기 ‘갤럭시 워치9’ 존재 확인
  [뉴스] 삼성, 최신 폴더블폰 ‘One UI 8.5’ 정식 업데이트 시작
  [뉴스] 갤럭시S27 울트라, 가변 조리개 탑재 ‘200MP’ 메인 카메라 장착
  [뉴스] 갤럭시S26 울트라, 최신 업데이트에서 카메라 왜곡 문제 해결
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  엔비디아, ‘스타워즈: 은하계 레이서’ 등 최신 게임에 DLSS 적용 확대
  에이수스, AI Expo 2026에서 NVIDIA 기반의 AI 솔루션 및 산업용 PC 대거 공개
  엔비디아, ‘디아블로 IV: 증오의 군주’ ‘이환’ 등 최신 게임에 DLSS 적용 확대
  엔비디아, 서울대서 ‘빌드 어 클로’ 개최.. 차세대 AI 인재 대상 에이전틱 실습 프로그램 운영
  엔비디아, ‘네모트론-페르소나-코리아’ 공개… 한국형 AI 데이터 활용 기반 확대
  엔비디아, ‘네모트론 디벨로퍼 데이즈 서울 2026’ 성료
  엔비디아, ‘네모트론 디벨로퍼 데이즈 서울 2026’ 개최
  엔비디아 ReSTIR PT Enhanced 공개, 패스트레이싱 성능 최대 3배 향상
  기가웨이브, 엔비디아 '빌드 어 클로' 행사에서 기가바이트 AI TOP ATOM 실물 전시, 시스템 구축 상담 및 예약 판매 진행
  슈퍼솔루션, NVIDIA HGX B300 공랭식 서버 재고 확보로 안정적 공급망 강화
  엔비디아, ‘빌드 어 클로’ 세계 최초 한국 상륙… AI 에이전트 직접 만든다
  엔비디아, 실용적 양자 컴퓨팅 가속 위한 세계 최초 오픈 AI 모델 ‘아이징’ 발표
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
삼성, 갤럭시S25 시리즈용 'One UI 8.5' 정식 버전 배포 시작
삼성, 안드로이드 17 기반 One UI 9 내부 테스트 확대
삼성 갤럭시 A54, One UI 8.5 베타 2차 업데이트 공개
삼성, 최신 폴더블폰 ‘One UI 8.5’ 정식 업데이트 시작
갤럭시S27 울트라, 쿼드 카메라 -> 트리플 카메라 변경 유력
갤럭시S26 울트라, 최신 업데이트에서 카메라 왜곡 문제 해결
애플, 베젤리스 쿼드 커브드 디스플레이 ‘아이폰19 프로’ 시리즈에 적용
갤럭시S27 울트라, 가변 조리개 탑재 ‘200MP’ 메인 카메라 장착
삼성, 실수로 차기 ‘갤럭시 워치9’ 존재 확인
삼성, 갤럭시S27 시리즈용 ‘One UI 9.5’ 개발 정황 포착
뉴스
기사
붉은사막 쾌적 플레이 조건은 GPU, 정답은 SAPPHIRE 라데온 RX 9070 XT NITRO+ OC D6 16G 이엠텍
[현장체험] 일상으로 들어온 웨어러블 로봇, 위로보틱스 '윔(WIM)', 하드웨어를 넘어 '구독형 서비스'로 진화하다
봄과 함께 턴 오버, 이젠 내 차례 '인텔 코어 울트라 5 250K(F) Plus' 메인스트림 PC 구성 추천
멤브레인으로 완성한 조약돌 키보드, COX CM87KD/CM105KD 조약돌
5만원대 AIO 수냉 쿨러로 핵심만 담아냈다, 마이크로닉스 ICEROCK CL-360
더 선명한 듀얼 모드, 485Hz로 진화한 게이밍 모니터, ASUS ROG Strix XG27UCGR
AI 에이전트와 온디바이스 AI의 만남, HP가 제시하는 ‘일의 미래’ 청사진과 차세대 AI PC 라인업 및 워크스테이션 공개
앱 마켓의 경계를 허무는 ‘올인원 스토어’, 원스토어가 제시하는 차세대 플랫폼 비전
타워형 공랭 쿨러의 진화, 써멀라이트 Peerless Assassin 120 SE EXTREM
엘리스그룹, 'AI 풀스택' 전략 공개... K-PMDC로 인프라 자립화 이끈다