9. GPU 병렬컴퓨팅-비디오 트렌스코딩,폴딩@홈
이번 페이지에서 소개할 테스트 결과는 GPU 병렬 컴퓨팅을 이용한 비디오 트렌스코딩
작업과 스탠포드 대학이 진행하고 있는 단백질 연구를 위한 프로젝트인 폴딩@홈에서의
처리 능력을 비교한 결과이다. 두작업 모두 CPU가 아닌 GPU로 처리하는 작업이지만
비디오 트렌스코딩의 경우 지포스 GTX 280에서몬 동작하도록 제한된 프로그램을 사용했기
때문에 그래픽카드간 비디오 트렌스코딩 능력은 비교하지 못했다.
GPU 병렬 컴퓨팅 - 비디오 트렌스코딩 작업
비디오 트렌스코딩 작업에 사용한 프로그램은 Elemental Technologies가 개발한
쿠다 기반의 badaboom 미디어 컨버터이다. 이 프로그램은 GPU 기반으로 인코딩 작업을
처리할 수 있는 어도비 프리미어용 H.264 인코딩 플러그인 RapiHD™ H.264/AVC를
일반 유저들이 사용하기 쉽도록 만든 비디오 컨버터 프로그램이다.
엔비디아의 쿠다 기반으로 제작되어 지포스 8, 9, 200 시리즈 모두를 지원할 수
있지만 아직까진 지포스 GTX 200 시리즈만 지원하도록 되어 있다. 이 결과는 GPU를
이용한 비디오 트렌스코딩 작업과 CPU를 이용한 기존 방식과의 작업 시간 차이를
비교한 것이다.
테스트에 사용한 원본 소스는 MPEG-2 포맷의 720P 영상과 1080P
영상이다. 720P 영상의 재생 시간은 1분 50초이며 1080P 영상의 재생시간은 30초이다.
이 작업은 MPEG-2 포맷으로 만둘어진 두 영상을 휴대용 게임기인 소니의 PSP에서
재생할 수 있도록 H.264 포맷의 640x360 영상으로 변환하는 작업을 비교한 것으로
CPU로 처리한 작업에는 TMPGEnc 4.0 Xpress와 X264 인코더를 사용했다.
결과를 보면 같은 CPU로 처리한 트렌스코딩 작업일지라도 인코더에
따라 작업 시간에 많은 차이가 있는 것으로 나타났지만 가장 빨리 작업을 처리한
TMPGEnc 4.0 Xpress의 작업시간도 GPU로 처리하는 badaboom 미디어 컨버터의 작업
시간을 따라가지는 못하는 것으로 나타났다. 고화질 영상일수록 그 차이는 더 커진다고
볼수 있다.
필자가 사용한 badaboom 미디어 컨버터가 완성버전이 아닌 베타
버전이고 많은 제약이 있어 다양한 테스트를 진행할 수 없었지만 지금의 결과만으로도
비디오 에디팅 작업에 많은 도움을 줄 수 있을 것으로 생각된다. GPU 병렬 컴퓨팅을
지원하는 비디오 트렌스코딩 프로그램은 Elemental Technologies 이외에도 여러 업체에서
개발중인 것으로 알고 있다. 어도비도 포토샵 뿐만 아니라 자사가 제공하는 여러
솔루션에 GPU 병렬 컴퓨팅을 도입할 것으로 알고 있다.
폴딩@홈으로 GPU 병렬 컴퓨팅 성능 비교
CPU와 그래픽카드 그리고 게임기까지 지원할 수 있는 스탠포드 대학의
단백질 접힘 연구를 위한 폴딩@홈프로젝트는 GPGPU와 GPU 병렬 컴퓨팅을 대표하는
대표적인 프로젝트이다. 이 프로젝트는 기본적으로 네트웍상에 연결되어 있는 PC의
사용하지 않은 자원을 이용해 단백질을 분석하도록 만든 것이지만 보다 높은 컴퓨팅
환경을 이용할 수 있도록 셀/BE 프로세서 기반의 PS3 뿐만 아니라 PC의 그래픽카드로도
작업을 처리할 수 있도록 만들어 놨다.
그래픽카드로 연산을 처리하는 GPU 기반의 컴퓨팅은 AMD에서 먼저
지원하고 나섰지만 GPU 병렬 컴퓨팅에 앞장선 엔비디아도 폴딩@홈 프로젝트에 동참한다고
발표한 상태다. 아직까지 엔비디아 GPU를 위한 클라이언트가 정식으로 공개되지 않았지만
GT200 GPU를 위한 버전은 이미 미디어에게 제공된 상태다.
필자도 GT200의 GPU 컴퓨팅 능력을 확인하기 위해 비디오 트렌스코딩
작업에 이어 폴딩@홈 클라이언트도 지포스 GTX 280의 연산 능력을 확인해봤는데 다음과
같은 결과가 나타났다.
위의 결과는 실시간으로 표현되는 하루단위의 연산 능력을 비교한
것이다. 원래 GT200 GPU를 위해 제공된 폴딩@홈 클라이언트는 지포스 GTX 200 시리즈용
드라이버인 Forceware v177.34에서만 동작하게되어 있어 기존 버전으로는 컴퓨팅
성능을 확인할 수 없었지만 Forceware v177.34 드라이버를 수정해 지포스 9800 시리즈에
설치한 후 테스트에 사용한 모든 그래픽카드의 GPU 컴퓨팅 능력을 비교할 수 있었다.
결과는 지포스 GTX 280이 최대 570ns/Day의 컴퓨팅 능력을 보였고
기존 제품인 지포스 9800GTX가 470ns/Day의 컴퓨팅 능력을 보였는데 이 결과는 엔비디아가
소개한 폴딩@홈에서의 컴퓨팅 성능 결과와 비슷한 결과이다.
MSI N280GTX T2D1G는 700Mhz의 코어클럭과 1400Mhz의 Shader 클럭덕분에
650ns/Day의 컴퓨팅 성능을 보여줬다.