대규모 프로젝트로 인해 컴퓨터 작업을 해야하는데
상당히 큰 규모라 엄청난 시간을 요한다면? 슈퍼컴퓨터를
구축해야할까? 엄청난 전기세를 감수하고 굉장히 넓은 공간을
들여 떡하니 아시아 몇 위에 들어가는 그러한 것을 두어볼까? 아니면
한국과학정보기술원에 전화해서 잠시만 빌려쓰면 안되겠냐고 물어볼까?
이젠 뭐 꼭 그러지 않아도 될 듯!!
그것은 바로ASUS에서 내 놓은
P6T7 WS SuperComputer가 있기 때문이다. 이 메인보드는 인텔의 최신
프로세서인 모든 '네할렘' 프로세서는 물론 E550X 시리즈의 Xeon 프로세서까지
알아챈다. 7개의 PCI-Express 2 x16슬롯
그리고 3-Way SLI와 CrossFireX지원을 통한 최강의 그래픽 유연성을
제공하며 CUDA 병렬 컴퓨팅 솔루션이 가능해
개인 슈퍼컴퓨터를 구축하는 것이 가능하다.
NVIDIA CUDA 병렬 컴퓨팅 설계는 최고 250배 빠른 컴퓨팅과
그래픽 처리 성능을 발휘해 생명과학, 공학과학, 금융 모델링, 전자공학
설계 자동화 및 가상화 기술의 영역과 같은 고도의 계산 능력이 필요한
영역에서 유용하게 쓰일 수 있다. 그 밖에 6개의 SATA 포트와 2개의
SAS 포트를 가지고 있으며, 보다 뛰어난 하드디스크 성능을 사용하고
싶다면 SAS포트를
사용해 레이드를 구성하는 것도 좋다. 게다가 메모리 확장성 또한 뛰어나다.
DDR3 2000/1866/1600/1333/1066MHz 규격의 메모리를 사용해 최대 24GB까지
확장할 수 있는 6개 슬롯을 가지고 있다. 이 밖에 PC를 켜지 않고도 인터넷이나
이메일 확인 또는 음악이나 사진을 감상할 수 있는 Express Gate 기능도
갖추고 있다.
ASUS P6T7 WS SuperComputer, 이 메인보드는
09년 7월 말 현재, 80만원이 넘는 가격대를 유지하고 있어 개인들의
접근이 조금 힘들 듯 하지만 i7 프로세서 지원과 6개의 DDR3 메모리
슬롯, SLI 및 CrossFire X를 지원하는 그래픽 슬롯을 활용해 일반적으로
보는 슈퍼컴퓨터에 준하는 성능을 구현할 수 있어 꼭 필요한 계층에게는 그리
비싼 가격으로 보이지는 않을 것이다. 아무튼, 도대체 무엇이 이 메인보드가 특별하게
하는지 한 번 살펴보도록 하자.
ASUS P6T7 WS SuperComputer
CPU
Intel Socket 1366 Core i7 Processor Extreme Edition Core i7 Processor LGA1366
socket for Intel Xeon processor 3500 Series LGA1366 socket for Intel Xeon
processor E5502/E5504/E5506 Supports Intel® Dynamic Speed
Technology *Refer to www.asus.com for Intel CPU support list
Chipset
Intel® X58 + ICH10R Nvidia NF200*2
System Bus
Up to 6400 MT/s ; Intel® QuickPath Interconnect
Memory
6 x DIMM, Max. 24 GB, DDR3 2000(O.C.) / 1866(O.C.) /
1800(O.C.) / 1600(O.C.) / 1333 / 1066
ECC,Non-ECC,Un-buffered Memory Triple channel memory architecture *Support
Intel Extreme Memory Profile (XMP) ** Due to Intel spec definition, DIMMs of
DDR3-1800 or above are supported by specific CPU models only. *** Please
load X.M.P or D.O.C.P setting in BIOS for hyper DIMM (DDR3 1800MHz or above)
support." **** Refer to www.asus.com or this user manual for the Memory QVL
(Qualified Vendors Lists)
Expansion Slots
3 x PCIe 2.0 x16 (@ x16 or x8) 3 x PCIe 2.0 x16 (@ x8) 1 x PCIe 2.0 x16
(@ x16)
Multi-GPU Support
Supports NVIDIA® 3-Way Geforce SLI™ techonology
Storage
Intel ICH10R controller 6 xSATA 3 Gb/s ports Intel®
Matrix Storage Support RAID 0,1,5,10 Ext Marvell 88SE6121 SATA
controller 2 x eSATA 150/300 (RAID 0,1)* Ext Marvell
88SE6320 SAS controller 2 x SAS (RAID 0,1)*
LAN
2 x Realtek 8111C Dual Gb LAN (Support teaming function)
USB
12 x USB 2.0 ports
IEEE 1394
VIA VT6315N controller supports 1 x 1394a ports
Audio
ADI 2000B 8 -Channel High Definition Audio CODEC ASUS Noise
Filter Multi-Streaming Jack-Sensing Front Panel Jack-Retasking
Coaxial / Optical S/PDIF out ports at back I/O
Back Panel I/O Ports
2 x External SATA 1 x S/PDIF Out (Coaxial + Optical) 2 x LAN(RJ45) port
6 x USB 2.0/1.1 8-Channel Audio I/O PS/2 KB/MS port
Internal I/O Connectors
24-pin EATX Power connector 8-pin ATX +12V Power connector Chassis
intrusion CPU fan with PWM control Chassis fan1 with Q-fan control
Chassis fan2 with Q-fan control Chassis fan3 with Q-fan control PWR
fan CD audio in 3 x USB connectors support additional 6 USB ports
20-pin Panel connector 1 x IEEE 1394a port TPM header S/PDIF Out
header Front panel connector
Form Factor
CEB Form Factor, 12" x 10.5" (30.5cm x 26.9cm)
사용 가능한
CPU로는 인텔 LGA1366 소켓의 모든 코어 i7 CPU와 LGA1366
소켓의 Xeon 3500시리즈, Xeon E5502/E5504/5506이 있다.
사용 목적이
목적이니만큼 전원부 구성부터가 빵빵하다. 16+2 페이즈 전원부는 어떠한
상황에서든지 안정적인 전원을 공급해 줄 것이다. 또한 EPU 프로세서를
통해 전력부 자동 전력 조절 기능으로 최소 전력만을 필요로 하는 인터넷
및 워드와 같은 가벼운 프로그램 실행 시에는 전력량을 적게, 반면,
포토샵 및 3D 게임 등 CPU를 많이 사용하는 프로그램 실행 시에는 원래의
전력으로 되돌려 주어, 전력 사용량에 있어 약 40% 더 연장된 사용 시간을
제공한다.
Intel
X58 IOH는 6,4GT/s(3.2GB/s)까지 지원하는 시스템 버스
구조인 QPI기술과 SMT 기술을 지원한다. QPI는
Quick-path Interconnect의 약자로 '빠른(Quick) 전송 통로(path)를
통해 상호 연결(interconnect)된다는 의미다. FSB를
대신하는 메인보드의 노스브릿지를 거치지 않고 CPU로 직접 데이터 전송이
가능한 사용 가능한 새로운 시스템이다. 물론 그래서 CPU가 조금
커졌다. ICH 10R은
최고 3.0Gb/s의 데이터 전송 속도를 가지는 6개의 SATAII 포트를 지원하고
있다.
▲
인텔 코어 i7의 신기술 QPIQuick Path Interconnect, 그 동작원리는?
PCI-Express 2.0 딱 7개만, ASUS P6T7 WS SuperComputer메인보드에는
PCI-Ex 2.0 외에 다른 슬롯은 전혀 준비되어 있지 않다. 총 7개의 슬롯 중 파란색의 넷은 NF200을 통해 확장한 16레인 슬롯이며, 검은색의 3개 슬롯은 스위칭 로직을 사용해 각각 8배속을 지원하게
만들었다. 이렇게 해서 풀 사이즈 규격의 PCI-Express 슬롯을 모두 7개나 마련했고, SLI 및 CrossFire X를 지원한다. 물론,
SLI의 경우는 쿼드 SLI는 듀얼 GPU 카드를 SLI로 묶는 경우만 해당되고 싱글 GPU카드의 경우에는 트리플 SLI까지만 구성할 수
있으므로 '각 슬롯에 GTX285를 끼워 쿼드!' 같은 것은 불가능하다. 하지만 SLI를 구성하지 않더라도 여러 장의 그래픽 카드에 의한 멀티
모니터 시스템 구축 같은 경우에 보다 유연성이 있음은 분명해보인다.
하지만 P6T7 WS SuperComputer의 진짜
존재 이유는, CUDA 병렬 컴퓨팅 기술!
드디어
기다리고 기다리던 이 메인보드의 포인트 부분이다. 만약에 당신이 사용하고 있는 컴퓨터보다
20~30%의 성능 우위를 보인다하면 비용적 측면을 생각해서 컴퓨터를
교체할지 말지에 대한 고민을 할 것이다. 하지만 2~3배가 빨라 진다면
심각하게 고민을 하고 궁극적으로는 컴퓨터를 교체할 것이다. 그런데
100~200배까지 빨라진다면? 답은 바로 이 CUDA 병렬 컴퓨팅 기술에
있다. 막대한 병렬 컴퓨팅 능력을 자랑하는 오늘 날의 GPU는 Hight Performance
Computing(HPC)에 있어 가장 적합한 솔루션이다. CPU는 operating system,
task 처리와 같은 순차적인 업무를 위주로, GPU는 massive한 data를
처리하게 된다. GPU는 CPU대비 10배 가까운 메모리 인터페이스 속도와
240개의 core에서 동시에 데이터를 처리 함으로서 최대 200배 이상으로
계산 속도를 높일 수 있다.
그래서 ASUS P6T7 WS SuperComputer 메인보드에서는 3개의
Nvidia Tesla 카드와 1개의 Nvidia FX5800를 사용하면 960개의 코어를
활용할 수 있다. 그렇다면 도대체 성능은? 물론 그냥 그래픽 카드로
SLI나 CF를 구성해서 써도 무방하다. 그러기엔 이 메인보드는 PCI-Ex
2.0만 마련되어 있어 평범하게 사용하기엔 조금 곤란할 것이다. 아무튼.. 이어서
Single precision
1 Tera Flops 성능을 갖는 Tesla C1060을 Desk Top workstation PCIeX16에
4대를 장착한다면 내 책상에서 4 Tera Flops의 슈퍼 컴퓨팅이 가능하다.
한국과학기술정보연구원 (KISTI)에서 운영하던 퇴역슈퍼컴인 3호기의
성능이 7 Tera정도였던 것을 감안하면 어느 정도인지 감이 올 것이다.
CUDA에 대한 이해 H.264 encoding with Hetergeneous computing에
이해를 돕기 위한 영상으로써 모든 것들이 꼭 위와 같은 동영상처럼
처리된다는 것은 아니지만 대략 이런 개념이 적용되어 빠른 동작이 가능하다는
것을 알아두면 되겠다.
테슬라를 도입하면 효율적인 공간 이용을
할 수 있게 된다. 만약, 100Tera Flops의 데이터 센터를 구축하고자
할 때, 기존의 CPU server만을 사용했을 때 대비 대략 1/20 정도의 효율성을
가져다 준다. CPU 1U server 1,429대가 필요했던 것이 Heterogeneous
Computing 방식을 사용하게 된다면 50대의 1U rack으로 동급의 성능을
낼 수 있게 되기 때문이다. 이로써 엄청난 전기세를 절약할 수 있게
되어 요즘 유행처럼 번지고 있는 그린IT에도 부합한다. 현재 데이터
센터에 테슬라로 도배를 한다면?? 음..
DDR3 2000/1866/1600/1333/1066MHz
규격의 메모리를 최대 24GB까지 쓸 수 있다. 듀얼 채널이나 트리플 채널이
구성 가능하지만, 아직은 많이 비싼 가격대라는 것..
Intel ICH10R 컨트롤러를 통해 제공되는 6개의 SATA포트(파란색)는
3Gb/s의 속도를 내며, 이를 통해 다양한 레이드 옵션을 사용할
수 있다. RAID 0, 1, 0+1 그리고 JBOD를 지원한다.
Marvell 88SE6320 바로 이것이 2개의 SAS포트(검은색)를 지원하는 칩셋이다.
RAID 0/1을 지원하며, 보다 빠른 속도와 안정성 그리고 든든한 내구성을
필요로 하는 경우 활용할 수 있다. SAS용 HDD는 일반적으로 사용하는
SATA HDD에 비해 더 많은 이점을 가지고 있다. 일반 SATA HDD가 7200rpm인데
비해 SAS HDD는 7200/1000/15000rpm까지 나와있으며, MTBF(장비의 정상 작동 시간과 고장 발생 시간 사이의 평균 시간)
또한 SATA HDD에 비해 월등하게 좋은 편으로 이론상으로 약 3배 이상
오래 사용 가능하다.
Marvel 88SE6121은 두 개의 3Gb/s의 속도를 내는
eSATA를 제공하는 칩셋으로 RAID 0 그리고 1을 지원한다.
그 밖에 리얼텍 RTL8111C
칩을 2개 사용해 10/100/1000Mb/s의 듀얼랜 기능을 사용할 수 있지만
이런 고가의 메인보드에 리얼텍이 사용된거는 조금 아쉬운 부분이다.
Fanless Heat-pipe Design, 이것은 ASUS P6T7 WS SuperComputer에서
찾아볼 수 있는 특징 중 하나이다. 큼직한 방열판과 히트파이프를
통해 굳이 시끄럽게 쿨링팬을 돌리지 않아도 전원부는 물론 2개의 NF200칩셋
그리고 ICH/MCH 칩셋까지 식혀주는 구조를 갖추고 있다. SuperComputer라고
각인되어 있는 큼직한 방열판이 NF200과 ICH/MCH를 식히는 부분이다.
이 밖에도
부팅하지 않고도, 윈도우없이도 5초 만에 인터넷과 멀티미디어 기능을
사용할 수 있는 Express Gate 기능도 갖추고 있다. 그래서 많은 사람들이
사용하는 MSN, SKYPE, Google Talk, QQ, 그리고 Yahoo Messanger를 통해
소중한 친구들과 대화할 수 있다. 물론, 사진을 보는 것도 가능하다.
단, 편집은 안된다는 것.
▲
CUDA 활용 예
실제로, CUDA는 그리 먼 곳에 있는 이야기가
아니다. 현재 활발하게 연구 및 개발이 되고 있는 상태이며, 적게는
몇 배 많게는 몇 백배까지 성능 향상을 꾀하고 있다. CUDA를 지원하는
고성능의 최신 그래픽카드를 가지고 있다면 단순히 PC게임의 프레임
수가 몇 나오는지에만 치중하지 말고 이 쪽에 대한 관심을 가질 때다.
아는만큼 앞서나가는 것이니까. - 케이벤치 이남재 기자