씨게이트(Seagate Technology Holdings plc)와 로스 알라모스 국립연구소(Los Alamos National Laboratory)는 효율적인 스토리지 근접 컴퓨팅(Computing near storage)을 공동 개발하기 위한 협력 연구 및 개발 협약(Cooperative research and development agreement, CRADA)을 체결했다.
이 공동 연구 개발은 특히 데이터 보호를 위한 삭제 인코딩(erasure encoding)이 필요한 환경을 위한 것으로, 컴퓨팅 및 스토리지 아키텍처의 지속가능성을 개선하는 것을 목표로 한다. 미국 에너지부 산하에 있는 로스 알라모스 국립연구소는 국가안보, 우주탐사, 재생에너지, 의약, 나노기술, 슈퍼컴퓨터 등 세계 최대 규모 연구소 중의 하나이다.
씨게이트와 로스 알라모스는 스토리지 장치 내부 혹은 전반에서 최적화된 컴퓨팅 기능을 제공하는 개념증명(Proof of concept, PoC) 단계의 고성능 컴퓨팅 아키텍처를 공동개발한다. 이 아키텍처를 통해 컴퓨팅 기능을 삭제 인코딩된 하드 드라이브 단계로 내려 실행할 수 있다. 이를 통해 더 빠르고, 효율적이며 에너지 집약적인 동시에 열에 덜 민감한 데이터 검색이 가능하게 된다.
하드 드라이브는 복원력을 갖춘 스토리지 아키텍처에 도입되기 전, 논리 데이터 파일이나 오브젝트를 데이터 덩어리로 분할하는 삭제 코딩 기술이 적용되어 도입되는 경우가 대부분이다. 이 데이터 덩어리는 여러 드라이브에 걸쳐 분산되어 있고 상호 연관성은 없다. 따라서 맥락에 따른 컴퓨팅 작업을 하는 것이 매우 어려운 경우가 많아 씨게이트와 로스 알라모스가 문제를 해결하기 위해 협력하게 됐다.
로스 알라모스의 과학 연구는 대규모 시뮬레이션 수행을 위해 수백 페타바이트 크기의 적당한 빈도로 사용될 스토리지(웜 스토리지)를 제공할 수 있는 고도의 병렬 디스크 드라이브 기술이 필요하다. 또한 드라이브는 2단계의 삭제 코딩으로 보호되어야 하며, 무작위 및 상관관계가 있는 장애로부터 중요한 데이터를 보호할 수 있어야 한다.
이번 협력을 통해 디스크 장치에 매우 근접한 컴퓨팅 능력을 활용하면 과학적 분석을 위해 검색해야 하는 데이터의 양을 크게 줄일 수 있을지를 확인할 수 있게 될 전망이다. 예를 들어, 연구자들은 물질을 통과하는 충격파의 가장 앞부분만 추적하거나 긴 시뮬레이션에서 고에너지 입자 몇 개의 상태만 추적해도 충분한 과학적 분석이 가능해질 수 있다.