인텔의 주요 제품은 컴퓨터의 두뇌 역할을 하는 프로세서이지만, D램은 성능향상에 있어 매우 중요한 구성 요소다. 특히 서버에서는 처리 코어의 수가 메모리 대역폭의 증가 속도를 초과하면서 메모리가 성능에 중요한 영향을 미치고 있다. 기상 모델링, 전산 유체 역학 및 특정 유형의 인공지능(AI)과 같은 고성능 컴퓨팅 작업에서 이러한 불균형은 병목 현상을 유발할 수 있다.
인텔의 데이터 센터 및 AI(DCAI) 그룹 바누 자이스왈 제온 제품 매니저는 “고성능 컴퓨팅 워크로드의 상당 부분이 메모리 대역폭에 의해 제한된 상황에서, MRDIMM은 이러한 작업에 가장 큰 혜택을 제공할 것”라고 설명했다.
데이터센터 작업에 가장 많이 사용되는 메모리 모듈인 RDIMM(고용량 서버용 메모리 모듈)은 최신 프로세서처럼 병렬 리소스를 탑재하고 있지만, 하나의 메모리 칩 세트는 한 랭크에 속하고, 나머지는 다른 랭크에 속한다. RDIMM에서는 데이터가 여러 랭크에 걸쳐 독립적으로 저장되고 접근될 수 있지만, 동시에 접근될 수는 없다.
인텔은 사용하지 않는 병렬 리소스를 합치는 아이디어로 접근했다. DRAM 모듈에 작은 인터페이스 칩인 멀티플렉서(mux)를 추가하는 것으로, 이를 통해 데이터가 같은 시간 단위 내에서 두 랭크의 메모리를 가로질러 흐를 수 있다. mux 버퍼는 각 MRDIMM의 전기 부하를 통합하여 RDIMM에 비해 더 높은 속도로 작동할 수 있도록 하며, 두 랭크의 메모리가 병렬로 접근될 수 있으므로 대역폭이 두 배로 증가하게 된다. 이로 인해최고 대역폭은 6,400 메가트랜스퍼/초(MT/s)에서 8,800 MT/s로 약 40% 상승했다.
인텔은 MRDIMM가 사용 편의성이 높다는 점을 강조하고 있다. MRDIMM은 일반 RDIMM과 동일한 커넥터와 폼 팩터를 사용하며, 심지어 작은 mux 칩도 모듈의 이전 자리와 호환되므로, 메인보드에서 변경이 필요하지 않다. 또한 MRDIMM은 RDIMM과 동일한 오류 수정 및 안정성, 가용성 및 서비스 가능성(RAS) 기능을 모두 제공하며, 데이터 버퍼에서 개별 요청이 아무리 많이 발생하더라도 데이터 무결성이 유지될 수 있다. 따라서 데이터센터 고객은 새 서버를 주문할 때 MRDIMM을 선택하거나, 나중에 해당 서버를 랙에서 빼고 RDIMM을 새 MRDIMM으로 교체할 수 있으며, 새로운 성능을 위해 코드를 변경할 필요도 없다.
MRDIMM는 올해 출시된 인텔 제온 6 프로세서(코드명 그래나잇 래피즈)에 처음 탑재됐다. 최근 테스트에서 동일한 제온 6 시스템에 각각 MRDIMM과 RDIMM을 장착해서 비교한 결과 MRDIMM을 장착한 시스템이 작업을 최대 33% 더 빠르게 완료했다.
미국 국립 양자과학기술원, 국가 핵융합연구소 등 고성능 컴퓨팅 연구소들은 MRDIMM을 지원하는 제온6 P-코어 모델을 적극적으로 채택하고 있으며, NEC와 같은 OEM들이 이를 지원하고 있다.
자이스왈은 “MRDIMM이 제공하는 대역폭의 개선은 소규모 언어 모델과 기존 딥러닝 및 추천 시스템 유형의 AI 워크로드에 매우 적합하며, 이는 제온에서 쉽게 실행할 수 있고 MRDIMM으로 성능을 상당히 향상할 수 있다”고 밝혔다.