2026.01.14 (수)

  • 흐림동두천 -12.5℃
  • 구름조금강릉 -5.2℃
  • 맑음서울 -9.0℃
  • 맑음대전 -6.6℃
  • 맑음대구 -3.9℃
  • 맑음울산 -3.8℃
  • 구름많음광주 -3.2℃
  • 맑음부산 -1.1℃
  • 맑음고창 -5.4℃
  • 맑음제주 2.7℃
  • 흐림강화 -11.6℃
  • 맑음보은 -9.3℃
  • 맑음금산 -7.5℃
  • 구름많음강진군 -2.9℃
  • 맑음경주시 -5.9℃
  • 맑음거제 -0.3℃
기상청 제공

엔비디아, 하이퍼스케일 AI DC 특화 GPU '루빈' 발표

기존 '블랙웰' 대비 TDP 2.6배 증가… 고발열 대응 시급
2026년 하반기 루빈 기반 제품 출시 예정

 

엔비디아는 1월6일 미국 라스베이거스 CES 2026 기조연설을 통해 차세대 AI GPU ‘NVIDIA Rubin(루빈)’ 플랫폼을 출시한다고 밝혔다. 차세대 GPU인 '루빈 울트라'의 열설계전력(TDP)은 전작 '블랙웰 울트라'보다 최대 2.6배 증가한 3600W에 달할 것으로 예상되며 발열량 해소를 위한 냉각솔루션의 중요성이 더욱 높아질 전망이다.

 

루빈 플랫폼은 첨단 AI 슈퍼컴퓨터를 위해 설계된 신규 칩 6종으로 구성되며 세계 최대규모 최첨단 AI시스템을 구축·배포하고 보안을 강화한다.

 

루빈 플랫폼의 6개 칩에는 △NVIDIA Vera CPU △NVIDIA Rubin GPU △NVIDIA NVLink™ 6 스위치 △NVIDIA ConnectX®-9 SuperNIC △NVIDIA BlueField®-4 DPU △NVIDIA Spectrum™-6 이더넷 스위치 등이 포함된다.

 

또한 △NVLink 인터커넥트 기술 △트랜스포머 엔진 △컨피덴셜 컴퓨팅 △RAS 엔진 △NVIDIA Vera CPU 등 5개의 혁신 기술을 도입했다. 이는 에이전틱 AI·고급추론·대규모 전문가 혼합방식(MoE) 모델 추론을 가속화해 토큰당 비용을 NVIDIA Blackwell 플랫폼대비 10배 절감시킨다. 또한 NVIDIA Rubin 플랫폼은 MoE 모델 훈련에 필요한 GPU 개수를 이전대비 4배 절감해 AI 도입을 가속할 전망이다.

 

루빈은 기가스케일 규모의 추론 컨텍스트 확장을 위해 새로운 종류의 AI 네이티브 스토리지 인프라인 ‘NVIDIA 추론 컨텍스트 메모리 스토리지 플랫폼’을 도입했다.

 

플랫폼은 NVIDIA BlueField-4로 구동되며 AI 인프라 전반에 걸쳐 키밸류 캐시데이터를 효율적으로 공유하고 재사용하도록 지원한다. 이는 반응성과 처리량을 크게 향상시키며 예측가능하며 전력효율적인 AI에이전틱 확장을 제공한다.

 

최근 많은 AI 팩토리가 베어메탈·멀티테넌트 배포모델을 채택하며 강력한 인프라제어 유지·격리가 부각되고 있다. BlueField-4는 ‘고급보안 신뢰자원 아키텍처(ASTRA)’를 도입해 성능저하 없이 대규모 AI환경을 안전하게 격리·운영할 수 있도록 한다.

 

NVIDIA Vera 루빈 NVL72는 NVIDIA Rubin GPU 72개, NVIDIA Vera CPU 36개, NVIDIA NVLink 6, NVIDIA ConnectX-9 SuperNIC, NVIDIA BlueField-4 DPU를 결합해 안전한 통합시스템을 제공한다.

 

또한 Rubin GPU 8개를 NVLink로 연결해 x86 기반 생성형 AI 플랫폼을 지원하는 HGX Rubin NVL8 플랫폼 서버 보드를 제공한다. HGX Rubin NVL8 플랫폼은 AI와 고성능컴퓨팅 워크로드를 위한 훈련·추론·과학 컴퓨팅 워크로드를 가속화할 전망이다.

 

루빈은 현재 본격 양산단계에 있으며 루빈 기반 제품은 2026년 △AWS △구글 △마이크로소프트 △OCI를 비롯한 파트너사를 통해 출시될 예정이다.

 

젠슨 황 엔비디아 CEO는 “AI 훈련과 추론을 위한 컴퓨팅 수요가 어느때보다도 급증하고 있는 가운데 루빈의 등장은 매우 시의적절하다”라며 “엔비디아는 매년 차세대 AI 슈퍼컴퓨터를 선보이고 있으며 6개 칩에 고도의 공동설계를 적용한 루빈은 AI의 새로운 지평을 향해 비약적인 발전을 이룰 것”이라고 밝혔다.