2025.07.01 (화)

  • 구름많음동두천 27.7℃
  • 흐림강릉 29.4℃
  • 구름조금서울 29.1℃
  • 구름조금대전 30.2℃
  • 맑음대구 32.3℃
  • 연무울산 29.4℃
  • 맑음광주 31.6℃
  • 구름조금부산 26.6℃
  • 구름조금고창 32.1℃
  • 맑음제주 29.6℃
  • 흐림강화 26.9℃
  • 구름많음보은 28.2℃
  • 구름조금금산 30.3℃
  • 구름많음강진군 30.8℃
  • 구름조금경주시 32.9℃
  • 구름조금거제 28.1℃
기상청 제공

[특별기고] DC AI 서비스 증가에 따른 DC 쿨링인프라 진화

엔비디아, DC 액체냉각 미래설계… 액침냉각 전략 구현방향은

DC시장 변화와 AI 영향


최근의 데이터센터(DC)시장은 단순한 수요 증가를 넘어 AI 서비스의 폭발적인 성장에 의해 새로운 차원의 기술적 요구에 직면하고 있다. 특히 고성능 GPU, CPU 칩셋을 기반으로 하는 AI 서버는 기존대비 월등히 높은 전력밀도와 냉각수요를 발생시키며 이에 따른 DC인프라 설계는 기존과는 다른 새로운 접근이 필요하게 됐다. 최근 현장에 도입된 최신 서버랙 전력소비가 20~30kW 수준이지만 조만간 100kW 이상으로 비약할 것으로 예상되면서 단순한 풍량조절만으로는 냉각한계에 직면할 것으로 우려된다.

 

DC 쿨링솔루션 진화와 현황


현재의 DC 냉각방식은 공랭식(Air Cooling)과 수랭식(Liquid Cooling) 하이브리드 형태로 진화하고 있다. 전통적으로 사용되던 CRAC(Computer Room Air Conditioning), CRAH(Computer Room Air Handler) 시스템은 여전히 항온항습 관리를 위한 핵심인프라로 유지되고 있으며 동시에 고열량을 처리하기 위한 리퀴드쿨링 방식 도입도 확대되고 있다. 이러한 흐름은 세 가지 세대로 구분할 수 있다.

 

 

Gen.1: Air cooling + CRAC, CRAH


전통적인 공랭식으로 CRAC·CRAH 장비를 이용한 상면공조 설계방식이다. 이는 ASHRAE 공조설계 가이드에 기반해 설계되며 여전히 중저전력 장비기반 DC에서는 안정적으로 사용되고 있다.

 

Gen.2: RDHx


RDHx(Rear Door Heat Exchanger) 방식은 서버랙 후면에 열교환기를 장착해 랙에서 배출되는 열을 공기 또는 액체로 2차 냉각하는 하이브리드 방식이다. 이는 기존 공조인프라와 병행해 적용 가능하며 에너지효율 향상과 설치공간 절감측면에서 유리한 해법으로 평가받고 있다.

 

Gen.3: Liquid Cooling


리퀴드쿨링 방식으로 D2C(Direct to Chip) 또는 DLC(Direct Liquid Cooling)과 액침냉각(Immersion Cooling)이 있다. D2C는 칩셋(CPU·GPU)에 전용 쿨링라인을 직접연결해 열을 흡수하고 CDU(Coolant Distribution Unit)를 통해 냉각사이클을 구성하는 방식이다. 반면 액침냉각은 서버 전체를 비전도성 냉각액에 담그는 방식으로 모든 면에서 직접냉각이 가능하며 매우 높은 냉각효율(PUE 1.03 이하)을 구현할 수 있다.

 

 

 

리퀴드쿨링 기술적 특성과 전망

 

액체는 우수한 열전도체다. 1기압, 20℃ 조건에서 공기의 열전도율은 약 0.025W/m·K로 낮은 반면 물은 약 0.5918W/m·K로 약 20배 이상의 열전도율을 나타낸다. 이러한 특성은 냉각성능을 극대화하는 데 중요한 역할을 하며 리퀴드쿨링 도입배경을 설명하는 기술적 근거의 핵심이다.


리퀴드쿨링은 대부분 폐쇄루프시스템으로 구성되며 외부공기와의 접촉없이 내부에서 순환하는 구조를 갖는다. 이로 인해 냉각용액의 증발, 오염, 부식 위험이 최소화되며 안정적인 장기운영이 가능하다. D2C방식은 완전히 밀폐된 루프 내에서 냉각액이 이동하며 칩셋으로부터 열을 흡수해 CDU를 통해 냉각된 후 다시 루프를 형성한다. 액침냉각 또한 상부가 열려있는 구조임에도 불구하고 비휘발성 냉각액을 사용해 냉각성능을 유지한다.

 

NVIDIA AI팩토리로 확인한 리퀴드쿨링 미래


엔비디아(NVIDIA)는 ‘AI팩토리’ 전략의 일환으로 고성능 수랭식 서버인프라를 제시하고 있다. 대표적인 시스템인 DGX SuperPOD GB200 NVL72는 36개 CPU와 72개 GPU를 단일랙에 집적해 총 720PFLOPS 연산성능을 제공한다. 해당 랙은 132kW에 달하는 냉각용량이 필요하며 차세대 울트라 루빈(Ultra Rubin) 시스템은 랙당 최대 600kW까지 냉각해야 한다.


조만간 출시 예정인 B100, B200, B300 시리즈는 모두 리퀴드쿨링 기반으로 설계되며 엔비디아는 전용 액침냉각 엔지니어링 팀 구성을 준비하는 등 미래를 대비하고 있다.


이처럼 D2C 기반 CDU 인프라와 액침냉각을 모두 아우르는 하이브리드 전략은 엔비디아가 AI팩토리 표준을 선도하고 있음을 보여준다. 엔비디아시스템 기반인 현재 산업계는 차세대 솔루션에 준비된 자만이 생존가능한 미션크리티컬(Mission Critical)한 영역이다.

 

액침냉각, AI팩토리 구축 ‘대안’


액침냉각은 서버를 전용 비전도성, 비부식성 용액이 채워진 탱크에 완전히 담가 냉각하는 방식으로 냉각효율이 극대화된다. 서버의 모든 면이 냉각액과 직접 접촉하므로 PUE를 1.03 수준까지 낮출 수 있으며 팬 제거로 인한 전력절감, 고장률 감소 등 이점이 있다. 또한 냉각액은 보통 10년 이상 무보수로 사용가능해 유지관리 비용절감에도 기여한다.


액침시스템은 전력효율 측면에서도 우수하다. 예를 들어 200kW 냉각용량을 32℃에서 운용 시 약 5.7kW의 전력만으로 냉각이 가능하다. 서버 팬 제거로 인한 파워세이빙은 10~15%에 달하며 공급수 온도에 따라 동적으로 성능을 제어할 수 있는 시스템도 마련돼 있다. 주요 글로벌 OEM서버 벤더는 자사 제품의 액침화가 가능하도록 대응하고 있으며 하나의 CDU를 통해 전체 시스템의 냉각을 제어할 수 있다.

 

 

 

 

액침냉각분야 글로벌 리딩기업인 GRC에서 사용하는 냉각용액은 비전도성, 무취, 무독성, 무휘발성, 무증발성의 특성을 가지고 있으며 전기·화학적으로 비활성이다. 이 용액은 대부분의 전자기기 및 IT부품과 호환 가능하며 2010년부터 상업적으로 사용돼 안정성이 검증됐다. 또한 국제화재규제기준(IFC)상에서도 별도의 추가 방재조치가 필요 없는 안전성을 갖춘 것으로 평가된다.

 

AI DC 액침냉각 구축 전략


액침냉각기술을 AI DC에 성공적으로 적용하기 위해서는 설비와 IT시스템의 완전한 융합이 절대적으로 요구된다. 이는 곧 시설팀과 IT팀이 유기적으로 협력해야 함을 의미하며 설계부터 구축, 운영, 유지관리까지 전 과정에서 단일화된 컨센서스를 기반으로 전략을 수립해야 한다.


액침냉각시스템은 서버라는 고가 핵심자산을 다루기 때문에 이를 수용할 수 있는 정밀한 제어기술과 안전한 설계를 갖춘 하드웨어 플랫폼이 필수적이다. 이러한 기술력은 대부분 글로벌 특허로 보호되고 있으며 진입장벽 또한 매우 높다. 국내·외 레퍼런스를 확보하지 않고는 시장진입 자체가 어려우며 장비납품 이후에도 커미셔닝, 기술지원, 유지보수 등 폭넓은 사후서비스가 요구되는 만큼 검증된 제조사 및 파트너사와의 협업이 반드시 수반돼야 한다.


액침냉각 사업화에는 ‘Seeing is Believing’ 원칙이 적용된다. 실질적인 성능을 입증할 수 있는 PoC(Proof of Concept), 전시장 내 실시간 데모환경 등을 통해 고객신뢰를 확보하고 냉각제어의 기술적 완성도를 직접 확인할 수 있어야 한다. 이를 통해 국내 AI인프라 산업수준을 한 단계 끌어올릴 수 있는 계기를 마련할 수 있을 것이다.

 

<지형철 에이알시스템 이사>