DC ‘FWU 트렌드’ 뚜렷… 쿨링효율 바람타고 확산

  • 등록 2024-10-14
크게보기

고발열 랙 공랭식 고효율 솔루션 주류 등극
N+m 다중화 모듈식 구성 가능… 안정성 향상
고효율‧인버터제어 EC모터 탑재로 효율극대화

 

데이터센터(DC) 쿨링시스템으로 가장 많이 사용되는 것은 공랭식이다. 공랭식시스템 가운데 기존 CRAH, CRAC에 비해 공간활용도가 높고 많은 부하를 처리할 수 있는 FWU(Fan Wall Unit)시스템이 최신 쿨링시스템 대세로 자리잡고 있다.


HPC, AI DC 등을 중심으로 첨단DC는 수랭식이 적용되며 전망이 밝지만 사실상 이는 프론티어 프로젝트와 같은 선도적 사례의 경우이며 대부분은 팬월(Fan Wall)이 적용되고 있다. 이번 기획에서는 FWU 특장점 시장동향, 주요 시장플레이어 및 각 기업별 특장점에 대해 짚어본다.

 

랙부하 증가, 고성능 공랭시스템 요구
Chat GPT 등 오픈 AI가 산업 전반에 새로운 열풍을 일으키며 DC업계가 즐거운 비명을 지르고 있다. 그러나 AI용 DC구축과 이에 따른 막대한 전력소비가 불가피하기 때문에 미래를 낙관하기만은 어려운 실정이다.


특히 그래픽처리장치(GPU), 중앙처리장치(CPU) 등 연산장치가 천문학적 분량의 AI용 데이터를 연산할 때 내뿜는 열은 상상을 초월한다.


최근 DC는 급격한 랙밀도 상승을 보인다. 2019년 이전 랙밀도가 2~5kW였다면 2020년 이후 추세는 7~15kW를 나타내고 있으며 HPC(High Performance Computing)시설의 경우 37~40kW를 사용하고 있다. 이는 최근 트렌드인 AI, 자율주행, 스트리밍서비스 등 다양한 사용처에 따른 부하가 높아지고 있기 때문으로 향후 랙밀도는 지속 상승할 전망이다.


이에 따라 DC 총 사용전력의 약 45%가 DC 열을 식히는 쿨링에 사용돼야 한다. 이는 총 전력에서 서버전력을 줄일 수밖에 없는 딜레마로 작용하고 있다. 결국 냉각시스템의 효율성이 사업성패를 좌우하는 중요한 기로에 있다.


향후 고발열 서버냉각을 위한 다양한 쿨링솔루션을 적용하는 추세로 바뀔 것으로 예상되며 이러한 현상은 서버실 쿨링방법론으로 이어져 이중바닥 공기순환 방식에서 FWU방식으로 필연적으로 전환될 수밖에 없는 기술적 변화가 수반됐다. 이에 따라 FWU 또한 수요가 꾸준히 증가하고 있다.

 

 

 

FWU, 운영비‧유지관리‧확장성 강점
일반적으로 DC에서 FWU를 적용할 때 누릴 수 있는 장점은 에너지효율성이다. 데이터홀 여러 영역에서 온도를 동적으로 관리하면서 목표에 맞는 효율적인 공기흐름을 제공할 수 있다. 이러한 최적 접근방식은 에너지소비를 낮추며 비용을 절감할 수 있다.


또한 이중화 및 신뢰성 강화도 강점이다. 모터고장은 기존 냉각시스템을 손상시키지만 이중화로 설계된 FWU는 유지보수를 위해 팬을 종료하는 동안 나머지 팬이 작업부하를 공유하며 공기 흐름을 재조정해 중단을 방지할 수 있다.


이와 함께 확장성 측면에서도 이점확보가 가능하다. 모듈식 설계로 다양한 DC구성에 맞게 쉽게 확장할 수 있다. DC용량이 확장됨에 따라 팬 모듈을 추가해 증가하는 냉각수요를 충족할 수 있다.

 

 

FWU‧리퀴드쿨링, 보완재로 ‘공존’

최근 고밀도랙 냉각방식이 DC업계 이슈가 되고 있는 상황에서 D2C(Direct to Chip), RDHx(Rear Door Heat eXchanger), 액침냉각(Immersion Cooling) 등 리퀴드쿨링에 관심이 집중되고 있다. 전문가들은 이론적으로는 이러한 냉각방식이 효율적인 것으로 전망하고 있으며 리퀴드쿨링 수요도 꾸준히 증가할 것으로 예측한다.


그러나 서버설계 변경에 따른 비용상승과 실용성 검증에 따른 소요시간을 감안하면 당장 상용DC 적용에는 무리가 따른다. 또한 리퀴드쿨링은 고객사 소유인 랙에 직접적인 접촉이 불가피해 DC 생명인 보안성에 이슈가 발생할 가능성이 크다.


현재 서버의 조건과 수요기업 니즈에 따라 리퀴드쿨링은 단기적으로 보면 일부시설에 검토 또는 적용될 것으로 예상된다. 즉 리퀴드쿨링이 적용되더라도 보조적 수단으로 적용될 전망이다.


이는 FWU가 기존 시스템과 통합이 가능하기 때문이다. 리퀴드쿨링 솔루션은 일반적으로 상당한 인프라 투자가 필요하지만 FWU는 기존시스템 위에 배치해 냉각성능과 효율성을 향상시킬 수 있다.


또한 이중화 및 유지보수 측면에서 리퀴드쿨링에 비해 유리하다. 팬이 고장 나더라도 FWU의 다른 팬이 DC에 적절한 냉각을 제공할 수 있는 반면 액체냉각시스템은 장애가 발생하면 냉각이 수리될 때까지 연결된 서버랙이 다운된다. FWU는 전체 공기흐름에 영향을 주지 않고 유지보수를 위해 팬을 중단할 수 있지만 액체냉각시스템은 아직 리던던시를 제공하기는 어렵다는 한계가 있다.


결론적으로 RDHx, D2C 등 리퀴드쿨링 또한 고발열 HPC DC에서 부분적인 보완을 담당하지만 AI시대에 걸맞는 하이퍼스케일 DC서버 쿨링은 FWU가 현재시점에서 가장 확실한 방안으로 자리잡고 있다. 메인 쿨링시스템은 FWU에 의존해 향후 수년간 지속적인 수요증가가 예상된다.

 

 

운영안정성‧E효율 ‘두 마리 토끼’
FWU는 풍량이 월등해 냉각능력도 기존시스템에 비해 우수하지만 운영안정성과 에너지효율성 역시 큰 장점으로 꼽힌다. 지난 2월 ASHRAE저널은 DC냉각시스템 무중단 운전을 위한 예비장비 운전방법을 통해 에너지효율 개선하는 방안을 제시한 조진균 한밭대학교 교수 논문을 표지논문으로 선정해 발표했다.


이를 통해 FWU 적용성이 입증됐다. FWU를 구성하는 N+m개 팬이 모두 무중단상태로 동작함으로써 안정성을 확보하면서도 인버터제어로 부분부하 운전하기 때문에 높은 에너지효율로 운전된다는 것이다.


논문에 따르면 DC 운영안전성을 위한 장비 이중화운전 방식은 크게 두 가지로 구분된다. 대기방식에는 핫-스탠바이(HSP: hot-standby sparing)와 콜드-스탠바이(CSP: cold-standby sparing)가 있다.


냉각시스템을 구성하는 구성장비의 에너지효율은 구성하는 각 장비효율과 직결된다. 또한 동일한 시스템 구성에서도 HSP 또는 CSP 운전방법에 따라 차이가 발생한다. 이는 인버터제어가 가능한 각 장비의 운영부하율과 직결된다.


예를 들어 FWU가 예비장비를 포함한 N+m개가 설치된 경우 CSP 운전은 N개만 가동되며 m개는 대기한다. 반면 HSP 운전은 동시에 N+m개 모든 FWU가 운전된다. 이에 따라 평상시에는 CSP보다 많은 장비가 낮은 부하로 운전된다.


HSP가 CSP보다 비상운전을 대비한 냉각시스템의 신뢰성은 높게 유지되지만 예비장비를 평상시 정상운전에도 가동하기 때문에 운영비용이 증가한다. 이러한 이유로 과거에는 안정성을 다소 하향하면서 CSP 기반 냉각시스템을 적용해 운영했다.


반면 HSP는 의무지원(duty assist)시스템으로 간주돼 비상시 일부장비가 운전하지 못할 경우 그만큼을 남은 장비가 부하를 가중해 높은 부하로 가동하게 된다. 이것이 HSP 기반 냉각시스템의 에너지효율을 증대시키는 핵심개념이 된다. 각 구성장비에서 인버터제어가 가능하다면 상대적으로 낮은 부하율로 운전되는 것이 에너지절감 효과를 극대화할 수 있다.

 


최근 DC냉각시스템은 효과적인 부분부하 대응과 에너지절약을 위해 인버터기술인 VSD(variable speed drive) 및 VFD(variable frequency drive)가 적용된 장비개발과 사용이 보편화되고 있다. FWU는 EC(electronically commutated)모터를 적용한 인버터제어 송풍기를 사용한다.


송풍기의 VSD, VFD 구현 및 적용효과는 많은 연구를 통해 검증됐다. 송풍기 속도가 변경될 때 발생하는 송풍기 성능곡선의 변화를 활용한다. 이러한 변화는 일련의 팬법칙(fan law)  수식으로 정량화할 수 있다. 송풍기 속도가 감소함에 따라 인입전력이 크게 감소한다. 변속방법은 시스템 또는 부하곡선과 거의 일치하는 풍량제어가 가능하며 이를 통해 송풍기는 최소한의 입력전력으로 원하는 결과를 얻을 수 있다.

 

FWU 송풍기는 일반적으로 팬 법칙을 따른다. 송풍기, 모터 및 벨트 드라이브의 효율성이 모두 일정하게 유지되면 입력전력이 동일한 방식으로 확장된다. 해당 연구에서는 DC IT룸 전체냉각을 위한 FWU의 CSP 방법은 예비장비의 경우 대기모드이며 실제로 FWU는 운전부하율 95% 이상으로 운영된다.


반면 HSP 방법은 예비장비를 포함한 모든 FWU가 가동돼 동일한 부하를 담당하기 때문에 운전부하율은 80% 수준으로 운전된다. HSP 운전은 FWU가 가동되는 수량은 증가하지만 VSD 송풍기 소비전력은 운전부하율의 차이에 의해서 약 9% 절감이 가능하다.


DC 신뢰성을 확보하기 위해 N+1 이상 장비의 예비율 확보는 불가피한 것이므로 변속운전이 가능한 냉각시스템을 구성할 경우 큰 시설변경 및 투자없이 냉각에너지를 효과적으로 절감할 수 있는 최선의 전략은 HSP-기반 FWU 냉각시스템으로 평가된다. 이에 따라 DC설계에 FWU 반영이 진행되거나 향후 적용성 확대가 예상된다.

 

EC팬모터, FWU 핵심부품

DC 티어(Tier)등급 결정의 핵심요소는 에너지효율지수(PUE)이다. PUE는 연간 DC에너지 총소비량대비 연간 IT장비 에너지소비량의 비율로 PUE 수치가 낮을수록 티어등급이 높아지며 DC 신뢰도가 향상된다. PUE를 향상하기 위해서는 냉각장비의 에너지효율을 높이는 것이 핵심이며 공랭식에서 높은 냉각능력을 가지면서 에너지효율이 높은 FWU가 선택받고 있다.


FWU 에너지효율에 가장 큰 역할을 하는 것이 팬모터다. 구조적으로 팬모터를 그리드 또는 모듈형태로 적층하기 때문에 팬모터는 FWU 핵심요소다. 최근 FWU에는 에너지효율이 높으며 인버터제어가 가능한 EC팬모터가 적용돼 더욱 효율을 향상하고 있다. EC팬모터는 AC팬모터대비 모듈구성이 가능하며 인버터가 내장돼 제어가 용이하다.

 

DC용 EC팬, 고조파차단 관건
최근 DC용 FWU에 EC팬모터가 적용되면서 고조파문제가 핵심적인 고려대상으로 떠올랐다. 고용량 서버랙이 집적된 DC 특성상 거의 모든 DC에서 고조파 발생량을 THDi(The total harmonic distortion: 고조파왜곡 계산식) 기준 약 5% 이내로 제한하고 있다.


EC팬모터는 BLDC에 컨트롤모듈까지 내장돼 고조파 발생이 필연적이다. 이러한 고조파를 해결하기 위해서는 고조파필터를 별도로 설치해 해결해야 한다. 이때 고조파필터는 DC부하에 적합한 수준이어야 하며 FWU 증설 등에 따라 용량범위를 벗어난다면 고조파필터가 제 역할을 할 수 없기 때문에 주의가 필요하다. 최근 EC팬모터 업계는 이러한 고조파를 제거하는 기능을 탑재한 제품을 출시하고 있다.

여인규 기자 igyeo@kharn.kr
저작권자 2015.10.01 ⓒ Kharn



  • youtube
  • facebook