AI 및 HPC: 진화하는 데이터센터 냉각 방식
AI 및 HPC가 트렌드를 주도하는 기술로 자리잡는 가운데, 데이터센터 냉각 기술은 어떻게 진화하고 있을까?
이미지 출처: Евгений Вершинин/stock.adobe.com
장-자크 들릴(Jean-Jacques DeLisle), 마우저 일렉트로닉스
2025년 4월 4일 게시
2025년에 생산될 것으로 예상되는 약 26,787TWh의 전력 중 데이터센터와 암호화폐가 소비할 것으로 추산되는 전력은 약 536TWh로, 이는 전 세계 총 발전량의 약 2%에 달한다.[1] ,[2] 현재와 같은 추세라면 데이터센터 전력 소비량은 2030년 1,000TWh에 도달하거나 이를 초과하여 전 세계 총 전력 소비량의 5%에 근접할 것으로 예상된다.[3] 전 세계 전력 공급의 대부분은 여전히 석탄, 천연가스, 석유 및 기타 재생 불가능한 에너지원에 의존하고 있으며, 디지털 전환의 속도가 빨라지면서 전력 소비량이 증가하는 추세이기 때문에 이 같은 기술을 위한 재생 에너지 생산을 늘리는 동시에 이와 같은 애플리케이션의 에너지 사용 효율을 향상시키는 것은 필수적이다.
전기 에너지를 상당량 소비하는 분야 중 하나는 인공 지능(AI) 및 고성능 컴퓨팅(HPC) 워크로드를 실행하는 하이퍼스케일 데이터센터 내의 전자 장치 냉각이다. AI 및 HPC 구축에 필요한 냉각 요구 사항은 매우 다르지만, 일반적으로 훨씬 더 높은 듀티 사이클을 갖는다. 또한 일반적인 데이터센터 서버 애플리케이션보다 10배 이상의 전력 밀도에 도달할 수 있다. 에너지 가격은 상승하는 반면 전기 에너지 공급은 이를 따라잡지 못하면서, 데이터센터 냉각의 효율성 향상은 지난 몇 년 동안 이슈가 되어 왔다. 일부 신규 데이터센터는 재생에너지 발전 인프라와 함께 건설되고 있으며, 재생에너지를 통해 전력을 공급받고자 하고 있다. 이 같은 접근 방식은 에너지 사용 측면에서 매우 비용 효율적일 수 있지만, 냉각 기술의 운영 에너지 수요는 여전히 상당하기 때문에 초기 자본 비용이 크게 증가할 수 있다.
전문가들은 해안 지역의 완전 침수형 데이터센터 포드와 같이 데이터센터를 보다 에너지 효율적인 플랫폼으로 발전시키기 위한 여러 가지 혁신적인 접근 방식을 고안해 왔다. 그럼에도 불구하고 미국의 기존 데이터센터는 외딴 건조 기후에 건설되는 경우가 많다. 저렴한 토지, 최소한의 규제, 유리한 세제 혜택 덕분에 이 같은 지역들은 데이터센터 부지로 선정되는 경우가 많지만, 높은 냉각 수요를 비롯하여 용수 공급의 제한 및 가격 부담이라는 단점이 따른다.
이 글에서는 오늘날 데이터센터 시설의 냉각 방법과 전자 제품 냉각 산업을 혁신할 수 있는 미래 기술에 대해 살펴본다.
데이터센터 냉각 트렌드
초고밀도 데이터센터의 랙 전력 밀도는 10kW 미만에서 급증하여 경우에 따라서는 100kW를 넘는 수준에 이르렀다.[4] 이 같은 전력 밀도 수준에서 공랭식은 냉각 용량이 부족하며, 액랭식 냉각과 경쟁하기에는 효율성이 매우 낮다고 널리 알려져 있다. 이 같은 방식 중 단상 DTC(Direct-to-Chip) 액랭식은 현재 더 효율적이고 효과적인 냉각 방법을 추구하는 시장에서 선두를 달리고 있다.
DTC 기술은 주요 처리 하드웨어를 냉각함에 있어 발달되고 효과적인 방법이다. 하지만 이 접근 방식은 네트워킹, RAM, 스토리지와 같은 보조 하드웨어 칩을 공랭식으로 냉각해야 하는 경우가 많다. 이에 대한 잠재적인 해결책은 단상 또는 2상 침수 냉각이다. 침수 냉각을 사용하면 전체 데이터센터 랙을 열 전도성이 있는 유전체 유체에 담가 전자 부품의 열 에너지를 유체로 효과적으로 전달한 다음, 열 교환기(단상) 또는 증기 및 응축 관리 시스템(2상)을 사용하여 효율적으로 냉각할 수 있다. 특히 후면 도어 열교환기는 공랭식이 주를 이루는 기존 데이터센터의 개량 솔루션으로 널리 사용되고 있다.
공랭식은 초기 비용이 가장 적게 드는 반면, DTC 및 침수 냉각 방식은 가장 비싸고 복잡하다. 많은 자본을 투입할 수 있고 높은 수익을 기대할 수 있는 신규 데이터센터 구축의 경우에는 액랭식이 가장 이상적이다. 하지만 높은 초기 비용으로 인해 일부 기존 데이터센터들은 물론 신규 설치 데이터센터 시설들조차도 기존의 공조 기술을 사용하는 비효율적인 공랭식 시스템에 계속 의존하고 있다. 일부 지역 규제는 이 같은 비효율적인 냉각 기술의 사용을 제한할 수 있지만, 기존 공랭식 데이터센터 방식을 사용하지 못하게 하는 주요 요인은 운영 비용 증가에 대한 부담일 가능성이 더 크다. 그렇기에 팬 위치 조정, 랙 배치, 공기 흐름 최적화 등이 같은 시스템의 효율성을 향상시켜 비용을 절감하기 위한 노력도 활발히 진행되고 있다.
침수 냉각은 특히 극도로 높은 열 밀도를 처리할 수 있는 기술적 특성으로 인해 가장 효율적이고 지속 가능한 냉각 기술로 부상하고 있다. 최신 AI 및 HPC 기술로 인해 전력 밀도가 훨씬 더 높은 랙이 요구됨에 따라 침수 냉각은 기존의 공랭식에 비해 데이터센터 냉각 에너지 소비를 최대 90%까지 줄일 수 있다는 추정치도 나오고 있으며, 이로 인해 침수 냉각의 채택율이 높아질 것으로 예상된다.[5] 해당 기술은 아직 신기술인 만큼, 광범위한 침수 냉각을 위한 인프라 구축은 아직 새로운 데이터센터의 구축 속도와 맞춰지고 있지는 않다. 하지만 데이터센터에 대한 막대한 투자로 수익을 창출하는 침수 냉각 기업들이 늘어나면서 향후 몇 년 내로 상황은 변화할 가능성이 높아지고 있다.
액랭식, 특히 침수 냉각의 또 다른 잠재적 장점은 폐열을 재활용하고 용도를 변경할 수 있다는 점이다. 온수 수영장, 학교, 상가, 실내 원예 시설, 폐기물 처리, 화학 처리/정제, 심지어 열에너지 저장 시스템 등 많은 분야에서 폐열이 활용되며, 이 같은 시스템은 공공 수요에 따라 폐기물을 전기 에너지로 변환할 수 있다.
데이터센터 냉각의 미래
앞서 다뤘던 제약 조건은 이제 고도로 반응성 높은 AI 및 HPC 기술이 최종 사용자와 더 가까이 위치해야 한다는 필요성과 함께한다. AI, 가상 현실(VR), 증강 현실(AR), 자동화 기능을 위한 밀리초 단위 응답 시간을 확보하기 위해서는 근접성이 필수적이며, 이는 이 같은 기술들의 다양한 애플리케이션에 필수적인 것으로 간주된다. 대부분의 최종 사용 애플리케이션은 밀집된 도시 지역에 위치하기 때문에 데이터센터 공간을 추가로 구축하려면 부동산 비용이 훨씬 더 많이 들고, 총 가용 공간이 줄어들며, 오염 및 물 사용에 대한 지역적 제한이 많아지고, 공공 에너지 용량에 제약이 수반될 수 있다. 이 같은 추가적인 설치 공간 제약으로 데이터센터 성능 목표 달성은 밀도가 관건이 되고 있다.
데이터센터 랙의 전력 밀도는 특히 수십 킬로와트의 전력을 소비하는 웨이퍼 규모의 AI 프로세서가 도입되면서 증가할 것으로 예상되지만, 냉각 기술은 데이터센터의 성장과 확장에 걸림돌이 되고 있다. 이 같은 추세는 더 많은 AI 및 HPC 기술이 배포되고 증가하는 수요를 충족하기 위해 클라우드 인프라가 확장됨에 따라 더욱 악화될 것이다.
기존의 공랭식 시스템을 점검하고 새로운 데이터센터 설계에 액랭식 시스템을 통합하는 것은 데이터센터 운영자에게는 엄청난 과제이다. 가동 중인 데이터센터 환경의 변화에는 상당한 위험과 복잡한 운영이 수반된다. 이와 같은 어려움 때문에 자본만 확보된다면 기존 데이터센터의 용도를 변경하는 대신, 이 같은 변화에 맞춰 새로운 데이터센터 위치를 처음부터 새로 구축할 가능성이 높다. 전자 냉각 기업의 인수합병이 첨단 냉각 기술 도입을 촉진할 것으로 예상됨에 따라, 데이터센터 기업과 냉각 기업 간의 파트너십은 점점 더 늘어나고 있다.
이를 따라잡기 위해서는 훨씬 더 정밀한 센서와 분석, 최적화가 필요하다. 기존의 알고리즘 기반 냉각 제어 시스템은 데이터센터에 있는 잠재적인 수만 개의 센서와 냉각 장치를 처리하기 위해 AI를 비롯한 더욱 진보된 냉각 최적화 기술로 대체될 가능성이 높다. 이 같은 최적화의 일환으로, 고급 모니터링 및 분석을 활용하여 단일 하드웨어의 성능 저하를 초래하는 온도에 도달하지 않도록 기존 목표보다 더 높은 온도로 데이터센터를 운영하는 것을 고려해볼 수 있다.
맺음말
오늘날에는 공랭식이 여전히 주류를 이루고 있지만, 향후 몇 년 내로 기존 시설의 개조와 새로운 데이터센터에서 하이브리드 공랭식/액랭식 기술을 활용하는 사례가 증가할 것이다. 이를 위해서는 DTC의 안정성이 훨씬 높아져야 하는데, 이는 DTC에 몇 초만 오류가 발생해도 심각한 서버 다운타임이나 손상으로 이어질 수 있기 때문이다. 침수 냉각은 이 같은 안정성에 대한 요구 사항을 충족하며, 더 복잡하고 전문적인 설치 및 유지 관리가 필요한 대신 더 높은 전력 밀도를 구현할 수 있다. 향후 랙 전력 밀도가 100kW 또는 300kW를 초과할 경우 엔지니어는 랙 외부로의 열 방출을 고려해야 한다. 특히 각국 많은 정부와 기관들이 데이터센터가 일정 수준 이상의 지속 가능성을 달성하도록 요구하는 법안을 제정하려고 하고 있기 때문에 냉각으로 인한 과도한 열 에너지를 배출하는 것이 점점 더 중요해질 것이다.
출처
[1]https://www.datacenterdynamics.com/en/opinions/four-key-trends-disrupting-data-centers-in-2025/
[2]https://www2.deloitte.com/us/en/insights/industry/technology/technology-media-and-telecom-predictions/2025/genai-power-consumption-creates-need-for-more-sustainable-data-centers.html
[3]https://www.datacenterfrontier.com/cloud/article/55253151/8-trends-that-will-shape-the-data-center-industry-in-2025
[4]https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/ai-power-expanding-data-center-capacity-to-meet-growing-demand
[5]https://www.hpcwire.com/2024/02/01/the-genai-data-center-squeeze-is-here/
저자 소개
장-자크 들릴(Jean-Jacques DeLisle)은 로체스터 공과대학(RIT)에서 전기공학 학사학위 및 석사학위를 취득했다. RIT 재학 시에 RF/마이크로파 연구에 매진했으며, 대학 잡지에 글을 쓰고, 즉흥 코미디 동아리 창단 멤버로 활동했다. 학위를 마치기 전에 Synaptics에 IC 레이아웃 및 자동화 테스트 설계 엔지니어로 채용되었다. 동축 안테나 및 무선 센서 기술 개발 및 분석으로 6년의 연구 활동 후에 RIT를 졸업하면서 다수의 기술 논문을 제출하고 미국 특허를 출원했다. 커리어를 쌓기 위해서 아내와 함께 뉴욕시로 옮겨서 Microwaves & RF 잡지의 테크니컬 엔지니어링 에디터로 근무했다. 이 잡지사에서 근무하면서 RF 엔지니어링과 테크니컬 라이팅에 대한 자신의 역량과 열의를 어떻게 융합할지 배웠다. 이 경험을 바탕으로 기술적으로 유능한 테크니컬 라이터와 객관적인 산업 전문가의 필요성을 절감하고 RFEMX라고 하는 자신의 회사를 차렸다. 이러한 목표에 따라서 진보를 거듭하면서 회사 규모와 비전을 확대하고 Information Exchange Services(IXS)를 시작했다.