業(yè)界首部《全液冷冷板系統參考設計及驗證白皮書(shū)》現已正式開(kāi)放下載,該白皮書(shū)由浪潮信息、英特爾、OCTC開(kāi)放計算標準工作委員會(huì )、全國信息技術(shù)標準化技術(shù)委員會(huì )算力標準工作組、中國電子技術(shù)標準化研究院聯(lián)合撰寫(xiě),詳細解讀了液冷技術(shù)的背景、技術(shù)優(yōu)化方向以及全液冷冷板系統的設計、驗證和展望,為全液冷冷板服務(wù)器設計和規模應用中面臨的主要難點(diǎn)提供了創(chuàng )新設計參考,對全液冷冷板技術(shù)在通用架構上實(shí)現快速導入和推廣具有重要指導意義。

主流中的前沿——全液冷冷板技術(shù)
目前,冷板式液冷由于在產(chǎn)業(yè)鏈成熟度、改造成本、可維護性、兼容性等方面的優(yōu)勢,已經(jīng)成為液冷數據中心主流。IDC數據顯示,2023上半年中國液冷服務(wù)器市場(chǎng)中,冷板式占比高達90%。但現有的冷板式液冷技術(shù)依然有持續優(yōu)化的空間,最主要的問(wèn)題在于冷板一般僅覆蓋CPU、GPU等高功耗發(fā)熱部件,數據中心需要配置CDU和空調兩套冷卻系統,PUE值無(wú)法達到接近于1的理想狀態(tài)。同時(shí),傳統冷板式服務(wù)器是高度定制化產(chǎn)品,冷板的材質(zhì)選擇、結構設計、加工工藝以及部件規格等不一致,規?;瘧檬芟?。因此,冷板式液冷需要從系統級解決方案出發(fā),以模塊化解耦設計思維,創(chuàng )新出一種高能效、易運維、使用更安全,兼容性更出色、液冷覆蓋率更高的全液冷冷板結構設計。
作為目前液冷產(chǎn)業(yè)技術(shù)創(chuàng )新的前沿領(lǐng)域,全液冷冷板技術(shù)可實(shí)現“服務(wù)器內去風(fēng)扇、數據中心去空調化”運行,更加高效節能與靜音,并以高集成度節省30%左右的數據中心空間,單機柜支持100KW的高密度部署。
浪潮信息基于自身在液冷技術(shù)創(chuàng )新、產(chǎn)業(yè)化推進(jìn)及國標團標等產(chǎn)業(yè)標準化方面的長(cháng)期實(shí)踐,與英特爾、OCTC開(kāi)放計算標準工作委員會(huì )、全國信息技術(shù)標準化技術(shù)委員會(huì )算力標準工作組、中國電子技術(shù)標準化研究院聯(lián)合編寫(xiě)了《全液冷冷板系統參考設計及驗證白皮書(shū)》,旨在為全液冷冷板服務(wù)器設計和規模應用中面臨的主要難點(diǎn)提供創(chuàng )新設計參考,以模塊化解耦的先進(jìn)設計理念,推動(dòng)基于通用服務(wù)器架構的全液冷冷板技術(shù)快速普及。
白皮書(shū)指出,冷板液冷服務(wù)器設計技術(shù)優(yōu)化方向主要圍繞通過(guò)技術(shù)創(chuàng )新進(jìn)一步提高能效,降低初期投資成本,減少漏液安全隱患及提高運維便利性展開(kāi),一是持續完善部件液冷方案,提高液冷覆蓋率;二是提高通用化及可維護性;三是拓展冷板液冷材料范圍,減輕重量,降低成本;四是提升液冷系統長(cháng)期使用的安全性,降低漏液風(fēng)險。
創(chuàng )新實(shí)踐——全液冷冷板服務(wù)器,打通規?;瘧玫?ldquo;最后一公里”
白皮書(shū)詳細介紹了浪潮信息在全液冷冷板技術(shù)上的創(chuàng )新實(shí)踐成果——全液冷冷板服務(wù)器,實(shí)現了對CPU、高功耗內存、NVMe硬盤(pán)、OCP網(wǎng)卡、電源、PCIe轉接卡和光模塊等服務(wù)器主要發(fā)熱部件的冷板全液冷覆蓋,并針對不同部件的結構、材質(zhì)、工作溫度等差異化需求,創(chuàng )新設計了諸多系統部件級液冷解決方案,實(shí)現了液冷模塊解耦,為全球液冷產(chǎn)業(yè)鏈上下游提供極具價(jià)值的參考樣板,推動(dòng)先進(jìn)全液冷冷板解決方案在全球數據中心的大規模部署應用,實(shí)現數據中心更加綠色低碳可持續發(fā)展。
全液冷冷板服務(wù)器的CPU冷板模組基于英特爾第五代至強平臺可擴展處理器冷板的設計要求,綜合考慮散熱,結構性能,成品率,價(jià)格及不同材質(zhì)冷板設計兼容性等因素優(yōu)化而成的一款CPU冷板參考設計,主要由CPU冷板鋁支架,CPU冷板及冷板接頭等部件組成。

△ CPU冷板模組
內存液冷設計采用創(chuàng )新型的枕木散熱器液冷方案,因內存插滿(mǎn)如鐵軌上的枕木而得名。它將傳統風(fēng)冷散熱和冷板散熱相結合,通過(guò)內置熱管的散熱器(或純鋁/銅板、Vaper Chamber等)把內存上的熱量傳遞至兩端,與冷板通過(guò)選定的導熱墊片接觸,最終通過(guò)冷板內的冷卻液把熱量帶走實(shí)現內存散熱。相比現有的管路(Tubing)內存液冷方案,枕木散熱器液冷方案采用模塊化設計,具有易于組裝和維護、通用性好、性?xún)r(jià)比高等優(yōu)勢。
固態(tài)硬盤(pán)液冷方案同樣采用創(chuàng )新設計,通過(guò)內置熱管的散熱器把硬盤(pán)區域的熱量導出與硬盤(pán)區域外的冷板通過(guò)導熱墊片垂直接觸實(shí)現換熱。此固態(tài)硬盤(pán)液冷方案主要由裝有散熱器的固態(tài)硬盤(pán)模組,固態(tài)硬盤(pán)冷板,硬盤(pán)模組鎖緊機構,及硬盤(pán)支架組成。硬盤(pán)模組鎖緊機構固定在硬盤(pán)支架上提供合適的預緊力來(lái)保證固態(tài)硬盤(pán)模組和固態(tài)硬盤(pán)冷板的長(cháng)期接觸可靠性。為了方便硬盤(pán)冷板環(huán)路在狹小空間內的安裝,硬盤(pán)支架在服務(wù)器深度方向采用了抽屜式的安裝方式設計。相比業(yè)界已有的硬盤(pán)液冷嘗試,此方案可支持 30 次以上系統不斷電熱插拔,可靠性高,對加工工藝要求低,漏液風(fēng)險低,同時(shí)可靈活適配不同厚度和數量的固態(tài)硬盤(pán)系統。
此外,浪潮信息對PCIe卡、OCP網(wǎng)卡和電源等部件均進(jìn)行了創(chuàng )新的冷板設計,在冷板材質(zhì)方面也進(jìn)行了探索實(shí)踐,分別基于銅材質(zhì)和鋁合金材質(zhì)冷板,從換熱性能、可靠性、成本、重量等多方面進(jìn)行對比及優(yōu)化,同時(shí)對與鋁質(zhì)冷板液冷循環(huán)回路相匹配的液冷工質(zhì),進(jìn)行了選型和相應的腐蝕性測試驗證,為進(jìn)一步降低冷板液冷成本提供了豐富的實(shí)踐數據支持。
在測試驗證部分,全液冷冷板服務(wù)器進(jìn)行了散熱性能測試、液冷熱捕獲效率(HCR)測試、流阻測試等多項測試。在散熱性能測試中,銅冷板系統(冷卻工質(zhì)PG25)在目標最差邊界條件下所有的零部件溫度都滿(mǎn)足溫度要求,并且還有一定安全溫度裕量;在液冷熱捕獲效率(HCR)測試中,在典型的液冷系統工作邊界條件下—系統進(jìn)水溫度38?C(W32),空氣環(huán)境溫度35?C,全液冷冷板服務(wù)器液冷熱捕獲效率(HCR)在93%左右,整機柜測試HCR值更高,可接近98%;在流阻測試中,冷卻工質(zhì)PG25在相同溫度和流量下比純水流阻高20%左右,同一工質(zhì)溫度越高流阻越低,PG25的流阻相比純水對溫度更為敏感。在51?C進(jìn)水溫度1.3LPM流量條件下,采用冷卻工質(zhì)PG25和純水的系統流阻分別是118kPa和99.6kPa。
全面測試結果表明,浪潮信息全液冷冷板服務(wù)器可實(shí)現接近100%液冷散熱,系統無(wú)風(fēng)扇運行,可達到PUE接近于1的極限水平,并通過(guò)“去空調化”節省 30%以上的數據中心空間,充分滿(mǎn)足數據中心的高密度部署需求。
責任編輯: 李穎