處理器大咖扮推手 浸沒式液冷散熱大步走
為加速各式冷卻方案技術開發,英特爾(Intel)宣布與多家台ODM大廠簽署合作協議,包括營邦、仁寶、英業達、神雲、和碩、雲達、緯創和緯穎,以台灣產業生態系的優勢讓資料中心永續價值加速落地。同時英特爾已在台推出首款Open IP資料中心單相浸沒式液體冷卻完整解決方案及參考設計,近期則擴大發布Open IP Server Deployment Kit,協助客戶和廠商進行相容性驗證。伺服器業者指出,不只英特爾,超微(AMD)、NVIDIA等處理器大廠都在積極研究,浸沒式散熱已是大勢所趨。
英特爾副總裁暨亞太日本區(APJ)總經理Steve Long表示,冷卻解決方案對於資料中心降低電力使用效率(Power Usage Effectiveness;PUE)至關重要。作為第一階段推出的資料中心單相浸沒式液體冷卻完整解決方案,是將伺服器浸入不導電的冷卻液,以流動循環的方式帶走伺服器運作時產生的廢熱,其CDU(Cooling Distribution Unit)具備多功能的特性,包含冗餘和過濾設計,並且能夠在不影響營運的情況下完成維護工作。目前已完成Intel Xeon可擴充處理器概念驗證,以及模組化伺服器初步設計規範,解決方案亦相容19吋、21吋的伺服器。
此解決方案的參考設計基準為15kW冷卻能力和12U容量,其槽體能夠擴充至24U、36U、48U,或依據客戶需求客製化,單一CDU提升至180kW或更高的冷卻能力,能夠部署從邊緣至主流規模的資料中心;未來新建成,專為浸沒式冷卻所設計的超大規模資料中心,其CDU和槽體能夠從1對1擴充至1對多,在資料中心使用面積最佳化。全部的解決方案均可透過英特爾AI遙測技術(Intel AI Telemetry)進行智慧監控,亦可整合至資料中心其他現有監控方案之中。
另外,為擴展浸沒式冷卻產業生態系並簡化部署前的驗證工作,英特爾推出Open IP Server Deployment Kit,即整合CDU、4U容量與自動控制的系統,此套件擁有相同的流場設計與各項關鍵技術,整個生態系均可透過此套件進行伺服器、相關零組件和浸沒式冷卻的相容性驗證。英特爾也正在測試多款冷卻液,包含氟化液與客製化合成油品,增加冷卻液選擇性。
對此合作案,英業達董事長卓桐華表示,呼應英特爾永續發展企業策略,英業達使用Intel Open IP浸沒式液體冷卻解決方案,讓生態系業者在因應資料中心功率密度持續上升的趨勢時,可以加速導入英特爾解決方案,強化營運效率。和碩執行長鄭光志亦認為,和碩參與了新一代Open IP Immersion Cooling單相浸沒式液冷解決方案,不僅滿足客戶在5G邊緣運算、AI及機器學習等相關應用上對於功率和效率間的需求,並協助全面推動企業社會環境責任。
英特爾此階段推的是單相式浸沒式液冷散熱,業界透露,下階段英特爾將推出兩相式浸沒式液冷散熱解決方案,可能時間是在2023年。所謂單相式與兩相式,差異處在於單相需要用油性介電液,透過擾動散熱,需要幫浦運作,兩相式是透過氣體與液體間的物理變化散熱。
業界指出,單相式浸沒式液冷散熱的初期建置成本較低,然維護成本相對較高,此外由於需要透過幫浦擾動散熱,因此用電量較高,然兩相式初期建置成本較高,且轉換至氣體後容易流失,導致成本增加。不論何者,都與現行氣體散熱差很大,伺服器與資料中心設計都不同。
伺服器供應鏈指出,除了英特爾之外,超微與NVIDIA等晶片廠都在積極發展浸沒式液冷散熱,只是英特爾動作較快,其主要考量點是英特爾新一代的Sapphire Rapids系列處理器,現階段傳出頂級規格的散熱需求為350W,業界傳出,資料中心採用的頂規處理器,其散熱需求上看420W。
事實上,不只英特爾伺服器處理器在改朝換代後,散熱需求節節高升,超微要推出的新款處理器Genoa,其頂級規格處理器的散熱需求也上看400W,若要進展到AI,GPU的散熱規格更高,NVIDIA的A100,其散熱需求達到400W,甚至達到500W。
業界指出,在伺服器效能持續提高下,散熱需求節節高升為必然趨勢,除非所有資料中心都蓋在北歐等地,否則現階段採用的氣冷散熱將不敷需求,尤其各國都在關注排碳等議題下,資料中心如何節能減碳,將是無可迴避的必考題。
中國工業和信息化部於2019年就已經針對資料中心提出指導意見,要求新建大型資料中心PUE都不得高於1.4,既有的大型資料中心PUE也不得高於1.8。然對於採用空氣冷卻的傳統資料中心設計,卻很難達到此標準。
交通大學機械工程系講座教授王啟川曾指出,傳統採用空調的空冷設計,PUE通常會在1.8~1.9,要達到1.5很困難,然若採用液冷散熱,要達標就輕而易舉。也因此各家都在研究液冷散熱,尤其是浸沒式散熱,從一開始被視為話題,如今在英特爾也跳下來推動下,化為實際方案。