首頁 導報現場 正文

曙光數創:避免對液冷技術的三個誤讀

2025-01-15 16:08 中國發展網
液冷技術 服務器 數據中心 數字經濟

摘要:曙光數創相關負責人日前在京接受記者采訪時表示,液冷技術是大勢所趨,未來大有可為,但從技術角度要避免三種“誤讀”。

中國經濟導報、中國發展網 記者崔立勇報道

據中國信息通信研究院測算,2023年全球算力規模為1397EFlops,中國占比達三分之一。算力的增長離不開數據中心的支撐。在滿足巨大算力需求的同時,數據中心的高效和穩定卻面臨散熱和能耗的巨大挑戰。

相關研究表明,當芯片TDP(Thermal Design Power,散熱設計功耗)超過350W時,風冷逼近極限,液冷呼之欲出。液冷目前在我國的整體滲透率約為10%,業內認為,預計未來3至5年,液冷行業有望保持30%以上的年復合增長率。

曙光數創在2023年度的液冷基礎設施市場中表現出色,以61.3%的市場份額連續第三年穩居中國液冷行業首位。曙光數創相關負責人日前在京接受記者采訪時表示,液冷技術是大勢所趨,未來大有可為,但從技術角度要避免三種“誤讀”。

誤讀1:應用液冷僅僅是為了節能

“千萬不要把液冷僅僅局限為綠色節能,這是一個特別大的誤區。”曙光數創副總裁兼CTO張鵬強調,符合國家綠色低碳的發展戰略,是液冷快速落地的重要原因,但是液冷爆發的根本原因還是傳統的風冷技術手段無法解決服務器芯片的散熱難題。

數據中心用電量目前占社會總發電量的2%至3%。預計到2025年,我國數據中心電力消耗將接近4000億千瓦時,占全國總電力消耗的5%以上。在此背景下,采用更為節能的液冷技術成為必然。

要解決數據中心耗電問題,液冷技術是有效的手段之一。曙光數創致力于技術創新,通過優化產品設計和生產工藝,提供更加環保高效的算力基礎設施服務,為構建綠色高效的AI生態系統奠定了堅實的基礎,助力“雙碳”目標的實現。

然而不能忽視,液冷也是被“逼出來”的。張鵬介紹,數據中心經歷了數據處理中心(DC)、互聯網數據中心(IDC)、智算中心(AIDC)等階段。隨著AI模型日益復雜,數據處理量爆炸式增長,AI正在驅動數據中心快速發展。

過去,服務器CPU功耗只有150瓦至200瓦,這種水平持續了近20年。從2020年開始,全球數據量呈指數級增長,尤其是隨著AI大模型訓練對算力需求的激增,GPU更是從A100的450瓦發展到H100的700瓦,B100甚至達到1200瓦,功率之大可謂“恐怖”。而且,芯片功率還有進一步提高的趨勢,GPU開始普遍采取高密度部署的方式。

在此情況下,傳統風冷技術不僅會影響芯片性能發揮,還可能導致服務器穩定性和可靠性下降。張鵬表示,當散熱變成數據中心難以跨越的難題,那么液冷技術的應用就不是可選項,而是必選項。

“我們的主要工作就是‘伺候’服務器。”張鵬說,曙光數創用高效能的液冷解決方案,為解決高密度計算帶來的散熱難題提供了新的途徑。作為北交所上市公司中的專精特新“小巨人”企業代表,曙光數創深耕數據中心液冷領域20余年,在液冷技術領域持續加大研發與應用力度,正是為了保證算力基礎設施建設的安全和穩定。

誤讀2:“風液混冷”是風冷和液冷分開使用的二選一

在實踐中,曙光數創將風冷系統與液冷系統高效集成,一體化解決數據中心的散熱需求。這種“風液混冷”智算數據中心解決方案創新性地采用風、液共用一套冷源系統的方式,簡化了系統結構,降低了建設和運維成本,還實現了風液冷卻的彈性調節。

從技術上分析,有的國內企業在儲能產品上使用風液混冷技術。具體看來,是產品在不同工況下分別采取風冷或液冷——高功率運行時,使用液冷;低功率運行時,采取風冷。

張鵬解釋,與之不同,曙光數創的“風液混冷”方案是同時對同一數據中心中的不同設備或部件分別采用風冷或液冷,用合理的風冷和液冷的比例搭配讓數據中心“冷下來”。

冷板式服務器對最主要的發熱芯片進行了液冷覆蓋,硬盤、網絡、電源、內存等仍然需要風冷去散熱。傳統的液冷數據中心采取兩套冷源——一套是CDU(Cooling Distribution Units,冷卻分發單元),將數據中心中產生的熱量轉移到冷卻介質中,然后將冷卻介質通過冷卻系統散熱出去,采用的是自然冷卻;另一套是以空調系統為代表的風冷。在曙光數創的“風液混冷”中,風冷系統與液冷系統共用一次側管路,共用室外散熱冷源,將復雜的冷卻系統進行了極大簡化。

曙光數創產品部高級總監黃元峰強調,這種新方案的優勢還在于“風液可調”——在數據中心建設之初,很多用戶并不確定CPU、GPU、存儲的具體數量,甚至不知道風冷服務器和液冷服務器之間的比例,如果為兩種服務器各自建設一套冷源,那么當服務器部署的數量發生變化,或者未來對服務器進行調整,那么冷卻系統就會遭遇和服務器難以匹配的窘境。曙光數創的“風液混冷”則能夠根據不同場景和需求靈活調整冷卻方式,大大提高了能源利用效率。

不僅如此,曙光數創還引入了“源網荷儲”一體化的新模式,實現源源互補、源網協調、網荷互動、網儲互動和源荷互動等多種交互形式。

黃元峰介紹,“源”是指電源側,“網”是指整個電力的輸送,“荷”是指負載,“儲”是指配儲能。“源網荷儲”一體化是將能源的產生、電網、用電負荷和儲能系統進行有機整合,進一步增強數據中心的供電可靠性,顯著提升電力系統的功率動態平衡能力,為智算中心提供經濟、高效、安全的能源解決方案。

黃元峰表示,數據中心有效使用風電、光伏等新能源的電力,由此降低了數據中心的用電成本,實現減碳。更重要的是,“源網荷儲”在數據中心的應用有助于化解新能源發電一直面對的“不穩定”難題。數據中心直接使用、就近消納綠電,減少新能源電力上網的壓力。同時,數據中心根據綠電供應的變化進行算力協調,實現電力和算力的配合。

誤讀3:液冷的產業鏈不成熟

液冷行業正在加速技術標準的建立。曙光數創參與了國標、行標、團標等30多項標準的制訂,牽頭的《數據中心冷板式液冷系統技術規范》已經通過審批。

張鵬表示,液冷技術仍在發展迭代,能力和可靠性還將繼續提升,但是從產業鏈角度觀察,這并不代表液冷產業鏈尚未成熟。

張鵬分析,以冷板式液冷為例,技術成熟度較高,汽車發動機采用同樣的技術原理,近年來在儲能領域也得到廣泛應用。在數據中心,用戶對液冷的接受度不成問題。

與此同時,張鵬認為,標準化和模塊化將推動行業的整體健康發展,降低整個行業的成本。他舉了一個具體的例子——液冷設備缺乏統一的接頭標準,每個品牌的接頭都不一樣。按照曙光數創的統計,接頭成本占據了液冷系統1/4-1/3的成本。“系統中最貴的應該是管路、水泵、散熱器等部件,接頭成本不應該超過總成本的1/10。”他說,隨著液冷規模的擴大,接頭標準亟待建立。

需要解決的還有液冷的水質問題。冷板中的水溫一般在40—50攝氏度,這個溫度相對容易滋生細菌。為了應對這種問題,行業內采用了在水中添加乙二醇、丙二醇或者殺菌劑等辦法。在張鵬看來,這些方法各有其優點和不足,總體來看還沒有特別有效且經濟的手段。

張鵬表示,液冷技術仍在不斷進步,更細微更具體的問題將逐步得到破解。隨著相關標準的逐步建立,液冷行業仍將持續快速發展。

責任編輯:崔立勇

返回首頁
相關新聞
返回頂部
国产福利一区二区麻豆