2025-09-18 00:02:06
9月17日,首屆AIDC產(chǎn)業(yè)發(fā)展大會在上海召開。隨著AI技術(shù)發(fā)展,算力需求激增,AI算力設(shè)施向高密度、液冷化等方向演進,帶來功率負載、散熱等挑戰(zhàn)。AIDC機房設(shè)計需具靈活性和前瞻性,白皮書給出相關(guān)建議。我國AIDC建設(shè)面臨挑戰(zhàn),中外發(fā)展路徑有差異,不過產(chǎn)業(yè)各方已在標準、技術(shù)創(chuàng)新、產(chǎn)業(yè)協(xié)同與生態(tài)建設(shè)方面積極行動。
每經(jīng)記者|王晶 每經(jīng)編輯|魏文藝
隨著人工智能(AI)技術(shù)飛速發(fā)展,算力需求呈現(xiàn)爆發(fā)式增長。從GPT-1到GPT-5,模型參數(shù)量從1.17億躍升至數(shù)萬億,模型結(jié)構(gòu)也在不斷演進,從稠密LLM模型向MoE稀疏化模型以及多模態(tài)模型持續(xù)演進。
面對這一趨勢,單純依靠傳統(tǒng)服務(wù)器的簡單堆疊已無法滿足需求,AI算力設(shè)施正加速向高密度、液冷化、集群化方向演進,這不僅帶來了更高的功率負載和更復雜的散熱要求,也對傳統(tǒng)數(shù)據(jù)中心的散熱、供配電系統(tǒng)、網(wǎng)絡(luò)設(shè)計等提出了新的挑戰(zhàn)。
9月17日,在上海召開的首屆AIDC產(chǎn)業(yè)發(fā)展大會上,中國電子工程設(shè)計院數(shù)據(jù)中心事業(yè)部副總經(jīng)理王志強向包括《每日經(jīng)濟新聞》在內(nèi)的媒體記者表示:“當前整個GPU芯片及AI集群的功率密度演進速度,已超過傳統(tǒng)云數(shù)據(jù)中心的技術(shù)演進路徑。超高密度、超大規(guī)模部署,使基礎(chǔ)設(shè)施在動力適配、樓體結(jié)構(gòu)、空間規(guī)劃等方面面臨巨大挑戰(zhàn)。”
在王志強看來,為匹配AI負載的快速演進對算力的需求,機房要具備足夠的靈活性和彈性擴展能力,并且在機房的規(guī)劃和建設(shè)模式上也需具有前瞻性。
首屆AIDC產(chǎn)業(yè)發(fā)展大會現(xiàn)場 圖片來源:每經(jīng)記者 王晶 攝
事實上,隨著AI訓練與推理任務(wù)復雜度的不斷提升,單機柜功率正從當前的50kW(千瓦,功率計量單位)向300kW甚至更高水平躍進。與此同時,超節(jié)點規(guī)模的擴展也使得單集群供電需求躍升至數(shù)百MW(兆瓦,電功率的基本單位),遠遠超過了現(xiàn)有數(shù)據(jù)中心單棟樓10—20MW的供電能力。
在實際部署落地的過程中,高功率密度帶來基礎(chǔ)設(shè)施的升級挑戰(zhàn)遠比想象中復雜。
王志強表示:“去年單柜20kW還算主流,今年華為384型機柜已經(jīng)做到60kW,而字節(jié)、阿里、騰訊這些互聯(lián)網(wǎng)大廠在推理和訓練場景的單柜容量很快會突破100kW。”
功率密度外,制冷也成為數(shù)據(jù)中心投資規(guī)劃中無法回避的難題。在冷卻技術(shù)方面,風冷方案已接近極限,液冷成為轉(zhuǎn)型方向。這意味著數(shù)據(jù)中心的基礎(chǔ)設(shè)施必須同步迭代。
對此,當日(9月17日)發(fā)布的《AIDC機房參考設(shè)計白皮書》中對AIDC(AI數(shù)據(jù)中心)的設(shè)計思路及部署模式給出了一些建議。比如:構(gòu)建全鏈路高效供電體系,中低壓配電系統(tǒng)按最大容量池化設(shè)計;在建筑結(jié)構(gòu)規(guī)劃上,機房設(shè)計必須預留充足的層高和承重余量,以適配不斷增重的AI服務(wù)器及相關(guān)設(shè)備,同時保障后續(xù)設(shè)備更新?lián)Q代的靈活性;對于超節(jié)點域內(nèi)的互聯(lián)走線,按照最短互聯(lián)走線距離進行規(guī)劃設(shè)計,確保超節(jié)點內(nèi)時延最低。
在全球計算聯(lián)盟(GCC)秘書處CTO苗福友看來,未來兩三年,國內(nèi)AIDC建設(shè)仍將保持每年40%以上的年增速,隨后每年新增建設(shè)量還會增加,然后慢慢趨于平緩。預計到2030年前后,年增長率或在10%左右。
與新建機房相比,當前更為現(xiàn)實的問題是,存量數(shù)據(jù)中心機房以低密風冷機房為主,面向AIDC高密液冷機柜需求,如何才能實現(xiàn)平滑演進?
對此,王志強介紹了幾種路徑:第一,在規(guī)劃層面要引入模塊化理念;第二,做到風液兼容和匹配,原來風液比是4∶6,未來一年就可能變成1∶9?!按_實很難,但我們已經(jīng)找到了一些出口,比如在荷載層面、空間層面、架構(gòu)層面做適度合理的極簡。”
今年以來,海外科技巨頭們在AI基建上持續(xù)加碼。今年8月,OpenAI CEO奧特曼表示,未來公司將投入數(shù)萬億美元夯實AI基建,用于支持各項人工智能服務(wù)。更早之前,Meta CEO扎克伯格也表示,Meta將斥資數(shù)千億美元建設(shè)幾個大型AI數(shù)據(jù)中心。
據(jù)統(tǒng)計,2025年年初以來,多個國家和地區(qū)紛紛宣布將千億美元以上資金規(guī)模投向AI基建領(lǐng)域。
針對我國AIDC和海外AI基建之間的發(fā)展路徑差別,王志強回應稱: “在功率密度上,國際領(lǐng)先項目已普遍達到120至150kW/柜,英偉達2028年規(guī)劃向600kW推進,更追求單柜的超高密度;而國內(nèi)更多依靠光網(wǎng)絡(luò)封裝,在我們可以掌握的制程下,通過集群的方式來解決,目前主流在40-60kW/柜。在技術(shù)路線上,海外更注重GPU的性能發(fā)揮,常配置冷機提供中溫冷凍水,通過更低的水溫使GPU能夠工作在更高效的功率段上,而國內(nèi)受節(jié)能降耗驅(qū)動,大概供水的水溫在30—40攝氏度,是比較高的,可以實現(xiàn)全年的自然冷卻(可能會限制部分算力設(shè)備的峰值性能)。”
此外,在集群規(guī)模上也面臨差距?!昂M庖褜崿F(xiàn)10萬卡的集群落地,而國內(nèi)基于國產(chǎn)算力卡的超大規(guī)模集群也在做,但規(guī)模再大就會面臨組網(wǎng)的挑戰(zhàn)。不過目前很多技術(shù),比如硅光封裝、光互聯(lián)等正在解決產(chǎn)業(yè)界的問題。”王志強說道。
雖然我國AIDC建設(shè)面臨諸多挑戰(zhàn),但產(chǎn)業(yè)各方已積極行動。中國電子技術(shù)標準化研究院高級工程師沈芷月介紹稱,在標準方面,全球計算聯(lián)盟(GCC)已經(jīng)布局了智能計算、數(shù)據(jù)中心、機密計算、邊緣計算、綠色計算等多個領(lǐng)域的重點標準,目前已發(fā)布20項,預計年底將達到30項。在技術(shù)的研發(fā)與創(chuàng)新方面,針對目前AIDC面臨的熱、電、空間等問題的挑戰(zhàn),產(chǎn)業(yè)界將繼續(xù)投入新技術(shù)的研發(fā)和推廣,以提升AIDC的能效和性能。此外,還會加大產(chǎn)業(yè)協(xié)同與生態(tài)建設(shè)。
免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風險自擔。
封面圖片來源:每經(jīng)記者 王晶 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP