冷板式人工智能加速卡在結構設計、流體快插接頭、熱性能設計等方面無統(tǒng)一設計要求,服務器針 對不同廠商的冷板式人工智能加速卡需要進行結構和散熱適配,耗費大量人力、物力。本技術白皮書主 要制定標準PCIe接口形態(tài)的冷板式人工智能加速卡在結構設計、冷板設計、流體快插接頭選型、熱性能 設計、可靠性設計方面的要求,用于指導冷板式人工智能加速卡的設計。通過本白皮書提供的設計指導, 降低服務器和冷板式人工智能加速卡之間的適配難度,降低適配的成本和人力投入。同時降低部署和運 維難度,方便終端客戶根據(jù)業(yè)務場景靈活選擇相應產(chǎn)品,加速液冷式人工智能加速卡和服務器產(chǎn)品上市。 此外,通過統(tǒng)一的設計指導,在冷板本體、流體快插接頭等關鍵組件上產(chǎn)生規(guī)模化效益,獲取低成本液 冷解決方案,推動冷板式液冷技術的普及。
以AIGC為代表的人工智能大模型的發(fā)展,帶來了算力需求的指數(shù)式提升。AI芯片需要通過提升工 作頻率或增加運算單元來獲得更強的算力,帶來人工智能加速卡功耗的不斷提升。當前人工智能加速卡 單卡功耗已達到350W至600W量級,帶來服務器散熱功耗的顯著提升,在給服務器散熱設計帶來挑戰(zhàn)的 同時,也給建設綠色數(shù)據(jù)中心帶來了很大的挑戰(zhàn)。液冷技術成為解決人工智能服務器高功耗散熱問題、 降低數(shù)據(jù)中心PUE的關鍵,其中冷板式液冷技術是當前解決人工智能加速卡高功耗問題的主流方案。目 前標準PCIe接口形態(tài)的人工智能加速卡仍然是業(yè)界主流,國內(nèi)外部分廠商已經(jīng)推出了相應的冷板式人工 智能加速卡,但均是按照自身產(chǎn)品形態(tài)特征進行設計,未考慮同行業(yè)其他廠商情況,不能作為標準化設 計。
同時,雖然冷板式液冷散熱技術在CPU、內(nèi)存、扣板式人工智能加速卡上已經(jīng)取得了成功應用,但 在標準PCIe接口形態(tài)的人工智能加速卡上的應用仍然很少,業(yè)界迫切需要一個針對標準PCIe接口形態(tài)人 工智能加速卡的液冷設計指導,來推動冷板式散熱技術在人工智能加速卡應用的普及。
冷板式液冷加速卡由人工智能加速板卡、液冷板、加速卡外殼結構件組成。
冷板覆蓋加速卡上的主芯片及其他發(fā)熱元件(包括但不限于VR、顯存等),提高板卡封裝狹小空 間內(nèi)人工智能芯片散熱效率。加速卡對外提供一對流體快插接頭(兩個公頭),用于連接服務器內(nèi)部集 /分水結構或RCM。
冷板式人工智能加速卡能夠有效避免局部熱點,降低服務器系統(tǒng)風扇功耗,降低數(shù)據(jù)中心整體PUE, 是未來綠色數(shù)據(jù)中心發(fā)展的必然趨勢。
資料獲取 | |
新聞資訊 | |
== 解決方案 == | |
== 機器人推薦 == | |
服務機器人(迎賓、講解、導診...) |
|
智能消毒機器人 |
|
機器人底盤 |