|

隨著深度學習、仿真、BIM設計、AEC行業在各行各業應用的發展,在AI技術虛擬GPU技術的加持之下,需要強大的GPU算力解析。無論是GPU服務器,還是GPU工作站都趨向于小型化、模塊化、高集成度設計方向發展。熱流密度經常達到傳統風冷GPU服務器設備的7-10倍,由于采用模塊集中安裝方案,擁有數量眾多且發熱量大的NVIDIA英偉達GPU顯卡,因此散熱問題非常突出。過去常用的散熱設計技術已經無法滿足新系統的使用要求,傳統的水冷GPU服務器還是液冷GPU服務器都離不開風扇的加持,今天我們就來解析一下熱虹吸管散熱技術。
目前市場上的熱虹吸散熱技術主要還是利用柱型或板型散熱器為體,在散熱器底部穿入熱媒管,殼體內注入工質,并建立真空環境,這是一種常溫重力式熱管。工作過程如下:在散熱器底部,供熱系統通過熱媒管將殼體內的工質加熱,在工作溫度范圍內,工質沸騰,蒸汽上升至散熱器上部凝結放熱,凝結液沿散熱器內壁回流至加熱段被再次加熱蒸發,熱量通過工質的不斷循環相變由熱源傳遞至熱沉,達到供熱、加熱的目的。
1熱虹吸散熱在GPU工作站上的運用
每一代CPU散熱器是如何一步步走向當代的理論性能的極限。從最原始的鋁制散熱片到現在,它都是不錯的選擇。大家可能想既然一些小鰭片就這么好用,那更多更大的鰭片是不是更好用?然而結果并非如此。鰭片離熱源距離越遠,鰭片溫度就越低。當溫度降低至周圍空氣的溫度時,無論將鰭片做的多長,熱傳遞也不會繼續增加。

當現代GPU計算功耗進入75至350瓦區間甚至更高時,熱設計工程師們轉而研發新的散熱方法。熱管本身并沒有增強散熱器的散熱能力。它的作用是同時利用熱傳導和熱對流,來實現遠高于金屬本身的熱傳遞效率。
早在1937年就有熱虹吸技術出現,正常運行時熱管內部的液體會沸騰,蒸汽通過蒸汽腔到達冷凝端,蒸汽變回液體后再通過管芯返回熱源,管芯通常是燒結上去的金屬內層,可如果熱管吸收太多熱量,則會出現“熱管干涸”的現象。液體不僅在蒸汽腔內變成蒸汽,同時也會在管芯內變成蒸汽,導致其無法變回液體返回熱源,大幅增加了熱管的熱阻。

現在我們的重頭戲來了——熱虹吸。熱虹吸散熱不像熱管,用管芯將液體帶回蒸發端,而是僅僅利用重力,再加上一些巧妙的設計形成循環,把液體蒸發過程當水泵用。這并不是新技術,在放熱量大的工業應用中很常見。
一般來說,GPU內部制冷劑會沸騰,向上流動到里面的冷凝端內,變回液體并返回蒸發端。理論上有兩大優勢:
1. 避免熱管干涸,可用于超頻超高性能芯片
2. 因為不需要水泵,所以可靠性優于傳統一體式水冷
熱虹吸散熱現在最重要的一點是它的厚度將會從傳統的103毫米減少到僅僅30毫米(減到三分之一以下),外形相對小巧,不會損害性能。熱虹吸散熱的器材為了便于加工,目前廠家使用鋁材質居多。也有使用銅制,溫度可能還能再降5-10度,僅針對發熱量較大的GPU服務器。
敲黑板 敲黑板 敲黑板
劃重點-小藍用實驗數據來結束這次的重點。小藍測試的三種不同的英偉達GPU卡,普通風扇和熱虹吸散熱器在同等4卡水冷GPU服務器下的散熱數據:
圖一是RTX A6000功率為300瓦
圖二是RTX 3090,功率約350瓦
圖三是NVIDIA A100,功率約為400瓦


|