國(guó)務(wù)院關(guān)于印發(fā)《2024—2025年節(jié)能降碳行動(dòng)方案》的通知
-40℃~70℃,挑戰(zhàn)邊緣服務(wù)器環(huán)境適應(yīng)極限!
-40℃~70℃,挑戰(zhàn)邊緣服務(wù)器環(huán)境適應(yīng)極限!沒(méi)有什么事情是不可能的,不可能的意思,就是“不,可能。”剛剛過(guò)去的今年夏天格外炎熱,中國(guó)多地最高氣溫超過(guò)40℃
沒(méi)有什么事情是不可能的,不可能的意思,就是“不,可能。”
剛剛過(guò)去的今年夏天格外炎熱,中國(guó)多地最高氣溫超過(guò)40℃,令很多人心有余悸。但很多人并不知道的是,并非血肉之軀才有環(huán)境極限,鋼鐵之軀的智算設(shè)備也有。面對(duì)戶外夏季70℃的極熱、冬季-40℃的酷寒、雷電暴雨和大漠風(fēng)沙的“魔法攻擊”,如何保證安放在各種邊緣環(huán)境下的服務(wù)器能正常運(yùn)作不會(huì)停擺?
作為中國(guó)邊緣服務(wù)器市場(chǎng)第一的廠商,浪潮邊緣服務(wù)器的研發(fā)工程師跟極限環(huán)境“硬剛”,硬生生是把“不可能”變成了“不,可能。”
▌一群不停“找虐”的人
就像旅人們熱衷于追逐美景用腳步丈量如畫山河,邊緣服務(wù)器的產(chǎn)品經(jīng)理也步履不停地去尋找各種極限環(huán)境主動(dòng)“找虐”并“宣戰(zhàn)”。
邊緣計(jì)算,簡(jiǎn)單來(lái)說(shuō)就是指在靠近數(shù)據(jù)產(chǎn)生的一側(cè),采用網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、應(yīng)用核心能力為一體的平臺(tái),就近提供服務(wù)。簡(jiǎn)單打個(gè)比方,每天路上的交通攝像頭、工廠里的高端制造設(shè)備等等會(huì)產(chǎn)生巨量的數(shù)據(jù),而且越來(lái)越復(fù)雜,協(xié)同程度也越來(lái)越難,如何“就近”處理這些數(shù)據(jù),然后進(jìn)行云邊協(xié)同,提升大數(shù)據(jù)計(jì)算效率,就是邊緣計(jì)算服務(wù)器要做的。
做到海量計(jì)算不難,難的是,怎樣能讓這些邊緣智算設(shè)備在各種極限環(huán)境下也能扛起重任,穩(wěn)定在線。與數(shù)據(jù)中心常年恒溫恒濕的環(huán)境不同,邊緣計(jì)算的場(chǎng)景復(fù)雜多樣,這些看上去并不起眼的邊緣設(shè)備,需要放置在城市路口的信控箱、電信機(jī)房、油井現(xiàn)場(chǎng)的控制箱、邊緣電氣柜、工業(yè)現(xiàn)場(chǎng)控制柜、車載等等各類惡劣的環(huán)境中。這類環(huán)境有的空間狹小常年悶熱逼仄,有的卻要經(jīng)歷雨淋雪埋沙塵漫卷,這樣的環(huán)境對(duì)邊緣服務(wù)器的環(huán)境適應(yīng)性、算力性能都提出了很高的要求。
比如在智慧路口,邊緣設(shè)備需要放置在幾乎密不透風(fēng)的信控箱中,一些南方城市夏季最熱的時(shí)候,信控箱內(nèi)部最高溫度能達(dá)到60-70度。而從一般路口幾路視頻,到復(fù)雜道路路口的20路視頻,對(duì)邊緣算力的需求不斷提升,這就導(dǎo)致設(shè)備的功耗也在提升。而因?yàn)槭彝夥蹓m過(guò)重、空氣中的水蒸氣、酸性氣體、微生物也會(huì)侵蝕服務(wù)器內(nèi)部元器件,設(shè)備不能用傳統(tǒng)的風(fēng)扇設(shè)計(jì),這讓散熱設(shè)計(jì)面臨很大的挑戰(zhàn)。
用腳做調(diào)研,用心做設(shè)計(jì)。浪潮信息產(chǎn)品研發(fā)人員們?cè)谧顭岬南奶齑蜷_(kāi)過(guò)三亞路口的信控箱,在極寒的天氣里勘察過(guò)漠河油田的服務(wù)器,專門去找讓服務(wù)器極度“不適”的場(chǎng)景。服務(wù)器在雷暴中要能扛住多大的雷擊,在陰雨連綿中需要達(dá)到怎樣的防水等級(jí),這些都需要“技術(shù)猿”們親自到達(dá)現(xiàn)場(chǎng),以此在服務(wù)器上崗前完善設(shè)計(jì),確保它們能“扛住”邊緣環(huán)境的重重挑戰(zhàn)。
▌一塊三明治觸發(fā)的靈感
散落在各個(gè)地方各種環(huán)境下的的邊緣服務(wù)器,是智算力延伸到數(shù)字世界各個(gè)角落的末梢神經(jīng)元,需要練就鋼筋鐵骨。而極端高溫下的散熱,是鋼筋鐵骨也不能承受之重,更是橫亙?cè)谘邪l(fā)人員面前的攔路虎。產(chǎn)品經(jīng)理在實(shí)地勘察后敲黑板劃出重點(diǎn):邊緣服務(wù)器必須保證在70℃的高溫下也不會(huì)罷工。但反復(fù)實(shí)驗(yàn)改進(jìn)下的邊緣服務(wù)器,仍然差了那么一點(diǎn)點(diǎn)意思。
在戶外場(chǎng)景,邊緣服務(wù)器散熱設(shè)計(jì)的方向是,通過(guò)無(wú)風(fēng)扇設(shè)計(jì),讓設(shè)備和環(huán)境之間的熱量通過(guò)熱對(duì)流和熱輻射傳遞到空氣中。在邊緣服務(wù)器內(nèi)部,CPU一旦高速運(yùn)作,溫度最高可達(dá)90℃,要讓90℃高溫快速傳導(dǎo)到大約70℃的環(huán)境空氣中,就需要在散熱上蓋和熱源之間增加高導(dǎo)熱系數(shù)的導(dǎo)熱材料,讓熱量快速傳遞出去,工程師們做了很多嘗試,卻始終無(wú)法突破60℃的散熱極限。
與70℃“死磕”卻求而不得,讓技術(shù)研發(fā)一度陷入了僵局。轉(zhuǎn)機(jī)來(lái)自于一塊加班中用來(lái)充饑的三明治。
一層層食材疊加的靈感,啟發(fā)工程師們將服務(wù)器散熱上蓋底部壓鑄出導(dǎo)熱凸臺(tái),通過(guò)導(dǎo)熱凸臺(tái)與導(dǎo)熱界面材料、熱源部件依次貼合的結(jié)構(gòu),可以排出熱源上方的空氣,大大消除內(nèi)部界面熱阻。
從上到下,散熱蓋、凸臺(tái)、界面材料、熱源這一酷似“三明治”的結(jié)構(gòu)中,還針對(duì)邊緣服務(wù)器的百變需求,設(shè)計(jì)了不同的鋁擠工藝上蓋,讓導(dǎo)熱凸臺(tái)、界面材料的位置、大小隨著內(nèi)部器件的變化而變化,實(shí)現(xiàn)產(chǎn)品的靈活百變和高效散熱。同時(shí),研發(fā)人員還發(fā)現(xiàn),界面材料厚度的微小差異,都會(huì)影響散熱的效率,據(jù)仿真模擬數(shù)據(jù)顯示,材料厚度縮小0.6毫米,CPU的溫度就可以降低2.1℃,因此,需要在CPU、內(nèi)存等等部件凸臺(tái)最小結(jié)構(gòu)公差下,設(shè)計(jì)出最小厚度的界面材料。
經(jīng)過(guò)多次仿真和實(shí)測(cè),研發(fā)人員最終采用高導(dǎo)熱和高壓縮性的界面材料和凸臺(tái)填充在熱源與散熱外殼之間,導(dǎo)熱效率達(dá)到10W/m·K,是空氣導(dǎo)熱效率的435倍,讓服務(wù)器適應(yīng)的極限環(huán)溫從原來(lái)的60℃提升到67℃。
還差了最后的3℃,努力仍在繼續(xù)。
除了提升內(nèi)部的熱傳導(dǎo)效率,散熱工程師還要考慮設(shè)備與環(huán)境之間如何進(jìn)行高效的導(dǎo)熱,才能實(shí)現(xiàn)極限環(huán)境的適應(yīng)。研發(fā)人員結(jié)合熱仿真軟件對(duì)多組參數(shù)組合進(jìn)行對(duì)比分析,并繪制響應(yīng)面優(yōu)化曲線,最終確定出一組關(guān)于鰭片厚度、間隙和高度的最優(yōu)組合,在有限體積內(nèi)形成超過(guò)3000cm2的散熱面積,達(dá)到了最佳散熱能力。
同時(shí),為了進(jìn)一步減小上蓋散熱器內(nèi)部的擴(kuò)散熱阻,散熱上蓋中設(shè)計(jì)了2D熱管網(wǎng)絡(luò),熱管走向經(jīng)過(guò)反復(fù)優(yōu)化仿真,精準(zhǔn)布局,有效規(guī)避局部熱點(diǎn)的產(chǎn)生,提升整機(jī)均溫能力。
終于,一臺(tái)在無(wú)風(fēng)條件下,70℃極限環(huán)境也能高效運(yùn)轉(zhuǎn)的邊緣服務(wù)器橫空出世,站上C位。據(jù)研發(fā)測(cè)試,在無(wú)風(fēng)扇的邊緣服務(wù)器上,三明治架構(gòu)可將被動(dòng)散熱能力較上一代產(chǎn)品提升近100%。
▌一份智造的極致匠心
適應(yīng)所有不適應(yīng),讓小的積累構(gòu)成大的改變,浪潮信息研發(fā)員們精工細(xì)作的服務(wù)器遠(yuǎn)不止解決了散熱這一痛點(diǎn)。
邊緣服務(wù)器無(wú)限靠近數(shù)據(jù)產(chǎn)生的第一現(xiàn)場(chǎng),不僅可能面對(duì)極熱的環(huán)境,還會(huì)有極寒、風(fēng)沙、塵土、雷擊等等惡劣場(chǎng)景,每一類場(chǎng)景都需要進(jìn)行針對(duì)性的設(shè)計(jì),以保障服務(wù)器的穩(wěn)定運(yùn)行。例如在東北油田,考慮到一些低溫條件下電子設(shè)備難以啟動(dòng)的情況,邊緣服務(wù)器設(shè)計(jì)了低溫?zé)釂?dòng)裝置,當(dāng)環(huán)境溫度低于-40℃時(shí),自適應(yīng)調(diào)節(jié)系統(tǒng)會(huì)加熱服務(wù)器,讓內(nèi)部每一個(gè)芯片滿足溫度要求后再開(kāi)機(jī)啟動(dòng)。
另外,很多邊緣服務(wù)器會(huì)被放置于高山塔、深山燈等環(huán)境中,研發(fā)人員就在寸土寸金的邊緣服務(wù)器中,塞進(jìn)了一個(gè)遠(yuǎn)程運(yùn)維管理模塊,讓運(yùn)維人員可以遠(yuǎn)程勘查設(shè)備,大大減少了人力運(yùn)維成本。
書癡者文必工,藝癡者技必良。很多事情并不是看到了希望才去堅(jiān)持,而是因?yàn)閳?jiān)持才有了希望,正如研發(fā)工程師追求極致智造的匠心。每一處微小的設(shè)計(jì),都是基于邊緣場(chǎng)景做出的最適改變,不啻微芒終能造炬成陽(yáng),浪潮信息研發(fā)人員的不斷創(chuàng)新,為更多場(chǎng)景提供安全、穩(wěn)定的極致邊緣算力創(chuàng)造了可能,也為云邊協(xié)同的不斷破圈締造了希望。