首頁 > 新能源汽車

AI芯片禁令下,本土智能駕駛承壓能力全解析

來源:新能源汽車網(wǎng)
時間:2023-07-13 10:15:18
熱度:

AI芯片禁令下,本土智能駕駛承壓能力全解析作者|Alex博士編輯|德新一、禁令加碼給智能汽車業(yè)的沖擊6月末大洋彼岸的一則新聞再次觸動了中國AI產(chǎn)業(yè)界的神經(jīng)。據(jù)《華爾街日報》援引消息

作者|Alex博士

編輯|德新

一、禁令加碼給智能汽車業(yè)的沖擊

6月末大洋彼岸的一則新聞再次觸動了中國AI產(chǎn)業(yè)界的神經(jīng)。

據(jù)《華爾街日報》援引消息人士透露,美國正在醞釀新一輪的AI芯片禁令,在去年禁令的基礎(chǔ)上,進(jìn)一步 擴(kuò)大限制范圍。

新禁令最快可能7月落地,屆時中國公司極有可能連A800等性能閹割版AI芯片都無法獲得,目的就是為了進(jìn)一步減緩國內(nèi)通用AI算力的發(fā)展速度,在AI賽道持續(xù)打壓國內(nèi)科技產(chǎn)業(yè)。

上一輪禁令出臺于去年9月。當(dāng)時美國商務(wù)部發(fā)布了對華半導(dǎo)體出口限制新規(guī),以英偉達(dá)A100為基線,要求限制超過基線性能的AI芯片對華出口,英偉達(dá)A100/H100和AMD公司的MI100/MI200等大算力GPU芯片均在限制范圍內(nèi),這些芯片均是云端數(shù)據(jù)中心的主流加速卡(GPGPU)。

為了減少業(yè)務(wù)沖擊,英偉達(dá)迅速調(diào)整產(chǎn)品策略,相繼推出了 A800和H800兩款中國特供版芯片,以滿足合規(guī)要求。雖然兩款芯片的紙面算力與A100/H100無異,但互聯(lián)帶寬只有后者的一半,意味著集群后的算力規(guī)模會受制于卡間互聯(lián)的帶寬。

自去年底以來,以 ChatGPT為代表的AIGC大模型賽道突然崛起,導(dǎo)致高性能GPU芯片需求暴漲。

產(chǎn)業(yè)界普遍認(rèn)為,大模型是繼智能駕駛之后又一個具有廣闊市場前景的科技主賽道,中美兩國都在積極布局搶占先機(jī)。在此背景下,美國可能意識到此前的芯片禁令力度不夠,需要追加新禁令,核心是幫助美國公司在核心AI賽道對中國公司保持絕對領(lǐng)先地位。

AI芯片不僅是大模型的基石,也是推動智能駕駛落地和進(jìn)化的核心“生產(chǎn)力工具”,潛在新禁令將對智能駕駛產(chǎn)業(yè)產(chǎn)生哪些影響,是智駕從業(yè)者需要認(rèn)真評估的課題。

更令人擔(dān)心的是,如果禁令繼續(xù)加碼,AI芯片限制范圍不斷擴(kuò)大,將對智能駕駛行業(yè)產(chǎn)生哪些新的沖擊。在回答這兩個問題之前,需要對AI芯片類別及其智駕應(yīng)用場景做一些基礎(chǔ)梳理。

二、AI芯片分類:云端與邊緣、訓(xùn)練與推理

AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應(yīng)用中的大量計算任務(wù)的模塊(其他非計算任務(wù)通常由CPU負(fù)責(zé))。

AI芯片產(chǎn)品種類繁多,通常有三大分類維度: 應(yīng)用場景、部署位置以及芯片架構(gòu)。

·應(yīng)用場景:分為訓(xùn)練(Training)和推理(Inference)。

訓(xùn)練芯片是用于構(gòu)建AI神經(jīng)網(wǎng)絡(luò)模型的高性能算力芯片,主打高并行數(shù)據(jù)吞吐率和低功耗;

而推理芯片,則是利用已訓(xùn)練完成的AI模型進(jìn)行推理預(yù)測,基于輸入數(shù)據(jù)輸出推測結(jié)果,側(cè)重低延遲和低功耗,對算力要求偏低。

·部署位置:分為云端(數(shù)據(jù)中心)和邊緣端。

云端數(shù)據(jù)中心具有強(qiáng)大的計算能力和海量的數(shù)據(jù),承擔(dān)模型訓(xùn)練以及推理任務(wù)(例如目前爆火的AIGC大模型),對AI芯片要求是高性能和高吞吐量,數(shù)據(jù)中心是目前高性能計算AI芯片核心應(yīng)用場景;

邊緣端則使用訓(xùn)練好的模型進(jìn)行直接推理,更加注重實時性和低功耗,主要應(yīng)用場景包括機(jī)器人、智能駕駛、手機(jī)、物聯(lián)網(wǎng)設(shè)備等。

·芯片架構(gòu):分為GPU(一般特指GPGPU)、ASIC和FPGA。

GPU 作為最早從事并行加速計算的處理器,具有高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法方面擁有比 CPU 更高的效率。

ASIC是一種面向特定應(yīng)用場景的專有AI芯片,通過算法固化實現(xiàn)極致的性能和能效,平均性能強(qiáng)、功耗低和性價比高,但前期投入大、研發(fā)時間較長。

FPGA是一種半定制化芯片,在制造完成后仍然可以對芯片進(jìn)行靈活軟件功能配置,以滿足用戶獨特需求,具有可編程性、高并行性、低延遲和低功耗等特點,在云端和邊緣端的推理領(lǐng)域具有很高的應(yīng)用潛力。

三、AI芯片在智能駕駛中的應(yīng)用

GPU作為通用大算力芯片一般應(yīng)用于 智駕數(shù)據(jù)中心,賦能智能駕駛神經(jīng)網(wǎng)絡(luò)訓(xùn)練,包括數(shù)據(jù)自動標(biāo)注、環(huán)境感知、多模態(tài)融合以及規(guī)劃控制等各個環(huán)節(jié)。

隨著智駕滲透率的提升,車端采集并上傳到云端的各類信息數(shù)據(jù)量快速上升,亟需具有大規(guī)模AI處理能力的數(shù)據(jù)中心支撐。

去年10月的Tesla AI Day曾透露其超算中心擁有14000個GPU, 共30PB的數(shù)據(jù)緩存,每天有500000個新的視頻流入。

比亞迪也特別注重云端海量數(shù)據(jù)采集,目前已經(jīng)積累了150PB以上的數(shù)據(jù),并且每天新增1PB數(shù)據(jù),這些數(shù)據(jù)被用于下游的訓(xùn)練任務(wù),而且預(yù)計今年還會累計有6億公里的數(shù)據(jù),并在未來幾年通過研采車輛以及量產(chǎn)車隊實現(xiàn)指數(shù)級的數(shù)據(jù)儲備,以解決智駕的長尾問題。

目前 國內(nèi)多家OEM和Tier 1均在積極建設(shè)智駕數(shù)據(jù)中心。

·蔚來2022年就曾宣布與英偉達(dá)合作,基于A100打造自己的數(shù)據(jù)中心;

·小鵬汽車與阿里云合作在烏蘭察布建設(shè)了智算中心“扶搖”,宣稱云端算力可達(dá)600 PFLOPS;

·毫末智行發(fā)布了和火山引擎合作的“雪湖·綠洲”智算中心,稱其算力規(guī)模為670 PFLOPS;

·理想汽車同樣宣布了與火山引擎合作在山西打造智算中心,采購的公有云服務(wù)算力達(dá)750P FLOPS;

·吉利汽車則和阿里云在湖州成立了星睿智算中心,擁有810 PFLOPS(F的算力。

上述智駕數(shù)據(jù)中心的核心AI芯片基本都是基于 GPGPU(以英偉達(dá)A100/A800為主)。

行業(yè)標(biāo)桿Tesla的規(guī)劃則有所不同,Tesla正在基于其自研的ASIC訓(xùn)練芯片D1來打造專屬的Dojo超級計算機(jī),每個訓(xùn)練模塊將由25個D1芯片組成,計算能力將達(dá)到每秒9千萬億次(9PFLOPS),數(shù)據(jù)帶寬可達(dá)36TB/s,基本上實現(xiàn)了算力密度和數(shù)據(jù)吞吐能力的最大化。

ASIC作為專用大算力AI芯片,雖然被Tesla選擇用于構(gòu)建數(shù)據(jù)中心,但其核心場景仍是車載邊緣推理端—域控制器。目前域控制器中大量使用ASIC AI芯片,提供大算力高能效比的推理能力。

車端智能駕駛的實現(xiàn)需要依靠激光雷達(dá)、毫米波、攝像頭等多種傳感器對道路信息進(jìn)行感知,將感知數(shù)據(jù)上傳到域控制器進(jìn)行綜合處理,以識別各類動靜態(tài)道路參與者、道路結(jié)構(gòu)化信息和可行駛區(qū)域,控制車輛以規(guī)劃好的路徑進(jìn)行自主行駛。

整個過程對數(shù)據(jù)處理的要求非常高,不僅需要應(yīng)對海量的環(huán)境實時信息,還要在極低時延和較低功耗下進(jìn)行,時延事關(guān)行車安全,功耗則會影響續(xù)航,同時域控平臺的成本需匹配車輛售價,芯片成本約束較大。這些因素導(dǎo)致GPGPU無法部署在車端,只能使用專有ASIC AI芯片。

面向域控制器的ASIC AI芯片中屬英偉達(dá)布局最早,生態(tài)打造也最為全面和成熟。目前其車載端量產(chǎn)芯片包括Xavier、Orin X。

其中 Orin X是目前最具代表性的域控主流芯片,于2022年量產(chǎn),OrinX SoC包含170億晶體管,提供254TOPS(INT8)性能,基于7nm的制程工藝,功耗僅為50W,憑借英偉達(dá)CUDA出色的生態(tài)支持,Orin X在過去一段時間成為眾多國內(nèi)車企的首選。

英偉達(dá)已經(jīng)官宣了下一代車載自動駕駛芯片平臺Thor,算力達(dá)到恐怖的 2000TOPS(INT8),預(yù)計2024年量產(chǎn)。

另外國外如高通、Mobileye也提供大算力車載AI芯片,但量產(chǎn)時間偏晚。

 國產(chǎn)域控制器AI芯片這幾年發(fā)展也非常迅速,成果喜人,代表公司有 地平線、黑芝麻智能等。

其中地平線產(chǎn)品商業(yè)化進(jìn)展頗為迅速,其明星產(chǎn)品J5采用臺積電16nm工藝,單芯片算力128TOPS(INT8)、35W功耗、支持16+路攝像頭,是目前量產(chǎn)產(chǎn)品中性能僅次于英偉達(dá)的智能駕駛域控芯片平臺。

黑芝麻智能則主打華山系列AI芯片家族,包括A1000、A1000L和A1000 Pro,提供不同的算力等級匹配各類用戶需求,針對L3及以上,正在開發(fā)目標(biāo)算力為250+TOPS的A2000,黑芝麻智能近期已經(jīng)向港股提交了上市申請。

FPGA在智駕領(lǐng)域有兩重應(yīng)用身份。

第一重應(yīng)用是作為AI芯片起加速硬件的作用,面向推理階段,F(xiàn)PGA相比GPU具有低延遲、高并發(fā)的優(yōu)勢,但是智駕云端的實時性要求并不高,更多是離線處理,所以FPGA的獨特價值并不明顯,這和IT公司的實時推理系統(tǒng)并不一樣。

而在車載域控制器(邊緣推理)領(lǐng)域,F(xiàn)PGA高性能推理加速優(yōu)勢較為明顯,針對不同的量產(chǎn)車型項目配置靈活。

以宏景智駕為例,基于賽靈思的車規(guī)級XA Zynq UltraScale+MPSoC平臺,推出了具備 多核異構(gòu)架構(gòu)的高級自動駕駛域控制器—Gemini ADCU,主打高性能邊緣計算。但受制于成本和綜合指標(biāo),F(xiàn)PGA域控平臺目前并不是主流選擇。

第二重應(yīng)用是作為智駕傳感器SoC對原始傳感信號進(jìn)行高速實時處理,發(fā)揮其實時性好、配置靈活、開發(fā)友好度高等優(yōu)勢,目前主流雙目感知系統(tǒng)、激光雷達(dá)以及4D Radar等ADAS硬件系統(tǒng)均有FPGA嵌入式應(yīng)用的案例,Xilinx和Altera占據(jù)車載FPGA絕對主導(dǎo)地位。

以激光雷達(dá)為例,F(xiàn)PGA用來對光電信號進(jìn)行實時運算處理,基于ToF原理計算出每秒上百萬個點云,整個過程要在極短的時延下達(dá)成。目前禾賽、速騰、圖達(dá)通皆選用 Xilinx的ZynQ系列車規(guī)芯片。

實際上,作為車載傳感器SoC處理器的FPGA,其車規(guī)等級、功能安全等級及開發(fā)生態(tài)相比于計算指標(biāo)反而更加重要。

四、AI芯片禁令對智能駕駛的影響

先說說FPGA,基于客觀審慎分析,新禁令對車載FPGA的影響并不大。

雖然目前車規(guī)級FPGA基本來自于美國的Xilinx和Altera,但車載FPGA算力較低,屬于大消費電子領(lǐng)域范疇,且種類型號繁多,戰(zhàn)略性不像其他大算力AI芯片那么突出,所以美國尚不會有特別的針對性禁令。

而且國產(chǎn)FPGA替代已經(jīng)開始了,雖有些差距,并不是0和1的代際差別,關(guān)鍵時候是可以頂上去的。

但是禁令下的 GPU和ASIC芯片的處境就沒那么樂觀了。

隨著美國新禁令可能到來,智駕數(shù)據(jù)中心能力的建設(shè)將受到負(fù)面影響,很多高性能的GPGPU芯片無法正常采購。

雖然國產(chǎn)GPGPU公司從之前禁令中受益,并在“國產(chǎn)替代”概念下得到了格外關(guān)注,如天數(shù)智芯、寒武紀(jì)、黑芝麻智能、墨芯人工智能、燧原科技、壁仞科技、沐曦集成電路等,不管是迎合客戶市場還是配合產(chǎn)業(yè)政策,聚光燈下的產(chǎn)品策略顯得較為激進(jìn),而整體芯片設(shè)計能力、生態(tài)體系以及系統(tǒng)可靠性距英偉達(dá)還有較大差距(英偉達(dá)的核心算力壁壘是由GPU+ CUDA所組成的,近17年積累,軟硬件生態(tài)共生發(fā)展),迎頭趕上并非一朝一夕的事情,遠(yuǎn)水解不了近渴,智駕數(shù)據(jù)中心的算力升級必然會被遲滯。

不幸的是,行業(yè)內(nèi)卷加劇了智駕數(shù)據(jù)中心目前的算力瓶頸,尤其是隨著BEV-Transformer架構(gòu)的引入以及大模型與智駕領(lǐng)域相結(jié)合,進(jìn)一步推升了智駕數(shù)據(jù)中心的算力規(guī)模,以小鵬“扶搖”智算中心為例,其算力規(guī)模達(dá)到 600PFLOPS,換算成A100芯片大約需要至少1000片。當(dāng)然這個量級和大模型算力規(guī)模相比,仍是小巫見大巫,后者一般1-2萬片A100起步,據(jù)報道年初字節(jié)跳動向英偉達(dá)下單了10億美金合同用于采購10萬片A100。

 雖然手握鈔票無法買到高性能GPU芯片確實令人憋屈。

但是好消息是,一方面智駕模型訓(xùn)練并沒有大模型苛刻,訓(xùn)練參量規(guī)模小很多,所以算力不夠時間來湊的策略尚還可行,或者采用更多的稍低一些的算力芯片組合的方式緩解算力焦慮,或者租借其他公有云服務(wù)來補充,總能找到靈活的backup方案。

另一方面智駕訓(xùn)練的核心難點在于 城市道路場景,尤其是城市NOA下的非結(jié)構(gòu)化長尾場景催生了更大的算力需求。

有別于Tesla基于純視覺路線的強(qiáng)數(shù)據(jù)驅(qū)動,國內(nèi)絕大多數(shù)城市NOA選擇搭載LiDAR,LiDAR作為3D高精度傳感器,核心的優(yōu)勢是直接映射3D環(huán)境結(jié)構(gòu)化信息和目標(biāo)3D尺寸位置,為降低視覺等訓(xùn)練算力要求提供了潛在機(jī)會。

所以關(guān)于禁令對智駕云端數(shù)據(jù)中心的影響評估總結(jié)是: 有影響,但影響可控,可以通過調(diào)整建設(shè)策略、優(yōu)化訓(xùn)練策略和采用差異化智駕技術(shù)路線抵消部分負(fù)面影響。

至于車載端ASIC AI芯片,目前并不在新禁令限制范圍內(nèi)。此類芯片算力相比GPGPU算力偏小,更側(cè)重推理階段。

雖然英偉達(dá)在綜合實力上仍是行業(yè)龍頭,但沒有完全碾壓,國內(nèi)諸多等位替換的公司對其形成了較好牽制。

如 地平線J5也拿下了不少主流車型訂單,雖然算力有一定差距,但并不是代差,加上主機(jī)廠對域控平臺的選擇不僅看算力,還看工具鏈生態(tài)、算法支持和本土客戶服務(wù),這一點對于時間計劃非常敏感的車型開發(fā)異常重要,此外算力差距還可以靠增加SOC芯片數(shù)量或優(yōu)化算法功能來間接彌補。

幸運的是,目前最大的智駕域控芯片需求市場正是中國,英偉達(dá)車載邊緣ASIC芯片絕大部分都賣給了中國公司?;谝酝慕?jīng)驗,一旦中國占據(jù)絕對市場地位,奉行現(xiàn)實主義路線的美國是不敢輕易發(fā)布此類禁令的。

此外,考慮到智能駕駛功能從屬于車整體,地位目前不及三電,尚未到靠智能駕駛能力爭奪全球市場的階段,所以車載ASIC AI芯片還沒有進(jìn)入到美國的視野,如果未來有一天智駕成為乘用車的核心競爭力和絕對賣點,而屆時美國企業(yè)在核心產(chǎn)業(yè)鏈上有絕對的優(yōu)勢,不排除會有相關(guān)的禁令發(fā)布(禁令的前提是美國企業(yè)在產(chǎn)業(yè)鏈核心環(huán)節(jié)掌握絕對優(yōu)勢,否則像中國新能源三電系統(tǒng)這樣的賽道早就被美國盯上了)。

但是汽車整車制造天然厭惡供應(yīng)鏈風(fēng)險,因為整車因供應(yīng)鏈問題導(dǎo)致無法下線,損失是以分鐘計,這是無法承受之重,比智算中心缺芯的后果要嚴(yán)重得多。所以一旦存在供應(yīng)不確定性,必然會提前采取保供策略(缺芯導(dǎo)致),疫情期間缺芯的慘痛教訓(xùn)還歷歷在目。在多輪芯片禁令的影響下,敏感且老辣的主機(jī)廠肯定會做兩手準(zhǔn)備,積極尋找國產(chǎn)替代,其實很多主機(jī)廠在域控芯片的選擇上已經(jīng)考慮多種路線并行, 國外+國產(chǎn)雙備份。

例如比亞迪新一代王朝和海洋系列的部分車型以及仰望U8選擇搭載Orin X計算平臺,而新發(fā)布的海獅將會搭載J5計算平臺。

理想L9/L8/L7的AD Max是基于Orin X開發(fā),而L8/L7的AD Pro均基于J5。

比亞迪和理想的雙域控平臺戰(zhàn)略應(yīng)該不是簡單基于芯片功能參數(shù)的商業(yè)選擇,大概率還有基于供應(yīng)鏈風(fēng)險管控的深層考量。 

更有甚者當(dāng)屬蔚來,NT2.0車型全系智駕平臺均選擇Orin X獨供,但其實早在2020年就悄悄組建了芯片團(tuán)隊自研域控算力芯片,重金投入,進(jìn)展不俗。

五、禁令風(fēng)險以后會不會繼續(xù)擴(kuò)大?

目前來看是極有可能的,這很大程度上取決于 中美兩國通用AI大模型的發(fā)展速度。

如果中國的發(fā)展速度并沒有得到預(yù)期的延緩,美國可能會出臺進(jìn)一步的限制措施,比如直接切斷美國公司的GPU供貨,甚至要求臺積電停止面向中國公司的代工服務(wù)、禁止向中國公司授權(quán)ARM架構(gòu)等等,極有可能讓國產(chǎn)GPU公司停擺,徹底阻止中國公司獲得高性能計算芯片。

另外隨著智能駕駛滲透率不斷提升和顯性化價值持續(xù)增強(qiáng),也會影響美國對該領(lǐng)域戰(zhàn)略地位的觀點和判斷,以決定是否加強(qiáng)遏制。

果真如此,無異于脫鉤斷鏈,意味著中美的全面攤牌,近期中國對鎵鍺實施出口管制讓全球半導(dǎo)體產(chǎn)業(yè)鏈為之震動,這正是對美國系列禁令的強(qiáng)硬反擊,相信務(wù)實的美國在下一步行動上定會異常謹(jǐn)慎抉擇。

除了對某類行業(yè)的制裁外,美國還會對單個中國公司進(jìn)行精準(zhǔn)打擊,比如大疆、華為、中芯國際等。

當(dāng)某個中國公司已經(jīng)威脅了美國的科技和市場戰(zhàn)略地位時,美國會毫不猶豫進(jìn)行封殺,近年來屢試不爽。

未來一段時間達(dá)摩克里斯之劍會一直懸在中國AI芯片產(chǎn)業(yè)頭上,打鐵還需自身硬,唯有掌握核心能力才能行穩(wěn)致遠(yuǎn)。

       原文標(biāo)題 : HiEV洞察 | AI芯片禁令下,本土智駕承壓能力全解析