首頁 > 新能源汽車

地平線能否成為英偉達在汽車AI芯片領(lǐng)域真正的對手?

來源:新能源汽車網(wǎng)
時間:2022-06-02 07:15:11
熱度:

地平線能否成為英偉達在汽車AI芯片領(lǐng)域真正的對手?都是2023年。3月22日,英偉達宣布比亞迪將投產(chǎn)搭載DRIVE Orin計算平臺的汽車。一個月后,地平線宣布,第三代產(chǎn)品征程5芯

都是2023年。

3月22日,英偉達宣布比亞迪將投產(chǎn)搭載DRIVE Orin計算平臺的汽車。

一個月后,地平線宣布,第三代產(chǎn)品征程5芯片首個定點合作,花落比亞迪。

兩項合作的上車時間,都是2023年。

比亞迪并不是唯一一個同時部署英偉達和地平線的車企。理想在其爆款2021理想ONE上搭載了征程3以實現(xiàn)高速領(lǐng)航駕駛輔助能力,而在最新的理想L9上則將使用英偉達Orin。目前,地平線芯片的定點企業(yè)達到60家,基本可以肯定,其中也有英偉達的客戶。

有評論認為,這是因為地平線是國內(nèi)鮮有通過了車規(guī)級的大算力AI芯片,而且更加便宜,所以車企選擇其作為英偉達Orin的“平價替代”和供應鏈安全B選項。

這一說法并非全無道理。

但2015年地平線成立時,英偉達的芯片已經(jīng)開始準備上車特斯拉。短短6年多時間里,一個中國創(chuàng)業(yè)公司如何能夠與AI芯片王者進入同一份采購清單?

更重要的是,在更遠的未來,地平線將只是英偉達的“平替”,還是將一路追趕,成為其在汽車AI芯片領(lǐng)域真正的對手?

本文為大家奉上地平線和英偉達全方位的對比,幫助您做出判斷。

01

邏輯:阿爾法狗會開車嗎?

如果說起廣為人知的人工智能(AI),阿爾法狗肯定算一號。

2016年,谷歌圍棋人工智能“阿爾法狗”(AlphaGo Lee)以4:1的成績,戰(zhàn)勝世界冠軍數(shù)量排名第二的韓國棋手李世石。

2017年,阿爾法狗與李世石對弈

圍棋的特性決定了其不適用窮舉法,相比算力更考驗棋手的“腦力”,因此這場“人機大戰(zhàn)”成為人工智能史上一座里程碑:AI在某些領(lǐng)域能比人類更“聰明”。

但圍棋翹楚AlphaGo Lee能開車嗎?

答案恐怕是否定的。定位為圍棋人工智能的阿爾法狗以進行推理任務的決策算法為主,其所采用的神經(jīng)網(wǎng)絡類型也許并不能勝任視覺感知的任務;

AlphaGo Lee的服務器

為進行比賽,阿爾法狗所需算力高達約4416TOPS功耗高達10000W(DeepMind論文),100度電量的車也只能支撐10小時(紋絲不動),更別說帶著衣柜大小的服務器;

更重要的是,在比賽中,阿爾法狗擁有共計兩個小時+180秒的“思考”時間,而汽車一秒多想的時間都沒有。

不能開車的阿爾法狗顯示出了人工智能/神經(jīng)網(wǎng)絡在實際應用中的苛刻要求:相比于人類智能的高通用性,人工智能在功能實現(xiàn)上,與應用場景、AI算法模型、部署硬件情況息息相關(guān)。

正是這種高度相關(guān)性為地平線追趕英偉達提供了邏輯基礎(chǔ)。

1.1站在云端的英偉達

英偉達是第一個為AI創(chuàng)造出合適物理“大腦”的公司。

創(chuàng)立于1993年的英偉達在1999年發(fā)明了GPU(圖形處理器)。相比于CPU,GPU從架構(gòu)上算子的數(shù)量要遠遠多于Cache(緩存)和Control(控制器),由此導致其只適用于計算密集與數(shù)據(jù)并行的運算程序。

所謂計算密集指:數(shù)值計算的比例要遠大于內(nèi)存操作,因此內(nèi)存訪問的延時可以被計算掩蓋,對緩存的需求較低;

數(shù)據(jù)并行則是說:大任務可以拆解為執(zhí)行相同指令的小任務,因此對復雜流程控制的需求較低。

AI機器學習正是這樣的“運算程序”:將一個復雜問題拆解為眾多的簡單問題,一次性輸入海量用于計算的參數(shù)。對簡單問題解決的順序性要求不高,最后輸出整體結(jié)果即可。

而且對存儲和控制空間需求小,導致GPU更容易增加算子,以此增加算力,并在此后成為“大算力”的領(lǐng)軍企業(yè)。

但要高效運行GPU的代碼極度困難,程序員需要把相關(guān)運算“黑進”圖形API(應用程序編程接口),讓顯卡以為是在進行圖像渲染計算,編程難度極高。

直到2006年英偉達發(fā)布了CUDA?通用并行計算架構(gòu),實現(xiàn)了軟硬解耦。開發(fā)者不必再使用高難度的GPU專用開發(fā)語言,而能使用通用性的編程語言調(diào)用GPU算力。

英偉達CUDA架構(gòu)與應用方向

至此,GPU“破圖而出”,成為通用并行數(shù)據(jù)處理超級加速器。英偉達也由此站上了C位,成為AI時代的加速器。

一方面,搭載英偉達 GPU 硬件的工作站、服務器和云通過CUDA軟件系統(tǒng)以及開發(fā)的CUDA-XAI 庫,為AI領(lǐng)域的機器學習、深度學習所需的訓練和推理提供軟件工具鏈,來服務眾多的框架、云服務等等,推動了 AI 領(lǐng)域的迅速發(fā)展。

另一方面,英偉達從此前單純的芯片制造商,向人工智能平臺公司發(fā)展,逐步將業(yè)務拓展到云端的AI加速、HPC(高性能計算機群)高性能計算、AR/VR(增強/虛擬現(xiàn)實技術(shù))等領(lǐng)域。

英偉達CEO黃仁勛也在CUDA生態(tài)積累14年后放言:“ 英偉達不是游戲公司,它將推動下一個人工智能大爆炸”。

但至少目前,從業(yè)務結(jié)構(gòu)上英偉達還是一個中心化的云端數(shù)據(jù)中心和游戲公司。

英偉達數(shù)據(jù)中心

5月26日,英偉達發(fā)布2023財年Q1財報(截至2022年3月),實現(xiàn)營收82.9億美元,同比增長46%。其中,由超大規(guī)模計算、云端和AI業(yè)務推動的數(shù)據(jù)中心業(yè)務占比45.23%;顯卡支撐的游戲業(yè)務占比43.67%。

以云端數(shù)據(jù)中心業(yè)務為核心,英偉達的核心技術(shù)需要服務這一場景。

但云端(服務器、數(shù)字中心)和端側(cè)(手機、智能汽車等移動端)場景中, AI芯片的運算方式有著本質(zhì)性的差別。

·    首先,云端處理大批量一次性到達的累積數(shù)據(jù)(擴大批處理量,batch size),車端芯片則需要處理流數(shù)據(jù),隨著行駛(時間)陸續(xù)到來的數(shù)據(jù);

·    第二,云端處理可以“等”數(shù)據(jù)“夠了”再開始處理,車端則需要實時完成計算,盡可能得降低延遲,更勿論幾秒鐘的“等待”;

·    第三:在云端,任務本身是限定在虛擬世界,無需考慮與現(xiàn)實世界的交互。在車端則身處現(xiàn)實世界,每一個任務都需要考慮交互性。

·    此外,功耗和成本在車端AI芯片的考量中也占據(jù)更重的分量。

可見,云端AI芯片更側(cè)重于數(shù)據(jù)吞吐量和支持多種AI任務的要求,車端的AI芯片則須保證很高的計算能效和實時性要求,能夠?qū)崿F(xiàn)端側(cè)推斷,以及低功耗、低延遲甚至低成本的要求。

但目前,英偉達端側(cè)芯片的核心GPU架構(gòu)仍是云端架構(gòu)。

Orin誕生于Ampere(安培) 架構(gòu),其正是一季度推動英偉達數(shù)據(jù)中心業(yè)務增長近9成的主力產(chǎn)品架構(gòu)。換而言之,面向高級別自動駕駛場景的Orin,其中的核心計算模塊技術(shù)對標的是云端數(shù)據(jù)中心場景。

2019-2022財年(英偉達財年較自然年提前一年)汽車營收占比

英偉達的這一選擇無可厚非。架構(gòu)是芯片企業(yè)最底層的核心技術(shù),迭代成本巨大,也是為了產(chǎn)出更賺錢的產(chǎn)品。雖然汽車業(yè)務已成為英偉達圖形技術(shù)大會上的重要一節(jié),但其創(chuàng)造的營收目前仍是微不足道——占比2.1%(2022財年)。

1.2站在“端側(cè)”的地平線

而地平線目前的核心業(yè)務只有端側(cè)的汽車。

地平線的完整名為“地平線機器人”,其創(chuàng)立設(shè)定的場景便是機器人這樣需要實時完成計算的端側(cè)場景,其產(chǎn)品所有的軟硬件架構(gòu)都為端側(cè)的特殊需求設(shè)計。

但“機器人”此前更多存在于科幻電影當中,直到自動駕駛使汽車成為機器人在現(xiàn)實世界中的第一個爆發(fā)點。

“單一”的業(yè)務結(jié)構(gòu)使地平線的技術(shù)能夠聚焦在“一種”需求上,而汽車智能化需求的爆發(fā)則為從智能/自動駕駛場景出發(fā),收斂AI任務范圍,打造更貴、更具針對性的專用型芯片提供了規(guī)?;A(chǔ),使其商業(yè)模型能夠成立,從而吸引投資人和專業(yè)“選手”進場。

“GPU這樣的通用芯片對于開發(fā)者非常友好,但不是商業(yè)化競爭的最優(yōu)解,” 一位芯片行業(yè)專家向《電動汽車觀察家》表示:“地平線采用面向特定場景的軟硬結(jié)合方法論來設(shè)計芯片,也就是DSA(Domain Specific Architecture 特定領(lǐng)域架構(gòu))的芯片,極大提升了芯片的有效算力?!?/p>

軟硬解耦,將圖形處理的專用芯片GPU變?yōu)檫m用于大規(guī)模并行計算的通用型芯片,使英偉達站上AI時代的C位。

而地平線追趕英偉達的第一步,是軟硬結(jié)合。

地平線在公眾亮相中多次強調(diào)軟硬結(jié)合方法論核心——以終為始:

·    永遠從系統(tǒng)的視角評價其中每個模塊(從AI模型、工具鏈、開發(fā)工具的全體系出發(fā),看待芯片上每個細微空間的排布邏輯和利用效率);

·    永遠用未來的預測來指導當下每個選擇(針對自動駕駛AI未來算法演進趨勢,指導當下的技術(shù)研發(fā)方向和取舍關(guān)系)。

地平線的軟硬結(jié)合開發(fā)模式

地平線芯片開發(fā)過程中的一個環(huán)節(jié)可以從一個側(cè)面展示軟硬結(jié)合的方法到底如何落地。

地平線有一個AI模型性能分析工具。首先將選取包含了豐富的、代表未來演進趨勢的算法模型作為Testing Benchmark(測試基準)。將其在地平線BPU架構(gòu)的建模工具上進行運行,測試這架構(gòu)對算法模型的運算性能如何,并基于這一測試基準,探索軟件層面的編譯器、模型量化工具、訓練工具應該怎么做。

地平線軟硬結(jié)合下的工程性能驗證模式

由于芯片從設(shè)計到最終應用有著二到三年的”時差“,這樣的工作流程幫助地平線以軟性的算法趨勢指導硬件架構(gòu)設(shè)計,提前“適應“未來。

“像地平線已經(jīng)達到百萬芯片出貨量的征程二代和征程三代芯片里就有比較多的設(shè)計,在2016年、2017年時已經(jīng)考慮到了相關(guān)一些算法的演進趨勢?!暗仄骄€高級研發(fā)總監(jiān)凌坤表示。

3      首頁   下一頁   上一頁   尾頁