91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Waymo對(duì)軟件算法過分重視,忽視了硬件平臺(tái)

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:佐思汽車研究 ? 2022-08-11 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Waymo早在2008年就開始投入自動(dòng)駕駛,當(dāng)時(shí)還屬于谷歌X事業(yè)部,不過14年過去,Waymo幾乎一事無成,聲音也越來越小,根本的原因就是Waymo對(duì)軟件算法過分重視,忽視了硬件平臺(tái)。這幾年英偉達(dá)、高通自動(dòng)駕駛芯片的崛起與Waymo的沒落形成鮮明對(duì)比。自動(dòng)駕駛的軟件和硬件是硬幣的兩面,無法分割,整套解決方案必然包括軟件和硬件。單獨(dú)提供軟件或硬件都沒有出路,因?yàn)樽詣?dòng)駕駛軟硬件配合度要求太高,很難移植。這主要是深度學(xué)習(xí)算法模型與硬件高度捆綁,兩者不匹配很容易導(dǎo)致效率低下,硬件的利用率低到10%以下是經(jīng)常遇到的。

Waymo早期是采用英特爾芯片做計(jì)算平臺(tái)的,主要是基于服務(wù)器CPU至強(qiáng)和FPGA加速卡。

81e47c5e-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯(lián)網(wǎng)

Waymo計(jì)算平臺(tái),其中以太網(wǎng)交換機(jī)應(yīng)該也是用FPGA搭建的,因?yàn)檫@么高帶寬的以太網(wǎng)交換機(jī)現(xiàn)在還沒有量產(chǎn),幾年前更不可能有了。只有FPGA能做到如此高的帶寬,代價(jià)是價(jià)格很高,至少在1000美元以上。還有兩個(gè)至強(qiáng)CPU之間應(yīng)該還需要PCIe交換機(jī)。 FPGA可能是Arria 10 1150GX,目前售價(jià)大約2000美元,2013年時(shí)可能要4000美元以上。Altera的FPGA共有四大系列,分別是頂配的Stratix系列、成本與性能平衡的Arria系列、廉價(jià)的Cyclone系列、帶NVM的MAX系列。Stratix系列多在近萬美元以上,Arria系列大約在2000-5000美元之間,Cyclone系列多在10-20美元之間。Arria系列再細(xì)分10、V、II、GX四個(gè)系列,10系列為最新產(chǎn)品,于2013年推出,采用20納米工藝,GX為第一代產(chǎn)品,2007年推出,采用90納米工藝,II系列為2009年產(chǎn)品,采用40納米工藝,V系列為2011年產(chǎn)品,采用28納米工藝。10系列再分為帶ARM內(nèi)核和不帶ARM內(nèi)核兩大類。ARM內(nèi)核為雙A9內(nèi)核。 1150GX擁有標(biāo)準(zhǔn)FPGA的1150K個(gè)邏輯元素外,還擁有1518個(gè)硬核單精度浮點(diǎn)運(yùn)算乘法器/加法器,3036個(gè)18*19乘法器。最終能夠獲得3340GMACS(等于每秒百萬次的定點(diǎn)乘累加運(yùn)算),還有1366 GFLOPS的浮點(diǎn)運(yùn)算能力。AI算力最高是26TOPS@Int8。在2013年這個(gè)算力可以算是非常驚人的,價(jià)格當(dāng)然也很驚人。 FPGA是效率最高的運(yùn)算單元,F(xiàn)PGA之所以比CPU甚至GPU能效高,本質(zhì)上是無指令、無需共享內(nèi)存的體系結(jié)構(gòu)帶來的福利。馮氏結(jié)構(gòu)中,由于執(zhí)行單元(如CPU核)可能執(zhí)行任意指令,就需要有指令存儲(chǔ)器、譯碼器、各種指令的運(yùn)算器、分支跳轉(zhuǎn)處理邏輯。由于指令流的控制邏輯復(fù)雜,不可能有太多條獨(dú)立的指令流,因此GPU使用SIMD(單指令流多數(shù)據(jù)流)來讓多個(gè)執(zhí)行單元以同樣的步調(diào)處理不同的數(shù)據(jù),CPU也支持SIMD指令。而FPGA每個(gè)邏輯單元的功能在重編程(燒寫)時(shí)就已經(jīng)確定,不需要指令。 FPGA中的寄存器和片上內(nèi)存(BRAM)是屬于各自的控制邏輯的,無需不必要的仲裁和緩存。對(duì)于通信的需求,F(xiàn)PGA每個(gè)邏輯單元與周圍邏輯單元的連接在重編程(燒寫)時(shí)就已經(jīng)確定,并不需要通過共享內(nèi)存來通信。FPGA實(shí)際就像是一片SRAM,它沒有AI芯片難以克服的內(nèi)存墻問題,有點(diǎn)像存內(nèi)計(jì)算,但要比存內(nèi)計(jì)算規(guī)模大太多了。FPGA的硬件利用率可輕松做到80%以上,因此FPGA的頻率都比較低。 但FPGA的布線沒有優(yōu)化,有大面積的硅片資源閑置,浪費(fèi)了,這導(dǎo)致其成本飛速上升,小規(guī)模的FPGA價(jià)格很低,一旦越過30-50萬邏輯單元,價(jià)格直線飛升。 Waymo的計(jì)算平臺(tái)單芯片成本就已超過4000美元,并且都是非車規(guī)的,顯然這無法量產(chǎn)。2019年以后,Waymo的聲音就慢慢沉寂,而軟硬一體的高通和英偉達(dá)發(fā)展越來越順利。 眼看英偉達(dá)和高通一飛沖天,Waymo也幡然悔悟,2021年就開始籌劃與三星推出自動(dòng)駕駛芯片,正式推出可能在2023年底。和英偉達(dá)、高通相比,Waymo的劣勢在于英偉達(dá)和高通都是芯片巨頭,兩者出貨量巨大,特別是高通,能夠大幅度降低芯片成本。Waymo訂制芯片,出貨量必然是很低的,谷歌的TPU用在數(shù)據(jù)中心,成本敏感度不高,但汽車不行。同時(shí)谷歌的TPU出貨量相對(duì)自動(dòng)駕駛汽車還是不低的。 要做到商業(yè)化,成本是必須考慮的。Waymo找到了三星做合作伙伴,三星每年手機(jī)CPU芯片上億,足以和高通抗衡,足以攤薄成本。三星與谷歌合作是從谷歌第一代手機(jī)芯片Tensor開始。高通的Snapdragon Ride平臺(tái)目前是SA8540p+SA9000。SA8540p近似于高通手機(jī)5納米芯片888,只不過SA8540p可能采用4大核4小核的設(shè)計(jì),即4個(gè)Cortex-X1加4個(gè)A78。去掉了強(qiáng)調(diào)A55小核。高通以此還衍生出針對(duì)筆記本電腦的8cx gen3,與SA8540p非常近似,但去掉了5G modem。 能做手機(jī)SoC,就能做自動(dòng)駕駛芯片,三星、蘋果、聯(lián)發(fā)科都可以。

81f050ce-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯(lián)網(wǎng)

谷歌第一代Tensor芯片,用于谷歌Pixel 6系列手機(jī)上,實(shí)際就是基于三星Exynos 2100的修改版。

第一代Tensor與三星Exynos2100對(duì)比

82073974-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯(lián)網(wǎng)

在NPU方面,Exynos 2100是壓倒性優(yōu)勢的26TOPS,谷歌是5.7TOPS。不過在實(shí)際測試中,Exynos 2100優(yōu)勢不明顯。

821210a6-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯(lián)網(wǎng)

驍龍888、谷歌Tensor與Exynos 2100的NNAPI即神經(jīng)網(wǎng)絡(luò)測試跑分,谷歌Tensor優(yōu)勢明顯。

8223d3ae-191b-11ed-ba43-dac502259ad0.png

NLP自然語言處理方面,谷歌Tensor優(yōu)勢非常明顯。

圖片來源:互聯(lián)網(wǎng)

8233d420-191b-11ed-ba43-dac502259ad0.png

離線圖像分類跑分測試,Tensor差距也不算大。

圖片來源:互聯(lián)網(wǎng)

Waymo的自動(dòng)駕駛芯片不大可能基于第一代Tensor,因?yàn)榈诙鶷ensor已于2022年7月底量產(chǎn)了。Waymo的自動(dòng)駕駛芯片很有可能基于第二代Tensor,目前未有基于第二代Tensor的消息,但很顯然,三星不會(huì)給谷歌做太多工作,應(yīng)該就是Exynos 2200的修改版,畢竟第一代Tensor的具體型號(hào)就是Samsung ExynosTensor GS101,從型號(hào)就能看出,這是Exynos2100的修改版。

8249311c-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯(lián)網(wǎng)

Waymo的自動(dòng)駕駛芯片芯片應(yīng)該會(huì)基于三星4納米工藝。超大核應(yīng)該還是兩個(gè)Cortex-x2,而不是Exynos的1個(gè)。兩個(gè)Cortex-710的中核,四個(gè)A510的小核。GPU方面估計(jì)也是基于AMD RNDA2代的GPU,足以和高通的Adreno 730一爭高下。 CPU和GPU沒有太多操作空間,NPU應(yīng)該是谷歌擅長的。

谷歌歷代TPU對(duì)比

8255d75a-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯(lián)網(wǎng)

谷歌從2016年推出第一代TPU,2021年推出第四代,第四代TPU的算力沒有公開數(shù)據(jù),只說比第三代的兩倍。第三代TPU的算力是360TOPS@Int8,那么第四代應(yīng)該是720TOPS@Int8。不過TPU是針對(duì)數(shù)據(jù)中心的。針對(duì)邊緣計(jì)算,谷歌還有TPU EDGE,價(jià)格非常低廉,應(yīng)該不超過10美元。 谷歌沒有公布TPU V4的算力,但給出了下表,用在各種算法模型上的消耗時(shí)間,完全可以超越頂級(jí)英偉達(dá)系統(tǒng)。

8267cbd6-191b-11ed-ba43-dac502259ad0.png

備注:這是在2021年中期測試的數(shù)據(jù)。

圖片來源:互聯(lián)網(wǎng)

Waymo的策略應(yīng)該與高通一樣,也是一片SoC加一片加速器。SoC基于二代Tensor也就是基于三星Exynos 2200,其內(nèi)部的NPU算力至少能到30TOPS。加速器應(yīng)該基于4代TPU或5代TPU做修改而來,算力估計(jì)360TOPS。這樣一來,成本大大降低,應(yīng)該不高于英偉達(dá)系統(tǒng)的成本。此外4代或5代TPU都應(yīng)該委托三星而非臺(tái)積電代工,臺(tái)積電代工當(dāng)然更好,但價(jià)格會(huì)遠(yuǎn)高于三星,且谷歌的訂單數(shù)量太少,在產(chǎn)能緊張大客戶云集的臺(tái)積電那里肯定要排隊(duì)等待,因此谷歌一直選弱勢的三星做合作伙伴。 自谷歌開始搞自動(dòng)駕駛以來,其定位就比較模糊,戰(zhàn)略經(jīng)常變化,最初似乎是想提供全套軟件解決方案,然后是自己制造無人駕駛小車,再后是做無人出租車運(yùn)營,現(xiàn)在似乎是回歸最初,提供包括硬件計(jì)算平臺(tái)在內(nèi)的全套解決方案。主要是自動(dòng)駕駛算法的門檻極低,單獨(dú)的算法沒多少價(jià)值,自動(dòng)駕駛軟件里最有價(jià)值的應(yīng)該是經(jīng)過人工標(biāo)注的數(shù)據(jù)集,這沒什么技術(shù)含量,完全靠人力和資金。如今Waymo試圖和英偉達(dá)或高通競爭,顯然已經(jīng)晚了,Waymo的最終結(jié)局想必大家都已經(jīng)能預(yù)測到。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22415

    瀏覽量

    636539
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54017

    瀏覽量

    466321
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14887

    瀏覽量

    179987

原文標(biāo)題:Waymo幡然悔悟,做自動(dòng)駕駛必須自研芯片

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    別再忽視充電芯片!HT4056H的這些保護(hù)功能真的很重要

    很多人在設(shè)計(jì)便攜設(shè)備時(shí),往往把注意力放在主控芯片上,卻忽視充電管理的重要性。HT4056H除了基本的恒流恒壓充電功能,還內(nèi)置欠壓閉鎖、電池反接保護(hù)、溫度監(jiān)控等多重安全機(jī)制。TDFN2×2封裝讓它能輕松塞進(jìn)各種小設(shè)備里,40V
    的頭像 發(fā)表于 02-25 11:42 ?236次閱讀
    別再<b class='flag-5'>忽視</b>充電芯片<b class='flag-5'>了</b>!HT4056H的這些保護(hù)功能真的很重要

    【「芯片設(shè)計(jì)基石——EDA產(chǎn)業(yè)全景與未來展望」閱讀體驗(yàn)】+ 芯片“卡脖子”引發(fā)對(duì)EDA的重視

    嶄露頭角,為中國半導(dǎo)體產(chǎn)業(yè)的自主可控發(fā)展奠定基礎(chǔ)。 EDA軟件是半導(dǎo)體產(chǎn)業(yè)的基石 EDA在芯片產(chǎn)業(yè)鏈中的位置 1.1.2 EDA是芯片之母EDA位于集成電路產(chǎn)業(yè)鏈最上游,是芯片設(shè)計(jì)的“基石”,是連接
    發(fā)表于 01-20 20:09

    軟件硬件的轉(zhuǎn)場:一場由OceanOS-CM0啟發(fā)的嵌入式思考

    編程的軟件開發(fā)者,初次接觸硬件時(shí),那種面對(duì)具體物理世界的“手足無措”感十分強(qiáng)烈。然而,OceanOS-CM0開發(fā)板及其配套資料卻提供一種獨(dú)特的橋梁——它讓我看到,軟硬件之間的鴻溝并非
    發(fā)表于 01-04 15:52

    硬件加密引擎在保障數(shù)據(jù)安全方面有哪些優(yōu)勢呢?

    通過專用電路(如 AES、RSA 等算法的專用邏輯單元)實(shí)現(xiàn)加密運(yùn)算,可并行處理數(shù)據(jù)流,避免軟件加密依賴 CPU 通用計(jì)算資源的瓶頸。例如,在物聯(lián)網(wǎng)設(shè)備傳輸海量傳感器數(shù)據(jù)時(shí),硬件加密引擎能以線速(如
    發(fā)表于 11-17 06:47

    廣凌智慧教室建設(shè)內(nèi)容:硬件軟件介紹

    廣凌科技(廣凌股份)憑借“硬件+平臺(tái)+數(shù)據(jù)”的深度融合,推出智慧教室整體解決方案,全面覆蓋智慧教室建設(shè)的硬件配置、軟件平臺(tái)、數(shù)據(jù)驅(qū)動(dòng)及場景適
    的頭像 發(fā)表于 11-11 16:17 ?1224次閱讀
    廣凌智慧教室建設(shè)內(nèi)容:<b class='flag-5'>硬件</b>與<b class='flag-5'>軟件</b>介紹

    寒武紀(jì)引領(lǐng)AI芯片軟件新生態(tài)

    體系,實(shí)現(xiàn)計(jì)算架構(gòu)、編譯優(yōu)化與算法調(diào)度的深度融合:硬件算法提供極致的并行性能與能效比,軟件則通過編譯優(yōu)化、調(diào)度策略與模型適配,讓每一份算
    的頭像 發(fā)表于 11-06 11:23 ?1377次閱讀
    寒武紀(jì)引領(lǐng)AI芯片<b class='flag-5'>軟件</b>新生態(tài)

    復(fù)雜的軟件算法硬件IP核的實(shí)現(xiàn)

    具體方法與步驟 通過 C 語言實(shí)現(xiàn)軟件算法,并驗(yàn)證算法的有效性以后,就可以進(jìn)行算法的 HDL 轉(zhuǎn)化工作了。通過使用 Altium Des
    發(fā)表于 10-30 07:02

    針對(duì)AES算法的安全防護(hù)設(shè)計(jì)

    軟件中隨機(jī)延遲的使用通常被認(rèn)為是對(duì)抗側(cè)信道攻擊的一般對(duì)策,但隨機(jī)延遲不能阻止攻擊,只能讓攻擊變得復(fù)雜。因此基于蜂鳥E203平臺(tái)的軟硬件實(shí)現(xiàn)方式,我們的安全防護(hù)設(shè)計(jì)也會(huì)從軟件
    發(fā)表于 10-28 07:38

    硬件融合拼接器與軟件融合拼接的區(qū)別?

    、內(nèi)存和存儲(chǔ)設(shè)備等組成,具備強(qiáng)大的計(jì)算和數(shù)據(jù)處理能力。它可以將多個(gè)圖像拼接成一個(gè)大的全景圖像,這個(gè)過程是在硬件設(shè)備中進(jìn)行的,因此速度較快。 而軟件融合拼接則是通過軟件算法來實(shí)現(xiàn)圖像的拼
    的頭像 發(fā)表于 09-28 14:33 ?534次閱讀

    AI的核心操控:從算法硬件的協(xié)同進(jìn)化

    ? ? ? ?人工智能(AI)的核心操控涉及算法、算力和數(shù)據(jù)三大要素的深度融合,其技術(shù)本質(zhì)是通過硬件軟件的協(xié)同優(yōu)化實(shí)現(xiàn)對(duì)復(fù)雜任務(wù)的自主決策與執(zhí)行。這一過程依賴多層技術(shù)棧的精密配合,從底層的芯片架構(gòu)
    的頭像 發(fā)表于 09-08 17:51 ?993次閱讀

    電源控制器MCU硬件在環(huán)(HIL)測試方案

    、 EasyGo 實(shí)時(shí)仿真平臺(tái) EasyGo 實(shí)時(shí)仿真平臺(tái)軟件硬件兩部分組成,二者協(xié)同工作,實(shí)現(xiàn)高精度、高實(shí)時(shí)性的仿真測試。 1、 硬件
    發(fā)表于 08-20 18:31

    PPEC電源DIY套件:圖形化算法編程,解鎖電力電子底層算法實(shí)踐

    智能化設(shè)計(jì)平臺(tái),為用戶提供一個(gè)接觸和操作底層算法的便捷途徑。 用戶無需進(jìn)行復(fù)雜的代碼編寫,可以一鍵套用工程模版,也可以通過圖形化界面自定義控制算法,就能夠輕松在實(shí)驗(yàn)室有限的環(huán)境中制
    發(fā)表于 08-14 11:30

    【干貨速遞】嵌入式數(shù)據(jù)可靠性,軟件設(shè)計(jì)的這些細(xì)節(jié)不能忽視!

    前兩期內(nèi)容分別講述嵌入式數(shù)據(jù)可靠性的元器件選型和硬件設(shè)計(jì),這一期我們來講講軟件設(shè)計(jì)。哪怕硬件設(shè)計(jì)再完善,但如果軟件沒有設(shè)計(jì)好,也達(dá)不到預(yù)期
    的頭像 發(fā)表于 07-31 11:34 ?569次閱讀
    【干貨速遞】嵌入式數(shù)據(jù)可靠性,<b class='flag-5'>軟件</b>設(shè)計(jì)的這些細(xì)節(jié)不能<b class='flag-5'>忽視</b>!

    自動(dòng)化測試平臺(tái)ATECLOUD推出AI算法功能

    作為納米軟件自主研發(fā)的自動(dòng)化測試平臺(tái),ATECLOUD 始終致力于為用戶提供高效優(yōu)質(zhì)的測試解決方案。面對(duì)5G、AI等前沿技術(shù)的迭代發(fā)展,平臺(tái)深度融合新技術(shù)持續(xù)升級(jí)測試能力,最新推出的AI算法
    的頭像 發(fā)表于 07-22 16:10 ?817次閱讀
    自動(dòng)化測試<b class='flag-5'>平臺(tái)</b>ATECLOUD推出AI<b class='flag-5'>算法</b>功能

    學(xué)硬件好還是學(xué)軟件好?

    、計(jì)算機(jī)硬件等領(lǐng)域相關(guān)。 學(xué)習(xí)軟件則側(cè)重于編程、算法、數(shù)據(jù)結(jié)構(gòu)等方面。軟件工程師負(fù)責(zé)開發(fā)、測試和維護(hù)各種軟件應(yīng)用程序,如操作系統(tǒng)、辦公
    發(fā)表于 04-07 15:27