91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

挑戰(zhàn)英偉達(dá),索尼AFEELA里的高通數(shù)字底盤

佐思汽車研究 ? 來(lái)源:佐思汽車研究 ? 2024-01-14 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2024年CES展上,索尼用自家的PS5游戲機(jī)遙控原型車AFEELA登臺(tái)頗為驚艷,預(yù)計(jì)AFEELA在2025年上市,起售價(jià)約為45000美元,首選發(fā)售地?fù)?jù)悉是北美。AFEELA是高通數(shù)字底盤的典型代表。

AFEELA具備800TOPS的算力。

76159edc-b279-11ee-8b88-92fbcf53809c.png

圖片來(lái)源:SHM

762b18e8-b279-11ee-8b88-92fbcf53809c.png

圖片來(lái)源:SHM

AFEELA顯然是采用了兩套SnapdragonRide級(jí)聯(lián),推測(cè)SoC是高通的SA8650,加速器是基于Cloud AI 100 Ultra的車載版。

AFEELA的AD/ADAS架構(gòu)

763e7280-b279-11ee-8b88-92fbcf53809c.png

圖片來(lái)源:SHM

上圖是AFEELA的AD/ADAS架構(gòu),不要質(zhì)疑CNN做感知,即便是2000TOPS的英偉達(dá)也支撐不起全Transformer,車載感知的Backbone網(wǎng)絡(luò)還是基于CNN的,包括特斯拉,特斯拉是Regnet。只有Head才能用得上Transformer,這里的環(huán)境模型基本可等同于BEV加占用網(wǎng)絡(luò)。全Transformer估計(jì)得用8張英偉達(dá)H200顯卡,價(jià)格是整車的好幾倍了。

SA8650之前筆者已介紹過(guò),高通第一代Snapdragon Ride即SA8540P+SA9000P似乎是過(guò)渡產(chǎn)品,SA8540P和高通的SA8295P幾乎完全一致,與高通筆記本電腦領(lǐng)域的8cx Gen3即SC8280P也幾乎完全一致。

高通自動(dòng)駕駛一直在英偉達(dá)和Mobileye的夾縫中,英偉達(dá)憑借超高性能幾乎壟斷高端市場(chǎng),而Mobileye以40-70美元的超低價(jià)格壟斷中低端市場(chǎng)。對(duì)大部分廠家,包括保時(shí)捷這樣的高端品牌,對(duì)自動(dòng)駕駛都缺乏興趣和重視度,自動(dòng)駕駛是可有可無(wú),錦上添花的配置,只有Mobileye不到100美元的芯片能滿足這些廠家的成本需求,Mobileye牢牢占據(jù)全球70%的智能駕駛芯片市場(chǎng),地位穩(wěn)如泰山,短期的客戶庫(kù)存調(diào)整不會(huì)影響Mobileye的未來(lái)。高通無(wú)意與Mobileye競(jìng)爭(zhēng),可能是利潤(rùn)太微薄,高通主要競(jìng)爭(zhēng)對(duì)手就是英偉達(dá),但高通主要市場(chǎng)還是手機(jī),技術(shù)核心還在手機(jī)上,所以高通的AI加速器是分離的,高通主打的是低功耗和高性價(jià)比。

今天我們主要來(lái)看高通AI加速器的新產(chǎn)品,即AI 100 Ultra,這是高通2023年11月底推出的產(chǎn)品,就是要挑戰(zhàn)英偉達(dá)的H100,高通號(hào)稱單張AI 100 Ultra可以對(duì)應(yīng)1000億參數(shù)的大模型,兩張可以對(duì)應(yīng)1750億參數(shù)的ChatGPT 3,功耗和價(jià)格遠(yuǎn)低于英偉達(dá)的H100,惠普和聯(lián)想已經(jīng)有基于AI 100 Ultra的服務(wù)器銷售。

7655cc46-b279-11ee-8b88-92fbcf53809c.png

上表是高通2020年9月推出AI 100的各個(gè)版本的性能表現(xiàn)。高通目前只有這兩款A(yù)I加速器,車載的AI加速器毫無(wú)疑問(wèn)是基于AI 100設(shè)計(jì)的。

766c8918-b279-11ee-8b88-92fbcf53809c.png

從參數(shù)上看,當(dāng)然無(wú)法和英偉達(dá)H100相提并論,并且H100主打的是FP16精度,高通主打的是INT8精度,高通主要的信心來(lái)自其軟件優(yōu)化,即Polyhedral Mapper。

76802bc6-b279-11ee-8b88-92fbcf53809c.png

特色主要是核心/線程的并行性,明確的數(shù)據(jù)傳輸,以及SIMD的并行性。

7692dd48-b279-11ee-8b88-92fbcf53809c.png

上圖是一個(gè)具體的BERT優(yōu)化。

76aac80e-b279-11ee-8b88-92fbcf53809c.png

主要的挑戰(zhàn)一是如何讓核心、線程和矢量單元都處于最大利用狀態(tài),二是如何利用好本地內(nèi)存,而不是外部昂貴的HBM內(nèi)存,三是減少數(shù)據(jù)搬運(yùn)。

高通AI加速器架構(gòu)

76c9cb46-b279-11ee-8b88-92fbcf53809c.png

高通AI 100內(nèi)核

76e31ae2-b279-11ee-8b88-92fbcf53809c.png

高通AI 100內(nèi)核是16個(gè),AI 100Ultra是64個(gè),不過(guò)考慮到功耗,性能沒(méi)有增加4倍。

每個(gè)AI核心內(nèi)部架構(gòu)

76f6c114-b279-11ee-8b88-92fbcf53809c.jpg

大多數(shù)車載AI加速器只有張量Tensor計(jì)算單元,且只有INT8,高通的不僅包括張量還有標(biāo)量Scalar和矢量Vector單元。張量分INT8和FP16兩種,INT8有8192個(gè)MAC,F(xiàn)P16有4096個(gè)MAC。標(biāo)量與矢量單元都是VLIW指令集,跟高通手機(jī)芯片中的DSP完全一致。

每核心有1MB的L2緩存,有8MB的VTCM存儲(chǔ),所謂VTCM是VectorTightly-Coupled Memory緊耦合矢量存儲(chǔ),合計(jì)每個(gè)AI核心有9MB的SRAM,64個(gè)內(nèi)核就是576MB的SRAM,SRAM的成本每MB約5美元,也就是2880美元,AI 100 Ultra至少一半以上的die size是SRAM,一半以上的成本也來(lái)自SRAM,估計(jì)AI 100 Ultra售價(jià)是6000美元左右。

矢量計(jì)算需要頻繁搬運(yùn)數(shù)據(jù),特別是矢量矩陣運(yùn)算,Transformer里主要延遲都來(lái)自矢量矩陣運(yùn)算。

770b91d4-b279-11ee-8b88-92fbcf53809c.png

上圖是三星對(duì)GPT大模型workload分析,在運(yùn)算操作數(shù)量上,GEMV矩陣矢量乘法所占的比例高達(dá)86.53%,在大模型運(yùn)算延遲分析上,82.27%的延遲都來(lái)自GEMV;GEMM矩陣通用乘法所占僅為2.12%,非線性運(yùn)算也就是神經(jīng)元激活部分占的比例也遠(yuǎn)高于GEMM。

77269f2e-b279-11ee-8b88-92fbcf53809c.png

上圖是三星對(duì)GPU利用率的分析,可以看出在GEMV算子時(shí),GPU的利用率很低,一般不超過(guò)20%,換句話說(shuō)80%的時(shí)間GPU都是在等待存儲(chǔ)數(shù)據(jù)的搬運(yùn)。所以芯片內(nèi)部的TCAM非常有必要,其效果要比芯片外部的HBM更好,缺點(diǎn)是容量遠(yuǎn)不能和HBM比,用于訓(xùn)練和汽車級(jí)模型推理比較好。

AI 100 Ultra的存儲(chǔ)系統(tǒng)升級(jí)不少,從原來(lái)的137GB/s升級(jí)至576GB/s,但還是用了老舊的LPDDR4,實(shí)際就是內(nèi)存控制器增加到了4路,每路128bit,合計(jì)512bit。接口方面,PCIe提升到第四代,Lane增加到16。

AI加速器硬件似乎已走到了盡頭,能做文章的只有存儲(chǔ)部分和制造工藝,更先進(jìn)的制造工藝容納更多的計(jì)算單元,更高bit的內(nèi)存控制器增加存儲(chǔ)帶寬或者升級(jí)HBM,像英偉達(dá)的H200,只是存儲(chǔ)部分更換成了HBM3,其余與H100完全一致。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    839

    瀏覽量

    40106
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135473
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301446
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14883

    瀏覽量

    179901

原文標(biāo)題:挑戰(zhàn)英偉達(dá),索尼AFEELA里的高通數(shù)字底盤

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    羅德與施瓦茨攜手英偉達(dá)推進(jìn)基于數(shù)字孿生技術(shù)的AI-RAN測(cè)試

    ”)展示最新測(cè)試平臺(tái),該平臺(tái)將基于光線追蹤的特定站點(diǎn)信道仿真與英偉達(dá)Sionna研究套件深度融合,在實(shí)驗(yàn)室內(nèi)即可完成基于數(shù)字孿生的硬件在環(huán)測(cè)試。
    的頭像 發(fā)表于 03-03 13:45 ?327次閱讀
    羅德與施瓦茨攜手<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>推進(jìn)基于<b class='flag-5'>數(shù)字</b>孿生技術(shù)的AI-RAN測(cè)試

    麥格納宣布擴(kuò)大與英偉達(dá)的戰(zhàn)略合作

    麥格納宣布擴(kuò)大與英偉達(dá)的戰(zhàn)略合作,為整車廠基于英偉達(dá)DRIVE Hyperion平臺(tái)的項(xiàng)目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?363次閱讀

    英偉達(dá)重磅出手!AI 推理存儲(chǔ)全面覺(jué)醒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購(gòu)人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆收購(gòu)。但
    的頭像 發(fā)表于 12-26 08:44 ?1.1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲(chǔ)全面覺(jué)醒

    黃仁勛:英偉達(dá)AI芯片訂單排到2026年 英偉達(dá)上季營(yíng)收加速增長(zhǎng)62%再超預(yù)期

    AI芯片總龍頭英偉達(dá)的財(cái)報(bào)終于帶來(lái)了驚喜;英偉達(dá)公司發(fā)布財(cái)報(bào)數(shù)據(jù)顯示,上季營(yíng)收加速增長(zhǎng)62%;再超華爾街預(yù)期。業(yè)界都比較振奮,英偉
    的頭像 發(fā)表于 11-20 11:36 ?1261次閱讀

    NVIDIA新聞:英偉達(dá)10億美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    給大家分享一些NVIDIA新聞: 英偉達(dá)10億美元入股諾基亞 在當(dāng)?shù)貢r(shí)間10月28日,英偉達(dá)正式宣布將以10億美元入股諾基亞;據(jù)悉英偉
    的頭像 發(fā)表于 10-29 17:12 ?1710次閱讀

    英偉達(dá)下一代Rubin芯片已流片

    繼8月底英偉達(dá)透露Rubin架構(gòu)芯片計(jì)劃明年量產(chǎn)后,當(dāng)?shù)貢r(shí)間9月8日的盛技術(shù)會(huì)議上,英偉達(dá)又談到Rubin的進(jìn)展。
    的頭像 發(fā)表于 09-12 17:15 ?1670次閱讀

    英偉達(dá)自研HBM基礎(chǔ)裸片

    電子發(fā)燒友網(wǎng)綜合報(bào)道,據(jù)臺(tái)媒消息,傳聞英偉達(dá)已開(kāi)始開(kāi)發(fā)自己的HBM基礎(chǔ)裸片,預(yù)計(jì)英偉達(dá)的自研HBM基礎(chǔ)裸片采用3nm工藝制造,計(jì)劃在2027年下半年進(jìn)行小批量試產(chǎn)。并且這一時(shí)間點(diǎn)大致對(duì)
    的頭像 發(fā)表于 08-21 08:16 ?2817次閱讀

    國(guó)家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問(wèn)題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉達(dá)算力芯片“追蹤定位”“遠(yuǎn)程關(guān)閉”技術(shù)已成熟。為維
    的頭像 發(fā)表于 07-31 13:56 ?2710次閱讀
    國(guó)家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    通展示驍龍數(shù)字底盤產(chǎn)品組合的最新成果

    今日,在2025通汽車技術(shù)與合作峰會(huì)上,通技術(shù)公司攜手中國(guó)先進(jìn)車企和生態(tài)系統(tǒng)合作伙伴,展示其驍龍數(shù)字底盤產(chǎn)品組合的發(fā)展勢(shì)頭和最新成果。驍龍數(shù)字
    的頭像 發(fā)表于 07-03 12:55 ?1571次閱讀

    施耐德電氣與英偉達(dá)深化合作

    近日,施耐德電氣宣布與英偉達(dá)深化合作,旨在滿足市場(chǎng)對(duì)可持續(xù)、AI就緒基礎(chǔ)設(shè)施日益增長(zhǎng)的需求。
    的頭像 發(fā)表于 06-24 15:02 ?1233次閱讀

    英偉達(dá)擬再推中國(guó)特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近年來(lái),美國(guó)政府對(duì)華半導(dǎo)體出口管制政策不斷收緊,英偉達(dá)等半導(dǎo)體企業(yè)面臨嚴(yán)峻挑戰(zhàn)。為保持在中國(guó)市場(chǎng)的競(jìng)爭(zhēng)力,英偉達(dá)推出了
    發(fā)表于 05-27 00:03 ?4797次閱讀

    特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元

    據(jù)外媒報(bào)道,英偉達(dá)公司發(fā)布了一項(xiàng)通知稱,美國(guó)政府于9日告知英偉達(dá)公司;特供版的H20芯片出口到中國(guó)需要許可證,緊接著在14日又告知英偉
    的頭像 發(fā)表于 04-16 16:59 ?2088次閱讀

    英偉達(dá)、通布局AI投資版圖,這些明星企業(yè)被收入囊中!

    電子發(fā)燒友原創(chuàng) 章鷹 今年以來(lái),AI界新秀DeepSeek帶來(lái)的大模型平權(quán)推動(dòng)AI應(yīng)用,云計(jì)算市場(chǎng)景氣度上行,推動(dòng)資本開(kāi)支增長(zhǎng)。對(duì)于DeepSeek的橫空出世,英偉達(dá)CEO黃仁勛表示,像R1這樣
    的頭像 發(fā)表于 03-25 09:22 ?2117次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會(huì)

    為了實(shí)現(xiàn)這一速度提升,新思科技在GTC全球AI大會(huì)上宣布,正在使用英偉達(dá) CUDA-X庫(kù)優(yōu)化其下一代半導(dǎo)體開(kāi)發(fā)解決方案。公司還在擴(kuò)大對(duì)英偉達(dá)Grace CPU架構(gòu)的支持,并將在2025
    的頭像 發(fā)表于 03-19 17:53 ?1304次閱讀