91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI?時代來襲,手機芯片面臨哪些新挑戰(zhàn)?

穎脈Imgtec ? 2025-06-10 08:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自Semiengineering


邊緣AI、生成式AI(GenAI)以及下一代通信技術正為本已面臨高性能與低功耗壓力的手機帶來更多計算負載。

領先的智能手機廠商正努力應對本地化生成式AI、常規(guī)手機功能以及與云之間日益增長的數據傳輸需求所帶來的計算與功耗挑戰(zhàn)。

除了人臉識別等邊緣功能以及各種本地應用,手機還必須持續(xù)適配新的通信協議以及系統(tǒng)和應用更新。更重要的是,這一切都要在單次電池充電下完成,同時確保設備在用戶手中或貼近面部時保持低溫。

ad989bcc-4592-11f0-986f-92fbcf53809c.png

圖1:移動電話主板,右上為SoC(系統(tǒng)級芯片),包含Arm CPU及其他組件。

圖片來源:Arm

“如果你查看任何一款高端手機的配置,你會發(fā)現所有的SoC都采用異構架構,不同的模塊處理不同的任務,同時又協同工作?!?strong>Imagination Technologies細分市場戰(zhàn)略與產品管理高級總監(jiān)Vitali Liouti表示,“從系統(tǒng)角度來看,所有移動SoC廠商都會以平臺的方式同時考慮硬件和軟件的協同設計?!?/span>

Cadence公司硅解決方案事業(yè)部Tensilica DSP產品管理與市場營銷總監(jiān)Amol Borkar表示,AI網絡的快速演進和模型需求的多樣化使得移動SoC設計變得日益復雜。“與傳統(tǒng)工作負載不同,AI模型——尤其是大語言模型(LLMs)和變換器(Transformer)變體——在架構、規(guī)模和計算需求上都在不斷變化。這對芯片設計者來說是一個移動靶,因為芯片一旦投片就無法更改,但他們仍需預置未來AI能力的支持。更復雜的是,芯片還必須兼顧云端的大型模型與本地推理的小型高效模型(如TinyLlama)。這些小型LLM對于移動和嵌入式設備至關重要,因為它們需要在極低功耗與存儲限制下實現智能功能。”

除了從系統(tǒng)角度整體規(guī)劃外,AI也正在推動單個處理器架構和任務分配的變革。

“當前的變化主要體現在兩個方向?!盨ynaptics物聯網與邊緣AI處理器部門副總裁兼總經理John Weil表示,“一是Arm和RISC-V生態(tài)系統(tǒng)中的CPU架構持續(xù)增強,人們正在為Transformer模型添加矢量數學單元以加速各類數學運算;二是神經處理器(NPU)的改進,它們類似GPU,但專用于邊緣AI模型加速,基本上也是矢量計算單元,用于加速模型內部的各種算子。如果查看Arm的TOSA(Tensor Operator Set Architecture)規(guī)范,里面定義了各種AI操作,開發(fā)者也在為其編寫類似GPU的OpenGL加速程序?!?/span>

adb9cbda-4592-11f0-986f-92fbcf53809c.png

圖2:移動SoC設計示意圖,AI加速器可以是GPU、NPU或高端ASIC。圖片來源:Synopsys

過去幾年,GPU和NPU的設計都經歷了快速演進以適應新應用場景。Imagination的Liouti指出,在高端手機中,GPU通常占芯片面積的約25%,而NPU的體積也持續(xù)擴大以承擔更多工作負載?!熬唧w在哪個模塊上運行任務取決于模型。例如某些層適合NPU執(zhí)行,而有些則需要GPU配合。NPU已成為低功耗任務的關鍵,尤其適用于‘始終在線’(Always-On)的場景。同時,還必須搭配高性能CPU,因為它承擔初始加載和任務管理。如果CPU性能不足,再強大的GPU或NPU也難以發(fā)揮作用。”

在所有并行處理任務(圖形、通用計算或AI)中,功耗效率始終是核心。“我們對標量單元(ALU)進行了全面重構和調優(yōu),以實現更高的能效。”Imagination產品管理副總裁Kristof Beets表示,“接下來我們要將更多NPU技術引入GPU,例如更專用的數據類型和處理管線,以在保持可擴展性的同時提供更強性能。當然,我們也不能忽視開發(fā)者社區(qū),如何實現開箱即用、如何進行高效優(yōu)化與調試,這是我們重點關注的方向?!?/span>

如今,將AI集成進芯片的難度已大幅降低。“五年前大家還在問AI到底該怎么做,是不是得雇一整個數據科學家團隊?現在完全不是這樣了?!盜nfineon IoT、消費及工業(yè)MCU部門高級副總裁Steve Tateosian說,“我們擁有一整個DSP博士工程師團隊,他們在調試音頻前端,開發(fā)工程師通過AI工具來建模即可。開發(fā)流程也變得極為順暢:數據采集、標注、建模、測試、優(yōu)化——工具鏈已大幅提升,很多專業(yè)知識已內嵌其中,讓更多工程師都能上手?!?/span>


視覺化、無線化與觸控挑戰(zhàn)

隨著AI應用增長,界面也趨于視覺化,對處理能力的要求更高。

“過去是計算機或基于文本的界面,如今一切都變成了視頻或全圖形界面,而這類界面的計算需求要高得多。”Ansys產品營銷總監(jiān)Marc Swinnen表示,“無論是屏幕輸入還是1080p等格式的視頻輸出,視頻的輸入輸出管理都需要大量計算資源。”

此外,如今手機中的所有功能幾乎都是無線的,因此模擬電路的比例大幅上升?!艾F在的手機大約配有六根天線——這太瘋狂了?!盨winnen說,“所有這些高頻通信功能,包括Wi-Fi、5G、藍牙、AirDrop等,都有各自的頻段、芯片和天線?!?/span>

通信標準不斷演進的事實,也為SoC設計者帶來了額外挑戰(zhàn)。

“當前的關鍵在于推動AI應用落地,并加速UFS(通用閃存存儲)的標準推進。”Synopsys移動、汽車和消費類IP產品管理執(zhí)行總監(jiān)、MIPI聯盟主席Hezi Saar表示,“MIPI聯盟成功將推進時間提前了一年,這大大降低了風險。行業(yè)現在正在定義這個規(guī)范。SoC和IP廠商需要在規(guī)范尚未完全定稿時就開始開發(fā)自己的IP。他們需要在規(guī)范尚不完整時完成流片、拿到初步的硅片,同時還要為下一版規(guī)范做規(guī)劃,提前考慮互操作性以及生態(tài)系統(tǒng)的構建。這在過去是不可想象的。以前標準的更新是有節(jié)奏的,比如每兩年一個版本。但現在節(jié)奏被大大壓縮,因為AI更偏向軟件領域,而它對硬件的影響巨大。硬件終究不是軟件。”

adcf1e2c-4592-11f0-986f-92fbcf53809c.png

圖3:智能手機中的LLM或AI引擎依賴高效存儲訪問。

圖片來源:Synopsys

“當你啟動設備時,大部分模型需要加載到DRAM中,這意味著從UFS存儲設備到SoC的讀取鏈路必須非常高效?!盨aar表示,“這關乎延遲——你不能按下按鈕提問,然后等兩秒鐘。當然,也有其他處理方式,比如你不必讀取整個模型,可以進行部分讀取。但這些系統(tǒng)的核心任務就是將數據快速傳輸到DRAM。我已經在芯片上運行了LLM,比如通過某個加速器,但它需要和DRAM高效連接以完成計算,然后再將結果返回給用戶,比如音頻輸出。在移動設備中,這個流程必須非常高效,功耗尤為關鍵。因此廠商會盡可能減少傳輸次數,并將UFS存儲盡可能多地置于休眠狀態(tài)。我預計未來存儲接口和DRAM接口都會發(fā)展得非常非??臁h快于以往。”

多模態(tài)模型和像Stable Diffusion這樣的生成式AI工具也加大了系統(tǒng)的復雜性。這類模型將文本、圖像,甚至音頻處理集成到統(tǒng)一架構中。Cadence的Borkar表示:“這些模型需要一種靈活高效的計算架構,能夠處理多樣的數據類型和執(zhí)行模式。為了在快速演進的AI環(huán)境中保持韌性,AI子系統(tǒng)在設計時必須具備面向未來的可擴展性。這通常意味著在NPU旁邊集成可編程IP塊,使SoC能在芯片量產后仍能適配新模型和新負載。支持如此廣泛的AI應用場景,要求SoC不僅性能強大、能效高,還要具備高度的架構靈活性,這也讓AI中心化芯片設計成為移動計算領域最具挑戰(zhàn)性的前沿方向之一?!?/span>

算法在手機上的另一個典型應用是判斷哪些觸控是有效的,哪些不是,無論是傳統(tǒng)的“糖塊機”還是折疊屏手機。后者由于屏幕極薄,挑戰(zhàn)更大。

“屏幕變得很薄時,觸控層必須貼得非常接近帶噪聲的顯示層。”Synaptics產品營銷總監(jiān)Sam Toba表示,“我們需要處理來自單個像素的大量顯示噪聲。這在超薄顯示器中是個問題。背景層越薄,電容板之間越接近,整體電容就越高。而觸控本身依賴檢測非常微小的電容變化,在背景電容極高的情況下,識別出有效手指信號就變得更加困難?!?/span>

這種超低功耗芯片必須在本地判斷哪些信號是有效的,只有在確認是有效觸控后才喚醒主SoC?!叭绻芍骺匦酒瑏碜R別觸控信號,它就必須持續(xù)運行,這將導致巨大的功耗。因此,大部分無效觸控必須在本地就被過濾掉?!?/span>


本地AI處理與模型部署

手機中集成了眾多AI應用,且數量還在持續(xù)增加。Ansys的Swinnen指出,在可能的情況下,AI推理應盡量在本地完成,僅將精簡過的信息上傳至云端。例如,人臉識別或圖像處理等機器學習功能應靠近攝像頭完成處理。

即便是像ChatGPT或具備智能代理功能的GenAI模型,其推理過程也可本地完成。Synopsys的Saar表示,AI模型現在更高效也更緊湊,大小從幾兆到幾十兆不等,完全可以部署在設備本地,視具體模型與設備而定。

在本地處理AI帶來諸多優(yōu)勢。Siemens Digital Industries Software的網絡解決方案專家Ron Squiers指出:“將AI硬件集成到移動設備中,可以直接在本地運行大語言模型的推理,不再需要將數據發(fā)回云端處理。這帶來的好處是雙重的:延遲更低,響應更及時,閉環(huán)控制性能更好;同時還可提升數據隱私,因為數據不會離開設備?!?/span>

Infineon的Tateosian也表示贊同:“數據不再上傳云端,這降低了功耗和成本。有些邊緣AI應用甚至可以在不引入連接成本的前提下提升智能水平,或者減少對連接的依賴——這意味著減少云端通信和終端設備的整體功耗?!?/span>

Imagination的Liouti指出,如今是一個“極致優(yōu)化(hyper-optimization)”的時代,設計者必須消除一切“技術債務”,從而榨取設備更多性能:“數據搬移消耗了約78%的功耗。我們工作的重點是如何減少這些數據移動。這可以通過GPU實現,也是我們主要發(fā)力的地方,但也可以在平臺級或SoC層面優(yōu)化。我們需要開發(fā)非常先進的技術來解決這個問題。而對于神經網絡尤其是大型模型而言,數據搬運的挑戰(zhàn)會更大?!?/span>

盡管本地AI推理正在快速發(fā)展,但由于電池和功耗的限制,仍有部分任務需要依賴云端?!澳憧傄兴∩??!盠iouti說,“這只是一個旅程的開始,幾年后情況會截然不同。我們現在還只是剛剛起步。我認為transformer是未來更大系統(tǒng)的基礎模塊。目前,我們需要將炒作和現實區(qū)分開。以本地運行圖像生成模型為例,雖然現在手機上也能跑,但性能遠不如你在PC上用Midjourney生成的圖像。不過幾年后,情況就會變了?!?/span>

更強大的GPU也將成為解決方案的一部分?!霸谝苿悠脚_上,我們可以把省下來的功耗轉化為更高的主頻和更強的性能,同時依然保持在同一個功耗與熱預算范圍內?!盜magination的Kristof表示。

不過Infineon的Tateosian也指出,盡管設備每一代的性能和內存都在增長,但用戶實際體驗變化不大。“因為軟件的增長完全吞噬了這些性能提升?!?/span>


結語

移動SoC設計正受到多項關鍵趨勢的驅動。

“模擬部分的增長、一切內容視頻化與AI化,再加上當今應用對高性能計算(HPC)的需求,使得芯片必須具備極強的算力?!盇nsys的Swinnen表示,“這些因素正在推動SoC的演進,但手機制造商面臨的限制在于,他們必須保持低功耗和小尺寸設計,同時相比于像NVIDIA這樣的GPU公司,他們在成本上受到更嚴格的限制。NVIDIA可以優(yōu)先考慮性能,即使成本略高也無妨。但手機芯片不一樣,它必須能以極低成本大規(guī)模量產?!?/span>

芯片設計者必須從軟硬件協同的角度出發(fā)來設計SoC?!叭魏魏鲆曔@點的人,最終都會失敗?!盜magination的Liouti強調,“我們必須將語言模型的層級、操作類型等問題納入考慮。聽起來簡單,但實際上并不容易。你必須找到一種方式,最大化利用硬件來完成數學運算,從而確保你的解決方案在競爭中脫穎而出,因為我們面對的是行業(yè)巨頭。必須進行軟硬件協同設計,而這絕非一個工程師就能獨立完成的任務,而是需要多個學科背景的專家共同合作,其中有些領域甚至看起來毫不相關。”

原文鏈接:https://semiengineering.com/mobile-chip-challenges-in-the-ai-era/

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 手機芯片
    +關注

    關注

    9

    文章

    375

    瀏覽量

    50730
  • AI
    AI
    +關注

    關注

    91

    文章

    39707

    瀏覽量

    301327
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    手機SoC邁入“百TOPS”時代!蘋果、高通和聯發(fā)科新芯前瞻,誰是真香之選?

    目前的多款智能手機SoC已具備超過40 TOPS的計算能力。這種本地處理能力使得AI任務的執(zhí)行更加快速和高效。2025年三大國際手機芯片巨頭下場,手機終端廠商的旗艦
    的頭像 發(fā)表于 08-22 08:47 ?1.2w次閱讀
    <b class='flag-5'>手機</b>SoC邁入“百TOPS”<b class='flag-5'>時代</b>!蘋果、高通和聯發(fā)科新芯前瞻,誰是真香之選?

    估值700億,國產智能手機芯片第一股沖擊IPO!

    智能手機芯片第一股。 消息顯示,自2024年底開始,紫光展銳先后已經完成兩輪股權融資,總規(guī)模達到60億元左右,而在此輪融資后,紫光展銳的估值已經達到近700億元。 國內集成電路領軍企業(yè) 紫光展銳的前身主要是展訊通信與銳迪科,尤其是展
    的頭像 發(fā)表于 07-01 00:16 ?1.4w次閱讀

    芯片可靠性面臨哪些挑戰(zhàn)

    芯片可靠性是一門研究芯片如何在規(guī)定的時間和環(huán)境條件下保持正常功能的科學。它關注的核心不是芯片能否工作,而是能在高溫、高電壓、持續(xù)運行等壓力下穩(wěn)定工作多久。隨著晶體管尺寸進入納米級別,芯片
    的頭像 發(fā)表于 01-20 15:32 ?283次閱讀
    <b class='flag-5'>芯片</b>可靠性<b class='flag-5'>面臨</b>哪些<b class='flag-5'>挑戰(zhàn)</b>

    光計算芯片面世了,但怎么給它“灌入靈魂”?

    上海交大LightGen全光計算芯片面世,展現顛覆性算力潛力,但傳統(tǒng)測試燒錄方式無法適配,其產業(yè)化遇后端關鍵瓶頸。這類計算“新物種”的“燒錄”已轉為物理調諧,面臨接口非標、參數耦合敏感、驗證方式變革
    的頭像 發(fā)表于 12-30 17:01 ?631次閱讀

    你的手機芯片為何“帶傷工作”?# 半導體# 手機# 芯片

    半導體
    華林科納半導體設備制造
    發(fā)布于 :2025年10月29日 16:28:00

    今日看點:高通發(fā)布云端AI芯片;艾為電子推出低功耗Hyper-Hall?芯片 高通發(fā)布云端AI芯片 近日,美國高通公

    ? 高通發(fā)布云端AI芯片 近日,美國高通公司宣布推出兩款新型人工智能芯片AI200和AI250,面向數據中心市場。 ? 這兩款
    發(fā)表于 10-28 10:43 ?1059次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    建立的基礎: ①算力支柱②數據支柱③計算支柱 1)算力 與AI算力有關的因素: ①晶體管數量②晶體管速度③芯片架構④芯片面積⑤制造工藝⑥芯片內部擴展⑦內存帶寬、存儲容量等⑧處理器利用率
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    流體芯片AI計算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學習系統(tǒng) 2、面臨挑戰(zhàn)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當今社會,AI已經發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實現深度學習AI芯片的創(chuàng)新方法和架構。以及一些新型的算法
    發(fā)表于 09-05 15:10

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    RISC-V架構的AI加速器、量子AI芯片、光電組合AI芯片等。 隨著大模型面臨收益遞減、資源
    發(fā)表于 07-28 13:54

    FOPLP工藝面臨挑戰(zhàn)

    FOPLP 技術目前仍面臨諸多挑戰(zhàn),包括:芯片偏移、面板翹曲、RDL工藝能力、配套設備和材料、市場應用等方面。
    的頭像 發(fā)表于 07-21 10:19 ?1529次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>

    手機芯片:從SoC到Multi Die

    形尺寸、成熟的經驗和較低的成本,很可能仍將是中低端移動設備的首選技術。但多芯片組件提供了更大的靈活性,這對于AI推理以及跟上AI模型和通信標準的快速變化至關重要。最
    的頭像 發(fā)表于 07-10 11:17 ?1085次閱讀
    <b class='flag-5'>手機芯片</b>:從SoC到Multi Die

    適用于數據中心和AI時代的800G網絡

    隨著人工智能(AI)技術的迅猛發(fā)展,數據中心面臨著前所未有的計算和網絡壓力。從大語言模型(LLM)訓練到生成式AI應用,海量數據處理需求推動了網絡帶寬的快速增長。在此背景下,800G網絡技術應運而生
    發(fā)表于 03-25 17:35

    手機芯片進入2nm時代,首發(fā)不是蘋果?

    電子發(fā)燒友網綜合報道,2nm工藝制程的手機處理器已有多家手機處理器廠商密切規(guī)劃中,無論是臺積電還是三星都在積極布局,或將有數款芯片成為2nm工藝制程的首發(fā)產品。 ? 蘋果A19 或A20 芯片
    發(fā)表于 03-14 00:14 ?2707次閱讀