91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

專用NPU是發(fā)揮端側(cè)人工智能潛力的捷徑

YCqV_FPGA_EETre ? 來源:cg ? 2019-01-09 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1971年,第一顆劃時代的大規(guī)模集成電路產(chǎn)品Intel4004出現(xiàn),它使用MOSFET集成電路技術(shù),采用10μm工藝,集成了2300個MOSFET。雖然這顆IC僅僅集成了2300個晶體管,但它標志著人類大規(guī)模集成電路時代正式開啟,而且它開辟了一條提升IC性能的路徑——同樣面積下,要提升性能就要集成更多晶體管,要集成更多晶體管只要升級工藝就可以實現(xiàn)。

自此之后,人類一直就享用著IC工藝升級帶來的紅利。根據(jù)Intel的創(chuàng)始人之一戈登·摩爾(GordonMoore)提出的摩爾定律:集成電路上可容納的晶體管數(shù)目,約每隔18個月便會增加一倍,性能也將提升一倍。50 年來,IC工藝在摩爾定律的指導下飛速發(fā)展,我們也一直在享用工藝技術(shù)升級帶來的好處——性能升級,功耗降低,尺寸越來越小。

但是,當工藝scaling到10nm以下時,由于工藝復雜度大幅度提升,摩爾定律已經(jīng)趨緩。2018年11月,AMD CTO發(fā)表言論認為摩爾定律已經(jīng)減緩;6月份美國舉辦的DAC大會上,著名計算機領域?qū)<?018圖靈獎獲得者David Patterson(開源CPU RISC-V發(fā)明人之一)也明確認為摩爾定律已經(jīng)減緩;而且,英特爾自己的10nm工藝連續(xù)跳票,不能按時交付新工藝芯片。這些言行都說明,依靠半導體工藝升級帶來IC器件性能提升,已經(jīng)不可能再像以前那樣繼續(xù)維持高速提升了,那該如何提升處理器性能?尤其是提升人工智能的處理效率?

架構(gòu)創(chuàng)新是出路,AI時代需要專用處理單元

David Patterson 認為現(xiàn)在是計算機系統(tǒng)架構(gòu)的黃金時代,單靠工藝升級難以實現(xiàn)大的性能突破,未來處理器必須從架構(gòu)上尋求出口。

而根據(jù)業(yè)內(nèi)眾多半導體專家的觀點,異構(gòu)架構(gòu)是未來IC發(fā)展的必由之路。*** 半導體產(chǎn)業(yè)協(xié)會理事長盧超群博士(Nicky Lu)就認為,異構(gòu)集成設計系統(tǒng)架構(gòu)(HIDAS, Heterogeneous Integration Design Architecture System)將大量促進IC創(chuàng)新,要提升IC性能就要集成新的異質(zhì)單元。 同理,對于目前熱門的人工智能處理需求來說,通過工藝升級CPU或者GPU、DSP、FPGA都不是好辦法,更合理的方案是就集成人工智能處理單元。

人工智能到底需要一種什么樣的處理單元?想要尋找答案,我們可以回頭看看GPU的發(fā)展歷程。

1962年,麻省理工學院的博士伊凡?蘇澤蘭發(fā)表的論文以及他的畫板程序奠定了計算機圖形學的基礎。在隨后的近20年里,計算機圖形學在不斷發(fā)展,但是當時的計算機卻沒有配備專門的圖形處理芯片,圖形處理任務都是CPU來完成的。

1999年8月,NVIDIA公司發(fā)布了一款代號為NV10的圖形芯片Geforce 256。Geforce 256是圖形芯片領域開天辟地的產(chǎn)品,因為它是第一款提出GPU概念的產(chǎn)品。Geforce 256所采用的核心技術(shù)有“T&L”硬件、立方環(huán)境材質(zhì)貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等?!癟&L”硬件的出現(xiàn),讓顯示芯片具備了以前只有高端工作站才有的頂點變換能力,同時期的OpenGL和DirectX 7都提供了硬件頂點變換的編程接口,GPU的概念因此而出現(xiàn)。由此開始,CPU、GPU 才正式確立了各自的屬性和工作內(nèi)容。

從結(jié)構(gòu)上來說,CPU和GPU不同之處體現(xiàn)在他們處理任務的方式不同。CPU由專為串行任務而優(yōu)化的幾個核心組成;GPU則由數(shù)以千計的更小、更高效的核心組成,這些核心專為同時處理多任務而設計。稍微深入一點來講,CPU和GPU的不同,是因為它們的使命不同。CPU需要很強的通用性來處理各種不同的數(shù)據(jù)類型,同時又要邏輯判斷,又會引入大量的分支跳轉(zhuǎn)中斷的處理,這使CPU的內(nèi)部結(jié)構(gòu)異常復雜。而GPU需要處理的則是類型高度統(tǒng)一、相互依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的計算環(huán)境。因此,GPU和CPU就呈現(xiàn)出非常不同的架構(gòu)。

從GPU的發(fā)展來看,它的出現(xiàn)在于首先要應對新的處理需求——圖形處理,其次是要以不同于CPU的架構(gòu)來完成處理效率最大化。這兩點對人工智能處理也有借鑒意義:首先,人工智能處理是不同于CPU和GPU的新處理需求;其次,人工智能處理需要新的架構(gòu),因為無論CPU、GPU還是FPGA都不是最好的架構(gòu),尤其是在手機領域FPGA更不適合。

我們知道,手機是消費電子中最大的品類,在工藝、封裝、集成、架構(gòu)方面都走在行業(yè)最前沿,它的技術(shù)也在引導著整個半導體行業(yè)的發(fā)展。一方面,手機SoC使用最新的工藝制程;另外一方面,手機也是對功耗、面積特別敏感的產(chǎn)品品類。用CPU,GPU這些面向傳統(tǒng)指令計算、浮點運算的計算單元,去執(zhí)行以張量計算為主的AI運算,效率和能效都不能達到最好,同時隨著傳統(tǒng)半導體工藝制程不斷逼近極限,如果還用摩爾定律的增長紅利去滿足日益提升的AI運算量,代價會越來越高。

另外,AI的框架、算法和網(wǎng)絡模型發(fā)展也非??欤绻捎肅PU,GPU適配日新月異的AI框架和算子,軟件適配等工作也非常繁多,這不僅為開發(fā)者帶來更高的開發(fā)成本,更同時加大了產(chǎn)品上市的時間成本。如果采用FPGA,雖然人工智能的處理效率會大大提升,但是FPGA的面積和功耗都不適合集成在手機平臺;如果采用DSP,雖然有一定的靈活性,但是效能還不是最大。因此,借鑒GPU的發(fā)展,從最優(yōu)能效角度考慮,手機平臺需要集成專用的NPU,讓專業(yè)的器件干專業(yè)的事情。

專用NPU性能強勁,麒麟芯片引領端側(cè)AI應用潮流

毫無疑問,手機平臺需要專用的NPU。在這方面,華為大膽嘗試,在2017年9月率先推出了集成專用NPU處理單元的麒麟970。麒麟 970采用了創(chuàng)新的HiAI移動計算架構(gòu),能夠用更少的能耗更快地完成AI計算任務。實際對比顯示:性能上,NPU 是 CPU 的 25 倍,是GPU 的 6.25 倍(25/4);能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。

實測中,麒麟 970 的 NPU 每分鐘可以識別出 2005 張照片,而在沒有NPU的情況下每分鐘只能識別 97 張,優(yōu)勢對比非常明顯。

麒麟970是史上首個在端側(cè)實現(xiàn)人工智能推理應用的手機芯片平臺。筆者在芯片發(fā)布之初就判斷,華為將憑借這個新的計算平臺領先高通的驍龍平臺,并將在人工智能應用方面,幫助華為手機與其他手機拉開至少4個月的領先期。事實果真如此,麒麟970開啟了端側(cè)人工智能應用的新篇章,并助力華為Mate10手機率先實現(xiàn)了拍照場景識別、翻譯等人工智能應用,引領了整個智能手機的AI應用大潮。

2018年9月,華為在2018德國柏林消費電子展(IFA)上正式發(fā)布麒麟980處理器。麒麟980在AI方面有了更大的突破:首度采用了雙核NPU,提供147個算子,人工智能算力大幅度提升;每分鐘識別4500張圖片,識別速度相比上一代提升120%,遠高于業(yè)界同期水平。

麒麟980的發(fā)布,標志著華為在端側(cè)人工智能領域的成熟與進步。獨立的雙核NPU處理單元讓麒麟980在人臉識別、物體識別、物體檢測、圖像分割、智能翻譯等AI場景下應用更流暢。例如華為Mat 20系列可實現(xiàn)多人姿態(tài)實時識別,實時幀率高達30 FPS,無論是表演節(jié)奏感極強的舞蹈,還是在鏡頭前快速跑步,麒麟980都能夠?qū)崟r繪制出人體的關(guān)節(jié)和線條??梢哉f,麒麟980再次引領了全球端側(cè)AI應用的潮流。

另外,基于獨立的NPU處理單元,華為從麒麟970開始就推出了HUAWEI HiAI。HiAI是面向移動終端的AI能力開放平臺,是專門為了配合NPU進行開發(fā)的第三方開發(fā)者平臺,能夠給開發(fā)者提供AI計算庫以及API,并且能夠便捷地編寫APP上的AI應用。

HUAWEI HiAI能力開放平臺分為三層架構(gòu),除了我們熟知的HUAWEI HiAI Foundation的運算能力、HUAWEI HiAI Engine端側(cè)應用能力,還有海量的HUAWEI HiAI service服務能力。此外,HiAI能夠讓開發(fā)者快速遷移模型,并且對于普通APP開發(fā)者來說,HiAI會提供已封裝好的語音識別等技術(shù),開發(fā)者能夠直接應用。

HUAWEI HiAI堪稱是一個開發(fā)人工智能APP的神器,能幫助小白用戶迅速開發(fā)出AI應用,而且能用上麒麟芯片的NPU能力。開發(fā)者可以利用這個開放架構(gòu)開發(fā)新的人工智能應用,并通過華為認證后集成進麒麟平臺。這是超越APP應用的新機制,開放的架構(gòu)讓華為率先擁有了大量編外人工智能開發(fā)者,這也意味著麒麟平臺可以集成大量第三方的人工智能算法和應用。

如今,專用NPU在人工智能領域的應用已成燎原之勢。筆者觀察到,業(yè)界其他芯片廠商也在采用這樣的獨立NPU架構(gòu),例如蘋果A12、聯(lián)發(fā)科的P系列平臺等。在安防領域,獨立NPU已經(jīng)推動智能安防發(fā)展,一些IP公司也開發(fā)出了專用NPU IP如Imagination的PowerVR 2NX NNA加速器、PowerVR 3NX NNA等。反之,某些沒有集成獨立NPU的芯片平臺,依舊在通過CPUGPU和DSP進行人工智能運算,不但增加了功耗,影響其他運算任務的處理,還加大了第三方人工智能算法和應用接入的難度。

目前,人工智能已成人類的一項通用技術(shù)。人類會用AI技術(shù)和理念去解決現(xiàn)在和未來的問題, AI也必將會與更多產(chǎn)業(yè)應用結(jié)合,從而改變所有行業(yè),更將改變每個組織。人工智能在語音識別、圖像識別、工業(yè)、汽車自動駕駛、農(nóng)業(yè)、AR、VR等領域的應用潛力無限,而華為麒麟系列芯片在端側(cè)人工智能領域的探索處于全球領先,華為手機卓越的人工智能應用體驗也應證了專用NPU架構(gòu)的選擇是非常明智和正確的,期待華為在這個領域的探索更深入,帶給我們更多驚喜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • MOSFET
    +關(guān)注

    關(guān)注

    151

    文章

    9708

    瀏覽量

    233910
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50145

    瀏覽量

    265807
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    379

    瀏覽量

    21140

原文標題:發(fā)揮端側(cè)人工智能潛力,專用NPU才是王道

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    軟通動力基于OpenClaw開源框架深度自研側(cè)智能體平臺

    隨著人工智能加速從云端下沉至終端、從被動交互邁向主動執(zhí)行,側(cè)智能體正成為定義智能硬件體驗的核心引擎。軟通動力基于OpenClaw開源框架深
    的頭像 發(fā)表于 02-27 11:48 ?710次閱讀

    【新品發(fā)布】艾為重磅發(fā)布側(cè)AI高性能NPU語音芯片,打造智能語音體驗新標桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡智能語音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡處理器),通過聲音模型訓練與NPU
    的頭像 發(fā)表于 01-07 18:33 ?426次閱讀
    【新品發(fā)布】艾為重磅發(fā)布<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI高性能<b class='flag-5'>NPU</b>語音芯片,打造<b class='flag-5'>智能</b>語音體驗新標桿

    安謀科技:側(cè)NPU技術(shù)創(chuàng)新,拉動AI算力落地引擎

    X3 NPU IP以及生態(tài)建設、NPU發(fā)展趨勢等話題。 ? 圖:安謀科技產(chǎn)品總監(jiān)鮑敏祺 ? 周易X3 NPU IP正當時 ? 安謀科技周易X3 NPU IP面向
    的頭像 發(fā)表于 12-09 16:44 ?5957次閱讀
    安謀科技:<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>NPU</b>技術(shù)創(chuàng)新,拉動AI算力落地引擎

    AI體驗躍遷,天璣9500用雙NPU開創(chuàng)側(cè)AI新時代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗該由誰定義?聯(lián)發(fā)科天璣9500給出答案:行業(yè)首發(fā)將側(cè) AI 4K 文生圖帶到手機,引領移動影像與創(chuàng)造力的范式躍遷。 全新“超性能 + 超能效”雙 NPU
    的頭像 發(fā)表于 09-24 14:47 ?802次閱讀
    AI體驗躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI新時代

    側(cè)AI推理賦能效率革命,美格智能多領域落地打造行業(yè)范本

    產(chǎn)業(yè)進階:側(cè)AI推理助手成為應用剛需作為人工智能技術(shù)最普遍的產(chǎn)品形式之一,“AI助手”已成為各類軟件、終端的重要組成部分,成為AIAgent的主要外在呈現(xiàn)和功能入口。隨著
    的頭像 發(fā)表于 08-25 17:06 ?4009次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI推理賦能效率革命,美格<b class='flag-5'>智能</b>多領域落地打造行業(yè)范本

    中科創(chuàng)達旗下創(chuàng)通聯(lián)達即將舉辦RUBIK Pi 3側(cè)人工智能技術(shù)巡演

    人工智能技術(shù)加速向側(cè)滲透,驅(qū)動產(chǎn)業(yè)智能化轉(zhuǎn)型的戰(zhàn)略機遇期,全球領先的智能物聯(lián)網(wǎng)產(chǎn)品和解決方案提供商Thundercomm(創(chuàng)通聯(lián)達)將于
    的頭像 發(fā)表于 08-15 15:56 ?1248次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:23

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    德賽西威側(cè)大模型重塑智能座艙體驗

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動的智能化升級將成為產(chǎn)業(yè)突破的核心引擎。在日前召開的2025上海車展國際汽車關(guān)鍵技術(shù)論壇上,德賽西威技術(shù)中心人工智能實驗室專家張書赫博士以《
    的頭像 發(fā)表于 05-15 09:13 ?1819次閱讀

    華邦電子創(chuàng)新存儲賦能側(cè)智能側(cè)

    人工智能技術(shù)的飛速發(fā)展,#側(cè)AI 正在成為智能設備發(fā)展的重要趨勢。華邦電子正憑借其卓越存儲技術(shù)和豐富的產(chǎn)品,積極布局端側(cè) AI 市場,為
    的頭像 發(fā)表于 05-14 09:59 ?1604次閱讀
    華邦電子創(chuàng)新存儲賦能<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>智能</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>

    蘋芯科技 N300 存算一體 NPU,開啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設備對本地算力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約
    的頭像 發(fā)表于 05-06 17:01 ?1151次閱讀
    蘋芯科技 N300 存算一體 <b class='flag-5'>NPU</b>,開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> AI 新征程

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55

    側(cè)AI正掀起算力革命

    在這股人工智能的浪潮中,一個顯著的趨勢正逐漸凸顯,那便是人們的關(guān)注點不再僅僅局限于強大的云端人工智能側(cè)AI開始嶄露頭角,并受到越來越多的重視。
    的頭像 發(fā)表于 04-09 15:55 ?921次閱讀

    炬芯科技探索側(cè)AI技術(shù)與應用

    隨著人工智能技術(shù)的迅猛發(fā)展,AI應用正從云端向終端迅速擴張。側(cè)AI的核心在于讓智能設備在本地完成數(shù)據(jù)處理和推理決策,并且可以在較低能耗情況下的持續(xù)工作,從而減少對云端的依賴,提升交互
    的頭像 發(fā)表于 03-27 14:58 ?1164次閱讀