91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

邊緣AI應用越來越普遍,AI模型在邊緣端如何部署?

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-04 00:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)在人工智能時代,越來越多的AI應用需要從云端擴展到邊緣端,比如智能耳機、智能攝像機、智能手環(huán)、物流機器人等,在邊緣端部署AI已經(jīng)成為趨勢。如今AI大模型迅猛發(fā)展,AI大模型在端側的部署也成了業(yè)界關注的焦點。

如何把AI模型在邊緣端部署

首先得軟硬件適配,硬件方面,適配的AI芯片越多越好,這樣對于工程師來說,就降低了端側模型適配遷移的難度,即使換一個設備也可以輕松部署上去;軟件方面,主要的操作系統(tǒng)需要做適配,包括Linux、Windows、Android 、iOS等,這樣無論是手機、PC都可以部署。還有框架適配,也是越全越好,比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要對模型進行壓縮,在保證高精度的同時,最好也能夠讓模型跑得更快更省內存,這里需要采用模型壓縮技術,比如模型量化、剪枝和蒸餾技術。尤其是如今AI大模型迅猛發(fā)展,未來大模型在端側的部署也少不了要用到壓縮技術。

可以說,模型壓縮技術是實現(xiàn)AI大模型在邊/端部署的核心技術。模型壓縮技術可在保有大模型原有性能和精度基本不變前提下降低對推理算力的需求。

具體來看,量化,即將浮點計算轉成低比特定點計算;網(wǎng)絡剪枝,即去除神經(jīng)網(wǎng)絡中冗余的通道、神經(jīng)元節(jié)點等;知識蒸餾,即將大模型作為教師模型,用其輸出訓練性能接近、結構更簡的模型。

以清華大學唐杰教授團隊2022年8月發(fā)布的1300億參數(shù)模型 GLM-130B 為例,原模型支持在一臺 A100 40G*8或 V100 32G*8 服務器上進行推理,而將模型量化至 INT 4精度后,相較INT 8精度其所需 GPU 內存降低50%,且可在一臺4×RTX 3090(24G)或 8×RTX 2080Ti (11G )服務器上進行推理。

眾多廠商實現(xiàn)AI大模型的端側部署

谷歌、高通、華為等廠商已經(jīng)實現(xiàn)AI大模型在端側的部署。今年5月份,在Google/O開發(fā)者大會上,Google宣布了一個專門針對移動設備優(yōu)化系統(tǒng)的TensorFlow新版本TensorFlowLite。這款被稱為TensorFlowLite的軟件庫,是可在移動設備上運行的深度學習工具,它允許開發(fā)人員在用戶的移動設備上實時地運行人工智能應用。

該軟件庫在設計上追求高速度和小儲存,支持iOS和Android系統(tǒng)。如果開發(fā)者使用其他系統(tǒng),也可以經(jīng)過一系列復雜而冗長的編譯流程,將TensorFlow編譯成移動操作系統(tǒng)所支持的軟件庫,這樣并不會改變TensorFlow的功能。

TensorFlowLite還提供了有限的預訓練人工智能模型,包括MobileNet和InceptionV3物體識別計算機模型,以及SmartReplay自然語言處理模型。開發(fā)者用自己的數(shù)據(jù)集做的定制模型也可以部署在上面。TensorFlowLite使用Android神經(jīng)網(wǎng)絡應用程序界面(API),可以在沒有加速硬件時直接調用CPU來處理,確保其可以兼容不同設備。

高通技術公司產品管理高級副總裁兼AI負責人Ziad Asghar此前表示,隨著生成式AI的飛速普及,混合處理的重要性空前突顯?;旌咸幚鞟I的重要性空前突顯,正如傳統(tǒng)計算從大型主機和瘦客戶端演變?yōu)楫斍霸贫撕瓦吘壗K端相結合的模式,AI處理必須在云端和終端混合進行才能發(fā)揮其最大潛能。

根據(jù)高通的演示,將手機設置成“飛行模式”,再通過手機端全棧AI優(yōu)化,這一模型能夠完全在終端側運行,實現(xiàn)在15秒內完成20步推理,生成飽含細節(jié)的圖像。很重要的是,即便在飛行模式下,這些AI能力都可以得到實現(xiàn),例如將Stable Diffusion的能力集成到相機應用中之后,用戶在任何一個地點拍攝照片,再要求AI將照片背景改為夕陽之下的萬里長城。

Ziad Asghar透露,如果在云端運行一個超過10億參數(shù)的生成式AI模型,可能需要數(shù)百瓦的功耗,而在終端側運行需要的功耗僅有幾毫瓦。這賦予了高通在生成式AI領域的獨特優(yōu)勢。不久的將來,擁有 100 億或更高參數(shù)的模型將能夠在終端上運行。

在今年3月春季旗艦新品發(fā)布會上,華為帶來全新智慧搜圖功能,基于多模態(tài)大模型技術,在手機端側對模型進行小型化處理,在業(yè)界率先實現(xiàn)了首創(chuàng)的、精準的自然語言手機圖庫搜索體驗。用戶可以像與人對話一樣,通過語音喚醒小藝,使用自然語言在手機圖庫中搜索出匹配如 “山頂看日出”、“圍爐煮茶”、“藍色珊瑚中的小丑魚”等描述的照片。

相較于傳統(tǒng)圖庫使用標簽進行照片搜索,存在準確率低、響應速度慢等問題,智慧搜圖更加“聰明”。結合多模態(tài)大模型技術,智慧搜圖對億級的圖文數(shù)據(jù)進行預訓練,增加了對泛化通用語義的理解,支持包含顏色、形狀、物體、行為、時間和地點等多信息組合的自然語言搜索,同時還實現(xiàn)了端側輕量化應用。

小結

由于AI在邊緣或者端側的部署具有諸多優(yōu)勢,近年來AI在邊緣側的應用滲透率也越來越高。AI大模型迅猛發(fā)展,未來在終端的部署也是必然趨勢,眾多廠商已經(jīng)對此進行探索,并有所突破,期待AI大模型未來能夠是實實在在賦能各行各業(yè)。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39704

    瀏覽量

    301298
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    意法半導體STM32 AI模型庫助力邊緣AI落地應用

    開發(fā)邊緣AI(Edge AI)時,可以說“理解問題本身”就已成功了一半。然而,隨著AI模型持續(xù)
    的頭像 發(fā)表于 01-14 11:07 ?607次閱讀

    如何利用NPU與模型壓縮技術優(yōu)化邊緣AI

    ,AI 模型體積龐大,部署 NPU上常常面臨困難,這凸顯了模型壓縮技術的重要性。要實現(xiàn)高效的實時邊緣
    的頭像 發(fā)表于 11-07 15:26 ?1252次閱讀
    如何利用NPU與<b class='flag-5'>模型</b>壓縮技術優(yōu)化<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>

    工業(yè)視覺網(wǎng)關:RK3576賦能多路檢測與邊緣AI

    ,將 “多路檢測 + 硬編硬解 + 邊緣AI + MES集成” 融為一體:保障畫質與時延的同時,顯著降低系統(tǒng)復雜度與總體成本,并以數(shù)據(jù)閉環(huán)驅動良率持續(xù)提升。
    發(fā)表于 10-16 17:56

    此芯科技發(fā)布“合一”AI加速計劃,賦能邊緣AI創(chuàng)新

    產品組合,覆蓋從1.5B至32B參數(shù)規(guī)模的AI模型推理需求,滿足工業(yè)、消費電子、智能終端等多樣化場景的部署需求,推動AI技術從云端向
    的頭像 發(fā)表于 09-15 11:53 ?2011次閱讀
    此芯科技發(fā)布“合一”<b class='flag-5'>AI</b>加速計劃,賦能<b class='flag-5'>邊緣</b>與<b class='flag-5'>端</b>側<b class='flag-5'>AI</b>創(chuàng)新

    如何在基于Arm架構的邊緣AI設備上部署飛槳模型

    當 Arm 與領先的開源深度學習平臺強強聯(lián)合,會帶來什么?那就是推動創(chuàng)新的“火箭燃料”。Arm 攜手百度,利用雙方高能效計算平臺與 AI 模型的技術積累,助力廣大開發(fā)者加快邊緣
    的頭像 發(fā)表于 09-06 14:07 ?1083次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局一致性等方面的細微差異。 邊緣部署:將模型量化、編譯,最終高效運行在算力
    發(fā)表于 08-21 13:59

    AI 邊緣計算網(wǎng)關:開啟智能新時代的鑰匙?—龍興物聯(lián)

    在數(shù)字化浪潮的當下,AI 邊緣計算網(wǎng)關正逐漸嶄露頭角,成為眾多行業(yè)轉型升級的關鍵力量。它宛如一座智能橋梁,一緊密連接著各類物理設備,如傳感器、攝像頭、工業(yè)機器等,負責收集豐富的數(shù)據(jù)信息;另一
    發(fā)表于 08-09 16:40

    邊緣智能網(wǎng)關在水務行業(yè)中的應用—龍興物聯(lián)

    :? 減少海量抄表數(shù)據(jù)上行壓力,僅上傳關鍵信息或日/月匯總數(shù)據(jù)。 防洪排澇與雨水管理? 應用:? 雨水井、河道、排水管網(wǎng)部署液位、流速、雨量傳感器,邊緣網(wǎng)關實時監(jiān)控。 優(yōu)勢:? 內澇實時預警:?
    發(fā)表于 08-02 18:28

    為何邊緣設備正成為AI的新重心

    人工智能 (AI) 正在以驚人的速度發(fā)展。企業(yè)不再僅僅是探索 AI,而是積極推動 AI 的規(guī)?;涞兀瑥膶嶒炐詰棉D向實際部署。隨著生成式模型
    的頭像 發(fā)表于 07-30 09:12 ?865次閱讀

    邊緣AI實現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    邊緣AI的實現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設備上,使這些設備能夠本地進行數(shù)
    的頭像 發(fā)表于 06-19 12:19 ?1375次閱讀
    <b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>實現(xiàn)的核心環(huán)節(jié):硬件選擇和<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    STM32F769是否可以部署邊緣AI

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    邊緣AI實現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    電子發(fā)燒友網(wǎng)綜合報道 邊緣AI的實現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設備上,使這些設備能夠
    發(fā)表于 05-26 07:09 ?1460次閱讀

    Deepseek海思SD3403邊緣計算AI產品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應用場景,自己采集樣本數(shù)據(jù),進
    發(fā)表于 04-28 11:05

    AI模型部署正當時:移遠端側AI模型解決方案,激活場景智能新范式

    AI技術飛速發(fā)展的當下,AI模型的應用正從云端向側加速滲透。 作為全球領先的物聯(lián)網(wǎng)整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻
    發(fā)表于 03-27 11:26 ?562次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>側<b class='flag-5'>部署</b>正當時:移遠端側<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解決方案,激活場景智能新范式

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能物聯(lián)網(wǎng)革新

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)當下,快速發(fā)展的 AI 正不斷賦予邊緣設備越來越先進的智能性,使邊緣設備勝任越來越重要的任務。為應對
    的頭像 發(fā)表于 03-06 11:43 ?2041次閱讀
    Arm 推出 Armv9 <b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 計算平臺,以超高能效與先進 <b class='flag-5'>AI</b> 能力賦能物聯(lián)網(wǎng)革新