91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI編譯器如何在傳統開源框架中的工作中受益

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Brandon Lewis ? 2022-06-02 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TensorFlow/TensorFlow Lite 相比,Glow 編譯的輸入表現出 3 倍幀/秒的性能提升,而該圖顯示了 AOT 編譯與 JIT 編譯器相比的效率。

創(chuàng)造智能需要大量數據。所有這些數據都需要能夠支持它的技術。

人工智能AI) 而言,這些技術包括大量直接訪問的高速內存;能夠同時處理同一數據集的不同部分的并行計算架構;并且有點令人驚訝的是,與許多其他應用程序相比,計算精度更低。數據中心可以提供幾乎無窮無盡的這種技術組合。

因此,人工智能開發(fā)工具是為互聯網查詢、語音搜索和在線面部識別等應用程序背后的數據中心基礎設施而設計的。但隨著人工智能技術的進步,在各種用例中利用它的愿望也在增加——包括那些在小型、資源受限、基于 MCU 的邊緣平臺上運行的用例。因此,例如,編譯器等工具還必須能夠針對占用空間更小的設備優(yōu)化 AI 數據和算法,而不是僅僅關注運行基于云的推薦系統的高端硬件加速器。

Facebook 的開源機器學習編譯器 Glow 就是這種工具演變的一個例子。它使用兩階段中間表示 (IR) “降低”神經網絡圖,該中間表示生成針對各種嵌入式和服務器級硬件目標的特性和內存進行專門調整的機器代碼(圖 1)。它還執(zhí)行提前 (AOT) 編譯,最大限度地減少運行時開銷,以節(jié)省磁盤空間、內存、啟動時間等。

pYYBAGKYNaKADG4lAAEW_YkElmY357.png

圖 1. Glow 高級中間表示中的降低計算圖表示 A 的回歸,該回歸由 Glow 自動區(qū)分。

“我們擁有這個非常高性能的運行時,但很多項目并不關心,因為它們不在數據中心內,”Facebook 的研究科學家 Jordan Fix 解釋道?!八麄冃枰?AOT 編譯,盡可能地縮小,使用量化和并行化,并且沒有太多的依賴關系。

“AOT 編譯在數據中心并不那么重要,但我們可以將 LLVM 后端連接到 Glow 并針對 x86、ArmRISC-V 和專用架構,”Fix 繼續(xù)說道?!癎low 的工作方式是你有幾個級別的 IR,它們使用高級優(yōu)化和量化來限制內存。那時,編譯器后端可以接受基于指令的 IR,并根據需要對其進行優(yōu)化和編譯?!?/p>

Glow 的另一大優(yōu)勢,特別是在多樣化的嵌入式技術領域,是能夠在簡單的 C 包裝器中編譯模型。這意味著嵌入式 AI 工程師可以針對他們選擇的編譯器后端和架構優(yōu)化 Glow。它本機支持來自流行 AI 框架和庫(如 PyTorch 和 Arm 的 CMSIS-NN)的輸入,還可以通過 ONNX 神經網絡交換接受來自 TensorFlow 等環(huán)境的圖形。

AI 編譯器的競爭

當然,Glow 并不是唯一可用的神經網絡編譯器。Google 的多級中間表示 (MLIR) 是一種編譯器基礎架構,專注于張量處理器,已被 LLVM 吸收。Microsoft 的嵌入式學習庫 (ELL) 是另一個用于資源受限的 AI 設備的交叉編譯工具鏈。

然而,Glow 比任何一個都更成熟,已于 2018 年開源。它也比許多現有的 AI 編譯器選項更高效。

在發(fā)布的 i.MX 跨界 MCU 的性能測試中,NXP 系統工程師使用 TensorFlow Lite 和 Glow 編譯了 32 x 32 CIFAR-10 數據集,并將它們輸入 RT1060、RT1170 和 RT685 設備。Glow 編譯的輸入表現出至少 3 倍幀/秒的性能提升,而圖 2 讓您了解 AOT 編譯與 TensorFlow/TensorFlow Lite 框架中使用的即時 (JIT) 編譯相比的效率如何。

poYBAGKYNayAWAp9AAB212uxoCo615.png

pYYBAGKYNbKAU1lmAAClOgEERas827.png

圖 2a 和 2b。與 TensorFlow Lite 等即時 (JIT) 編譯器相比,Glow 的提前 (AOT) 編譯器可節(jié)省大量 RAM 和閃存,同時還具有顯著的每秒幀數性能優(yōu)勢。

請記住,i.MX1060 具有高達 1 MB 的片上 RAM。NXP 的 eIQ 軟件開發(fā)環(huán)境支持 Glow。

開源人工智能:看不到終點線

人工智能技術市場瞬息萬變,這使得開發(fā)組織很難致力于任何技術。這可能是 Glow 最引人注目的方面之一,它甚至與技術沒有直接關系。

作為一個擁有 130 多個活躍貢獻者的開源項目,Facebook、英特爾等大型組織繼續(xù)對 Glow 主線做出承諾,因為它們現在依賴于其通用基礎設施來訪問指令、操作符、內核等。

然后,很明顯,開源具有內在價值。

“我們經常看到我們關心的外部用戶的貢獻,比如更通用的并行化框架,我們有很多他們正在運行的機器學習模型,”Fix 說。“所以也許它可以讓他們在我們無需做任何事情的情況下獲得對運營商的支持?!拔艺J為您正在研究這個特定的計算機視覺模型”或者,“我認為這是您所說的操作員?!?他們只是審查它并移植它并登陸它。

“我們都可以從彼此在傳統開源框架中的工作中受益,”他補充道。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NXP
    NXP
    +關注

    關注

    61

    文章

    1399

    瀏覽量

    198065
  • 人工智能
    +關注

    關注

    1819

    文章

    50138

    瀏覽量

    265787
  • 編譯器
    +關注

    關注

    1

    文章

    1672

    瀏覽量

    51724
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    單片機開發(fā)功能安全編譯器

    期間顯示的防御代碼。僅僅因為在單元測試期間已經實現了防御性代碼的覆蓋范圍,因此并不能保證其已存在于完整的系統。 在功能安全這個陌生的領域,編譯器可能超出了其要素。這就是為什么目標代碼驗證(OCV
    發(fā)表于 12-01 06:44

    開源鴻蒙技術大會2025丨編譯器與編程語言分論壇:語言驅動系統創(chuàng)新,編譯賦能生態(tài)繁榮

    在萬物智聯的時代背景下,操作系統底層能力的構建離不開編程語言與編譯器的關鍵支撐。作為開源鴻蒙生態(tài)的核心技術,語言設計與編譯器、虛擬機實現的進步直接關系到開發(fā)效率、運行性能與系統安全。本次分論壇聚焦
    的頭像 發(fā)表于 11-20 17:24 ?963次閱讀
    <b class='flag-5'>開源</b>鴻蒙技術大會2025丨<b class='flag-5'>編譯器</b>與編程語言分論壇:語言驅動系統創(chuàng)新,<b class='flag-5'>編譯</b>賦能生態(tài)繁榮

    取之于開源,貢獻于開源:進迭時空AI計算生態(tài)開源貢獻

    開放創(chuàng)新是進迭時空的企業(yè)價值觀之一,公司的軟硬件技術棧構建在開源之上,同時也積極在操作系統、編譯器、AI計算生態(tài)等領域為開源做貢獻。opencvopencv是最具影響力的機器視覺
    的頭像 發(fā)表于 10-21 09:03 ?5844次閱讀
    取之于<b class='flag-5'>開源</b>,貢獻于<b class='flag-5'>開源</b>:進迭時空<b class='flag-5'>AI</b>計算生態(tài)<b class='flag-5'>開源</b>貢獻

    GCC編譯器,怎么才能實現c文件未被調用的函數,不會被編譯呢?

    GCC編譯器,怎么才能實現c文件未被調用的函數,不會被編譯?有什么編譯選項可以設置嗎? 移植代碼,有些函數沒被調用的函數想留在代碼里,但不想被編譯
    發(fā)表于 09-28 12:25

    開源鴻蒙MNN AI應用開發(fā)與MNN移植經驗

    本期內容由AI Model SIG提供,介紹了在開源鴻蒙,利用MNN開源框架開發(fā)AI應用以及基
    的頭像 發(fā)表于 09-04 11:31 ?4648次閱讀
    <b class='flag-5'>開源</b>鴻蒙MNN <b class='flag-5'>AI</b>應用開發(fā)與MNN移植經驗

    請問如何在keil μVision 5上進行ARM編譯器的代碼優(yōu)化?

    何在keil μVision 5上進行ARM編譯器的代碼優(yōu)化?
    發(fā)表于 08-20 07:37

    何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    何在裸機環(huán)境運行KleidiAI微內核

    探索如何在裸機環(huán)境運行 KleidiAI 內核,并通過測試多款 C/C++ 編譯器,以確定如何能更高效地生成代碼。
    的頭像 發(fā)表于 08-08 15:16 ?3863次閱讀
    如<b class='flag-5'>何在</b>裸機環(huán)境<b class='flag-5'>中</b>運行KleidiAI微內核

    求助,關于NanoEdge AI Studio生成的庫交叉編譯器版本疑問求解

    我使用的是NanoEdge AI Studio v4.3.1,跟著官方交教程生成了庫libneai.a,我通過metadata.json文件得知生成這個庫的交叉編譯器版本是\"
    發(fā)表于 08-08 07:25

    進迭時空同構融合RISC-V AI CPU的Triton算子編譯器實踐

    Triton是由OpenAI開發(fā)的一個開源編程語言和編譯器,旨在簡化高性能GPU內核的編寫。它提供了類似Python的語法,并通過高級抽象降低了GPU編程的復雜性,同時保持了高性能。目前
    的頭像 發(fā)表于 07-15 09:04 ?1959次閱讀
    進迭時空同構融合RISC-V <b class='flag-5'>AI</b> CPU的Triton算子<b class='flag-5'>編譯器</b>實踐

    邊緣設備AI部署:編譯器如何實現輕量化與高性能?

    、ASIC等)上高效執(zhí)行的機器代碼。AI編譯器AI模型的部署和優(yōu)化扮演著關鍵角色,能夠顯著提升模型的運行效率和性能。 ? AI
    的頭像 發(fā)表于 07-06 05:49 ?6724次閱讀

    編譯器功能安全驗證的關鍵要素

    在汽車、工業(yè)、醫(yī)療等安全關鍵型應用,確保功能安全合規(guī)性需要嚴格的工具鏈驗證。開發(fā)安全關鍵型軟件的企業(yè)必須遵守ISO 26262、IEC 61508、ISO 62304等國際標準對編譯器工具鏈進行全面的驗證。
    的頭像 發(fā)表于 07-05 13:37 ?1598次閱讀

    RISC-V架構下的編譯器自動向量化

    進迭時空專注于研發(fā)基于RISC-V的高性能新AICPU,對于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進迭時空非常重視RISC-V
    的頭像 發(fā)表于 06-06 16:59 ?1275次閱讀
    RISC-V架構下的<b class='flag-5'>編譯器</b>自動向量化

    滾珠絲桿在工作中損耗會影響什么?

    滾珠絲桿在工作中的損耗會對設備的性能、精度、壽命和運行穩(wěn)定性產生多方面的影響。
    的頭像 發(fā)表于 05-10 17:54 ?553次閱讀
    滾珠絲桿在<b class='flag-5'>工作中</b>損耗會影響什么?

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    使用FX3S遇到了RVCT編譯器的問題。 1、在SDK的release note中有支持RVCT的描述, 但是在EZ USB Suite的設置沒有找到RVCT的選項, 請問支持的具體版本
    發(fā)表于 05-08 07:49