91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Kria K26 SOM性能解決方案的對比分析

YCqV_FPGA_EETre ? 來源:FPGA開發(fā)圈 ? 作者:FPGA開發(fā)圈 ? 2021-07-02 14:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

賽靈思的研究結果表明,K26 SOM 提供了比英偉達 Jetson Nano 高出大約 3 倍的性能。此外,它的單位功耗性能較之英偉達 Jetson TX2 提升了 2 倍。對于 SSD MobileNet-v1 這樣的網絡,K26 SOM 的低時延、高性能深度學習處理單元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

與未來兼容的 Kria K26 SOM

智能應用除了要求亞微秒級的時延,還需要具備私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架構為基礎,Kria K26 SOM 提供了業(yè)界一流的單位功耗性能和更低的總體擁有成本,使之成為邊緣設備的理想選擇。

原始計算能力

就在邊緣設備上部署解決方案而言,硬件必須擁有充足的算力,才能處理先進 ML 算法工作負載。我們可以使用各種深度學習處理單元 (DPU) 配置對 Kria K26 SOM 進行配置,還能根據性能要求,將最適用的配置集成到設計內。

支持更低精度的數(shù)據類型

深度學習算法正在以極快的速度演進發(fā)展,各種更低精度的數(shù)據類型和定制數(shù)據正在進入使用。傳統(tǒng)的 GPU 廠商已無法滿足當前的市場需求,而 Kria K26 SOM 能夠支持全系列數(shù)據類型精度,如 PF32、INT8、二進制和其他定制數(shù)據類型。

運算的能耗成本

低時延與低功耗

為了改善軟件可編程能力,GPU 架構需要頻繁訪問外部 DDR。這種做法非常低效,有時候會對高帶寬設計要求構成瓶頸。相反,Zynq MPSoC 架構具有高能效,它的可重配置能

力便于開發(fā)者設計的應用減少或不必訪問外部存儲器。這不僅有助于減少應用的總功耗,也通過降低端到端時延改善了響應能力。

典型 GPU 與 Zynq MPSoC 架構

靈活性

與數(shù)據流固定的 GPU 不同,賽靈思硬件提供了靈活性用來專門地重新配置數(shù)據路徑,從而實現(xiàn)最大吞吐量并降低時延。此外,可編程的數(shù)據路徑也降低了對批處理的需求,而批處理是 GPU 的一個重大不足,需要在降低時延或提高吞吐量之間做出權衡取舍。Kria SOM 靈活的架構已在稀疏網絡中展示出巨大潛力。

02

與英偉達 Jetson 性能比較

深度學習模型性能比較

根據測試數(shù)據,所有模型在 K26 SOM 上的性能數(shù)值均優(yōu)于英偉達 Jetson Nano。而且對于 SSD Mobilenet-V1 等部分模型,吞吐量則為 Jetson Nano 的四倍以上,為 Jetson Tx2 的兩倍左右,從下表可以很容易地看到顯著的吞吐量提升。

FPS(時延優(yōu)化)

功耗測量

邊緣設備提供最佳性能這點非常重要,但同時必須降低能耗。賽靈思測量了英偉達和賽靈思 SOM 模塊在執(zhí)行具體模型時發(fā)生的峰值功率,結果很明顯,K26 SOM 優(yōu)于 Jetson Nano

3.5 倍,優(yōu)于 Jetson TX2 2.4 倍。

FPS/瓦

實際應用性能比較

為了分析實際用例,我們選擇了一種準確檢測和識別車輛牌照的基于機器學習的應用。將 Uncanny Vision 行業(yè)領先的 ANPR 算法部署在 Kria SOM 上后,與英偉達用 Deepstream-SDK 完成的“車牌識別”的公開數(shù)據進行比較,結果說明,Uncanny Vision 的 ANPR 流水線在針對 KV260 入門套件進行優(yōu)化后,實現(xiàn)了超過 33fps 的吞吐量,顯著優(yōu)于英偉達基準測試中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。這種前所未有的性能水平為 ANPR 集成商和 OEM 廠商提供了優(yōu)于競爭對手的開發(fā)靈活性。

實際應用測試顯示,K26 SOM 不僅在標準性能比較中表現(xiàn)極其優(yōu)異,并且在為開發(fā)者提供加速整體 AI 和視覺流水線所需的原始性能時,效率也更高。通過對比,在標準的基準測試領域之外,競爭解決方案傾向于提供較低效率水平,而且功耗較高。

文章出處:【微信公眾號:FPGA開發(fā)圈】

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 賽靈思
    +關注

    關注

    33

    文章

    1798

    瀏覽量

    133456
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5196

    瀏覽量

    135515
  • 英偉達
    +關注

    關注

    23

    文章

    4090

    瀏覽量

    99234

原文標題:白皮書 | Kria K26:邊緣端視覺 AI 理想平臺

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    探索VIPer26K:高性能高壓轉換器的卓越之選

    探索VIPer26K:高性能高壓轉換器的卓越之選 在電子工程師的設計世界里,選擇一款合適的高壓轉換器至關重要。今天,我們就來深入了解一下VIPer26K這款高性能的高壓轉換器,看看它究
    的頭像 發(fā)表于 01-28 09:25 ?336次閱讀

    探索LNBH26:衛(wèi)星接收的理想解決方案

    探索LNBH26:衛(wèi)星接收的理想解決方案 在衛(wèi)星接收設備的設計中,找到一款性能卓越、功能全面的電壓調節(jié)器和接口IC至關重要。今天,我們就來深入了解一下ST公司推出的LNBH26,看看它
    的頭像 發(fā)表于 01-27 10:00 ?208次閱讀

    探索Xilinx Kria KR260機器人入門套件:開啟機器人應用開發(fā)新旅程

    Kria KR260機器人入門套件由K26系統(tǒng)級模塊(SOM)的非生產版本、機器人載板和散熱解決方案組成。SOM非常緊湊
    的頭像 發(fā)表于 12-15 14:45 ?480次閱讀

    探索 AMD Kria KD240 驅動入門套件:開啟電機控制與電源轉換新征程

    KD240 驅動入門套件由 K24 系統(tǒng)級模塊(SOM)的非生產版本、載板和散熱解決方案組成。SOM 非常緊湊,僅包含關鍵組件,
    的頭像 發(fā)表于 12-15 14:35 ?774次閱讀

    探索AMD Kria K24 SOM:高性能嵌入式平臺的卓越之選

    (System-on-Module)作為一款緊湊的嵌入式平臺,為眾多應用場景提供了強大的解決方案。今天,我們就來深入了解一下這款產品。 文件下載: AMD , Xilinx Kria? K24
    的頭像 發(fā)表于 12-15 14:35 ?458次閱讀

    無源探頭與高壓探頭技術對比分析

    本文對比分析了無源探頭與高壓探頭的技術原理、性能參數(shù)及應用場景,為選擇合適探頭提供參考。
    的頭像 發(fā)表于 11-30 15:47 ?691次閱讀

    傳統(tǒng)普通掃碼槍與RFID掃描槍對比分析

    本文深入對比傳統(tǒng)普通掃碼槍與RFID掃描槍的核心差異,從成本結構、使用場景到技術特點進行全面分析,幫助企業(yè)選擇最適合的數(shù)據采集解決方案。
    的頭像 發(fā)表于 11-19 11:03 ?1220次閱讀
    傳統(tǒng)普通掃碼槍與RFID掃描槍<b class='flag-5'>對比分析</b>

    AMD Kria KV260視覺AI入門套件更新升級

    各種軟件工具與加速應用,適合各種專業(yè)水平的開發(fā)人員。這款開箱即用的套件能極大助力希望利用量產版 Kria K26 SOM 加速產品上市并實現(xiàn)批量部署的客戶。
    的頭像 發(fā)表于 07-18 09:50 ?976次閱讀

    TaskPool和Worker的對比分析

    ,并提高系統(tǒng)的整體性能。 本文將從實現(xiàn)特點和適用場景兩個方面來進行TaskPool與Worker的比較。 實現(xiàn)特點對比 表1 TaskPool和Worker的實現(xiàn)特點對比 實現(xiàn)
    發(fā)表于 06-18 06:43

    國內外電機結構 工藝對比分析

    純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:國內外電機結構 工藝對比分析.pdf【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!
    發(fā)表于 05-29 14:06

    主流汽車電子SoC芯片對比分析

    主流汽車電子SoC芯片對比分析 隨著汽車智能化、電動化趨勢加速,系統(tǒng)級芯片(SoC)已成為汽車電子核心硬件。本文從技術參數(shù)、市場定位、應用場景及國產化進程等維度,對主流汽車電子SoC芯片進行對比分析
    的頭像 發(fā)表于 05-23 15:33 ?5942次閱讀

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    的 Jetson Orin 底板 支持 AMD-Xilinx KRIA K26 模塊化系統(tǒng)的 Kria K26 Devboard 支持 Google Coral 模塊化系統(tǒng)的 Goo
    發(fā)表于 05-12 18:13

    Variscite提供ISO 13485認證SoM解決方案

    Variscite是全球知名的系統(tǒng)模塊 (SoM) 供應商,近二十年來專注于先進嵌入式解決方案的研發(fā)。作為白金合作伙伴,Variscite與恩智浦建立了穩(wěn)固而持久的合作關系,憑借恩智浦先進的處理器,提供可擴展的高性能
    的頭像 發(fā)表于 05-12 15:11 ?1524次閱讀

    浮思特 | 新興傳感器技術:TMR與分流解決方案對比分析

    有一段時間,分流解決方案被視為傳感器技術中的安全選擇,但世界已經改變。拼湊廉價的分流架構的時代已經結束。隨著精度要求的不斷提高,傳統(tǒng)的分流解決方案在總解決方案成本急劇上漲的情況下失去了成本效益。分流
    的頭像 發(fā)表于 04-11 13:53 ?902次閱讀
    浮思特 | 新興傳感器技術:TMR與分流<b class='flag-5'>解決方案</b>的<b class='flag-5'>對比分析</b>

    機器人開發(fā)套件 Kria KR260

    機器人的潛力 用戶指南 產品簡介 Kria KR260機器人入門套件包括載卡、Kria K26 SOM和散熱解決方案。該
    的頭像 發(fā)表于 04-11 13:15 ?1905次閱讀
    機器人開發(fā)套件 <b class='flag-5'>Kria</b> KR260