91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過稀疏性支持和變壓器優(yōu)化增強AI推理

星星科技指導員 ? 來源:嵌入式計算設(shè)計 ? 作者:Saumitra Jagdale ? 2022-10-18 09:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達張量RT 8 概述

NVIDIA 張量RT 是一個高性能推理平臺,對于利用 NVIDIA 張量核心 GPU 的強大功能至關(guān)重要。TensorRT 8 是一個具有增強功能的軟件開發(fā)工具包,旨在提高性能和準確性,以應(yīng)對邊緣和嵌入式設(shè)備中發(fā)生的越來越多的 AI 推理。它允許對張量流和PyTorch神經(jīng)網(wǎng)絡(luò)進行廣泛的計算推斷。

與僅 CPU 平臺相比,TensorRT 可提供高達 40 倍的吞吐量,同時最大限度地減少延遲。它允許您從任何框架開始,并在生產(chǎn)中快速優(yōu)化、驗證和部署經(jīng)過訓練的神經(jīng)網(wǎng)絡(luò)。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性,可修剪對網(wǎng)絡(luò)整體計算無貢獻的弱連接。此外,張量RT 8 支持變壓器優(yōu)化和 BERT 大。變壓器優(yōu)化可提高性能,而量化感知訓練可提高準確性。

英偉達的張量RT 8 有什么新功能?

推理的目的是在訓練階段盡可能多地保持準確性。訓練的模型可以在硬件設(shè)備上運行,以獲得客戶的最低響應(yīng)時間和最大的吞吐量。但是,盡可能精確的必要性有時可能與邊緣可用的內(nèi)存量和吞吐量發(fā)生沖突。訓練有素、高度準確的模型可能運行速度太慢。

因此,TensorRT版本8結(jié)合了深度學習推理或訓練的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用的最新進展,以理解數(shù)據(jù)如何影響響應(yīng)。它使用兩個主要功能將語言查詢推理時間減少一半:

英偉達安培架構(gòu)的稀疏性

深度神經(jīng)網(wǎng)絡(luò)擅長各種任務(wù),如計算機視覺、語音識別和自然語言處理。隨著處理這些神經(jīng)網(wǎng)絡(luò)所需的計算能力的增加,高效的建模和計算變得越來越重要。

稀疏是采用 NVIDIA 安培架構(gòu)的 GPU 的一種全新性能方法,通過減少計算流程來提高開發(fā)人員的效率。深度學習模型的其他方面不如其他方面重要,有些甚至可能為零。因此,神經(jīng)網(wǎng)絡(luò)不需要對特定權(quán)重或參數(shù)進行計算。因此,NVIDIA 可以通過使用稀疏性將模型的權(quán)重減少近一半來增強性能、吞吐量和延遲。

通過變壓器優(yōu)化減少推理計算

在張量RT 8中,性能增強是通過變壓器優(yōu)化實現(xiàn)的。量化開發(fā)人員可以利用訓練的模型通過 8 位計算 (INT8) 執(zhí)行推理。這大大減少了張量核心中的推理計算和存儲。INT8 越來越多地用于優(yōu)化機器學習框架,如張量流和 NVIDIA 的張量壓縮包,以減少內(nèi)存和計算需求。因此,NVIDIA可以在張量RT 8上提供非常高的性能,同時保持準確性。

例如,量化感知訓練 (QAT) 有可能將準確性提高一倍。因此,與舊版本張量RT 7相比,張量RT 8可以將許多模型的性能提高一倍。

張量RT部署在眾多行業(yè)中

TensorRT更好的性能和準確性使其成為醫(yī)療保健,汽車,互聯(lián)網(wǎng)/電信服務(wù),金融服務(wù)和零售等行業(yè)的熱門選擇。例如,張量RT用于為GE醫(yī)療保健的心血管超聲系統(tǒng)提供動力。數(shù)字診斷解決方案提供商使用該技術(shù)在其 Vivid E95 掃描器上加速了自動心臟視圖檢測。心臟病專家可以通過使用改進的視圖檢測算法,在早期階段做出更準確的診斷和檢測疾病。此外,TensorRT還被Verizon,福特,美國郵政服務(wù),美國運通和其他知名公司使用。

隨著張量RT 8的發(fā)布,NVIDIA還推出了使用張量RT的Google BERT大推理的突破,來自變形金剛的雙向編碼器表示(BERT)是一種基于變壓器的機器學習技術(shù),用于預(yù)訓練自然語言處理。BERT-Large 模型只需 1.2 毫秒進行分析,從而可以實時響應(yīng)自然語言查詢。這意味著公司可以將其模型的尺寸增加一倍或三倍,以提高準確性。

像 BERT-Large 這樣的語言模型被許多推理服務(wù)在幕后使用。另一方面,基于語言的應(yīng)用程序通常無法識別細微差別或情感,從而導致整體糟糕的體驗?,F(xiàn)在,公司可以使用張量RT 8在幾毫秒內(nèi)部署整個工作流程。這些突破可以為新一代對話式AI應(yīng)用程序鋪平道路,為用戶提供更智能、更低的延遲體驗。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40006

    瀏覽量

    301658
  • 變壓器
    +關(guān)注

    關(guān)注

    0

    文章

    1896

    瀏覽量

    4010
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    船用變壓器怕潮濕?CSD船用變壓器防潮好嗎?

    成本高、耽誤航行。到底有沒有防潮好的船用變壓器?CSD船用變壓器,密封防潮,輕松應(yīng)對海洋高濕環(huán)境。核心科普:海洋高濕環(huán)境,防潮是變壓器的核心要求海洋環(huán)境的相對濕度可
    的頭像 發(fā)表于 03-05 11:05 ?104次閱讀
    船用<b class='flag-5'>變壓器</b>怕潮濕?CSD船用<b class='flag-5'>變壓器</b>防潮<b class='flag-5'>性</b>好嗎?

    128周才能交貨!AI狂潮下,全球數(shù)據(jù)中心排隊等變壓器?

    %左右。 ? 如此龐大的能源消耗背后,是電力基礎(chǔ)設(shè)施的全面升級,其中變壓器作為電能傳輸與轉(zhuǎn)換的核心設(shè)備,正從傳統(tǒng)電網(wǎng)配角躍升為AI時代不可或缺的設(shè)備。就在近期,中國變壓器成為硬通貨的話題引起廣泛關(guān)注與討論。 ? ? 交付周期超三
    的頭像 發(fā)表于 01-30 09:06 ?5970次閱讀

    音頻變壓器:守護音質(zhì)傳輸?shù)暮诵碾娮咏M件

    信號純凈度。級間變壓器位于前后級放大器之間,需具備寬頻帶耦合特性,常見電壓比為1:1或1:2,支持推挽放大電路的差分輸入需求,典型應(yīng)用于膽機功放的前后級耦合,通過倒相功能確保信號相位一致
    發(fā)表于 01-09 09:01

    損耗↓15%!AI服務(wù)電源變壓器解法新思路

    千赫茲甚至接近兆赫茲區(qū)間。 在這一過程中,變壓器產(chǎn)品所承受的工作條件已明顯不同于傳統(tǒng)服務(wù)時代。高頻化帶來的損耗放大、散熱受限以及寄生參數(shù)問題,使變壓器產(chǎn)品逐漸成為制約電源系統(tǒng)進一步優(yōu)化
    的頭像 發(fā)表于 01-07 13:54 ?365次閱讀
    損耗↓15%!<b class='flag-5'>AI</b>服務(wù)<b class='flag-5'>器</b>電源<b class='flag-5'>變壓器</b>解法新思路

    什么是UL變壓器

    與評估,并確認符合特定UL安全標準的變壓器。 簡單來說,它包含兩個關(guān)鍵點: ? ?它是一個變壓器? ?:完成電壓轉(zhuǎn)換(如480V轉(zhuǎn)380V)、電氣隔離等功能。 ? ?它擁有UL認證? ?:這個“認證”是一個標志,證明該變壓器的安
    的頭像 發(fā)表于 10-20 15:18 ?733次閱讀
    什么是UL<b class='flag-5'>變壓器</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和計算成本。 核心: MoE模型利用稀疏驅(qū)動結(jié)構(gòu),通過包含多個專家網(wǎng)絡(luò)的稀疏MoE層替換密集層,其中每個專家致力于特定的訓練數(shù)據(jù)或任務(wù)的子集,并且一個可訓練的門控機制動態(tài)地將輸入標記
    發(fā)表于 09-18 15:31

    干式變壓器線圈制造詳細步驟解析

    在現(xiàn)代電力系統(tǒng)中,干式變壓器扮演著至關(guān)重要的角色,為各種電氣設(shè)備提供穩(wěn)定、可靠的電力支持,而干式變壓器線圈作為其核心部件之一,其性能與質(zhì)量直接影響著整個變壓器的運行效能、安全
    的頭像 發(fā)表于 08-11 14:40 ?1039次閱讀
    干式<b class='flag-5'>變壓器</b>線圈制造詳細步驟解析

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    網(wǎng)絡(luò)智能診斷平臺。通過對私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓練,信而泰打造了高性能、高可靠的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準度與實用。該方案實現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與
    發(fā)表于 07-16 15:29

    華興變壓器:智能化監(jiān)測服務(wù),為BK機床控制變壓器保駕護航

    在自動化生產(chǎn)線中,BK機床控制變壓器的可靠是確保生產(chǎn)順利進行的關(guān)鍵。華興變壓器通過一系列創(chuàng)新舉措,成功提升了BK機床控制變壓器的可靠
    的頭像 發(fā)表于 07-08 14:55 ?521次閱讀
    華興<b class='flag-5'>變壓器</b>:智能化監(jiān)測服務(wù),為BK機床控制<b class='flag-5'>變壓器</b>保駕護航

    反激變換變壓器

    主要內(nèi)容 磁性元件對功率變換發(fā)展的重要 反激式變壓器的設(shè)計考慮 反激式變壓器雜散參數(shù)的效應(yīng) 反激式變壓器的磁(場)特性-感性效應(yīng) 反激
    發(fā)表于 07-01 15:32

    MAX13253ATB+T 1A、擴頻、推挽式變壓器驅(qū)動,用于隔離電源

    一、產(chǎn)品概述 MAX13253ATB+T是一款 1A推挽式變壓器驅(qū)動 ,專為簡化低EMI隔離電源設(shè)計而優(yōu)化。其核心價值在于通過單芯片集成振蕩
    發(fā)表于 06-18 11:56

    變壓器的設(shè)計實例(帶公式計算)

    部分,更加要求效率高、成本小、體積小、重量輕、具有可移動和能夠模塊化。變壓器作為開關(guān)電源必不可少磁性元件,對其進行合理優(yōu)化設(shè)計顯得非常重要。在高頻開關(guān)電源設(shè)計中,真止難以把握是磁路部分設(shè)計,開關(guān)電源
    發(fā)表于 05-23 17:45

    變壓器與電感設(shè)計手冊

    本書涉及了用于輕質(zhì)量、高頻率航空航天變壓器和低頻率、工業(yè)用變壓器設(shè)計的全部關(guān)鍵元器件。 修訂和擴展的目的在于展示磁器件設(shè)計領(lǐng)域當前的技術(shù)水平,此第三版給出了變壓器和電感設(shè)計的實際方法
    發(fā)表于 05-13 17:04

    隔離變壓器和普通變壓器有什么不同

    在現(xiàn)代社會的日常生活中,電力已經(jīng)成為不可或缺的一部分,而變壓器作為電力傳輸中的關(guān)鍵設(shè)備,隔離變壓器和普通變壓器是兩種常見的類型,它們在結(jié)構(gòu)、工作原理、應(yīng)用場景等方面存在顯著差異,下面小編來說說隔離
    的頭像 發(fā)表于 04-26 15:15 ?3296次閱讀

    一種分段氣隙的CLLC變換平面變壓器設(shè)計

    一種路徑,采用磁集成方法,對1MHz雙向CLLC變換變壓器進行研究、設(shè)計與測試,通過優(yōu)化PCB繞線方法、進行仿真優(yōu)化,提出了一種分段氣隙
    發(fā)表于 03-27 13:57