91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 、 Arm和Intel發(fā)布FP8標(biāo)準(zhǔn)化規(guī)范作為AI的交換格式

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Shar Narasimhan ? 2022-10-11 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能處理需要跨硬件和軟件平臺的全棧創(chuàng)新,以滿足神經(jīng)網(wǎng)絡(luò)日益增長的計算需求。提高效率的一個關(guān)鍵領(lǐng)域是使用較低精度的數(shù)字格式來提高計算效率,減少內(nèi)存使用,并優(yōu)化互連帶寬。

為了實現(xiàn)這些好處,業(yè)界已經(jīng)從 32 位精度轉(zhuǎn)換為 16 位,現(xiàn)在甚至是 8 位精度格式。 transformer 網(wǎng)絡(luò)是人工智能中最重要的創(chuàng)新之一,尤其受益于 8 位浮點(diǎn)精度。我們相信,擁有一種通用的交換格式將使硬件和軟件平臺的快速發(fā)展和互操作性得以提高,從而推動計算。

NVIDIA 、 ArmIntel 聯(lián)合撰寫了一份白皮書 FP8 Formats for Deep Learning ,描述了 8 位浮點(diǎn)( FP8 )規(guī)范。它提供了一種通用的格式,通過優(yōu)化內(nèi)存使用來加速人工智能的開發(fā),并適用于人工智能訓(xùn)練和推理。此 FP8 規(guī)格有兩種變體, E5M2 和 E4M3 。

該格式在 NVIDIA 料斗體系結(jié)構(gòu)中本地實現(xiàn),并在初始測試中顯示出出色的結(jié)果。它將立即受益于更廣泛的生態(tài)系統(tǒng)所做的工作,包括 AI 框架,為開發(fā)者實現(xiàn)它。

兼容性和靈活性

FP8 通過硬件和軟件之間的良好平衡,最大限度地減少了與現(xiàn)有 IEEE 754 浮點(diǎn)格式的偏差,以利用現(xiàn)有實現(xiàn),加快采用速度,并提高開發(fā)人員的生產(chǎn)力。

E5M2 使用五位表示指數(shù),兩位表示尾數(shù),是一種截斷的 IEEE FP16 格式。在需要更高精度而犧牲某些數(shù)值范圍的情況下, E4M3 格式進(jìn)行了一些調(diào)整,以擴(kuò)展用四位指數(shù)和三位尾數(shù)表示的范圍。

新格式節(jié)省了額外的計算周期,因為它只使用 8 位。它可以用于人工智能訓(xùn)練和推理,而不需要在精度之間進(jìn)行任何重鑄。此外,通過最小化與現(xiàn)有浮點(diǎn)格式的偏差,它為未來 AI 創(chuàng)新提供了最大的自由度,同時仍堅持當(dāng)前的慣例。

高精度訓(xùn)練和推理

測試提議的 FP8 格式顯示,在廣泛的用例、架構(gòu)和網(wǎng)絡(luò)中,其精度相當(dāng)于 16 位精度。變壓器、計算機(jī)視覺和 GAN 網(wǎng)絡(luò)的結(jié)果都表明, FP8 訓(xùn)練精度與 16 位精度相似,但可以顯著提高速度。有關(guān)精度研究的更多信息,請參閱 FP8 Formats for Deep Learning 白皮書。

pYYBAGNE42eAKKP8AACCv9ceJTc299.png

圖 1.語言模型人工智能培訓(xùn)

在圖 1 中,不同的網(wǎng)絡(luò)使用不同的精度度量( PPL 和 Loss ),如圖所示。

pYYBAGNE42eAQ7-PAAAgaylpKC0333.png

圖 2.語言模型 AI 推理

在人工智能行業(yè)領(lǐng)先的基準(zhǔn) MLPerf Inference v2.1 中, NVIDIA Hopper 利用這種新的 FP8 格式在 BERT 高精度模型上實現(xiàn)了 4.5 倍的加速,在不影響精度的情況下獲得了吞吐量。

走向標(biāo)準(zhǔn)化

NVIDIA 、 Arm 和 Intel 以開放、無許可證的格式發(fā)布了此規(guī)范,以鼓勵行業(yè)廣泛采用。他們還將向 IEEE 提交該提案。

通過采用一種保持準(zhǔn)確性的可互換格式,人工智能模型將在所有硬件平臺上持續(xù)高效地運(yùn)行,并有助于推動人工智能的發(fā)展。

鼓勵標(biāo)準(zhǔn)機(jī)構(gòu)和整個行業(yè)

關(guān)于作者

Shar Narasimhan 是 AI 的高級產(chǎn)品營銷經(jīng)理,專門從事 NVIDIA 的 Tesla 數(shù)據(jù)中心團(tuán)隊的深度學(xué)習(xí)培訓(xùn)和 OEM 業(yè)務(wù)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9553

    瀏覽量

    391905
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109749
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265402
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    SK海力士與閃迪公司啟動HBF全球標(biāo)準(zhǔn)化制定工作

    SK海力士(或‘公司’)26日宣布,于當(dāng)?shù)貢r間25日在美國加利福尼亞州米爾皮塔斯的閃迪公司總部,與閃迪公司聯(lián)合舉辦“HBF規(guī)格標(biāo)準(zhǔn)化聯(lián)盟啟動會”,正式發(fā)布面向AI推理時代的下一代存儲器解決方案HBF(High Bandwidth
    的頭像 發(fā)表于 02-28 16:23 ?227次閱讀

    進(jìn)迭時空發(fā)布新一代RISC-V AI CPU芯片,滿足端側(cè)大模型算力需求

    FP8數(shù)據(jù)精度原生AI推理,還是首顆完整支持芯片級虛擬的RISC-V產(chǎn)品。 ? 硬件配置上,K3配備8顆高性能X100大核,主頻2.4GHz,單核性能與
    的頭像 發(fā)表于 01-30 14:06 ?8370次閱讀

    廣電計量參編多項國家標(biāo)準(zhǔn)與計量技術(shù)規(guī)范發(fā)布

    近日,國家市場監(jiān)督管理總局、國家標(biāo)準(zhǔn)化管理委員會以及工業(yè)和信息部相繼發(fā)布多項國家標(biāo)準(zhǔn)、行業(yè)計量技術(shù)規(guī)范,其中廣電計量參與編寫1項國家
    的頭像 發(fā)表于 01-13 09:41 ?536次閱讀

    廣凌標(biāo)準(zhǔn)化考場建設(shè)方案的核心模塊

    一套完整的校園標(biāo)準(zhǔn)化考場建設(shè)方案,不僅是技術(shù)的集成,更是教育公平與現(xiàn)代治理的體現(xiàn)。通過智能、綠色的手段,標(biāo)準(zhǔn)化考場體系為考試安全筑起堅
    的頭像 發(fā)表于 11-07 18:10 ?284次閱讀
    廣凌<b class='flag-5'>標(biāo)準(zhǔn)化</b>考場建設(shè)方案的核心模塊

    廣凌標(biāo)準(zhǔn)化考場整體解決方案解析:構(gòu)建智慧考場新標(biāo)桿

    在國家教育考試日益規(guī)范化的背景下,標(biāo)準(zhǔn)化考點(diǎn)建設(shè)已成為保障考試公平、提升管理效率的關(guān)鍵舉措。廣凌科技(廣凌股份)深耕教育信息領(lǐng)域27年,憑借AI、5G、物聯(lián)網(wǎng)等前沿技術(shù),推出
    的頭像 發(fā)表于 10-31 15:17 ?1097次閱讀
    廣凌<b class='flag-5'>標(biāo)準(zhǔn)化</b>考場整體解決方案解析:構(gòu)建智慧考場新標(biāo)桿

    NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    基于?NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)的 AI 數(shù)據(jù)中心網(wǎng)絡(luò)。 Meta 和 Oracle 正將 Spectrum-X 以太網(wǎng)交換機(jī)
    的頭像 發(fā)表于 10-14 10:26 ?1803次閱讀
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太網(wǎng)<b class='flag-5'>交換</b>機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    。它是開源硬件,我們已在線發(fā)布設(shè)計文檔,包括原理圖和接口定義。其異構(gòu)計算架構(gòu)兼容 NVIDIA Jetson Nano 接口標(biāo)準(zhǔn),非常適合邊緣計算、AI 推理、VR/AR、智能 NVR
    發(fā)表于 10-11 09:08

    標(biāo)準(zhǔn)化考場是什么?

    很多現(xiàn)在都在建設(shè)標(biāo)準(zhǔn)化考場,標(biāo)準(zhǔn)化考場究竟是什么呢?
    的頭像 發(fā)表于 09-05 16:45 ?1549次閱讀
    <b class='flag-5'>標(biāo)準(zhǔn)化</b>考場是什么?

    廣凌標(biāo)準(zhǔn)化考場建設(shè)整體解決方案——全力維護(hù)高考安全公平考試環(huán)境

    近日,教育部發(fā)布消息,全國公安機(jī)關(guān)會同教育部門持續(xù)高壓打擊涉考違法犯罪活動,已偵破一批組織考試作弊和涉考詐騙案件,全力保障高考安全公平環(huán)境。在此背景下,標(biāo)準(zhǔn)化考場建設(shè)作為防范作弊、維護(hù)考試秩序的核心
    的頭像 發(fā)表于 06-06 09:58 ?995次閱讀
    廣凌<b class='flag-5'>標(biāo)準(zhǔn)化</b>考場建設(shè)整體解決方案——全力維護(hù)高考安全公平考試環(huán)境

    廣凌高校標(biāo)準(zhǔn)化考場建設(shè)解決方案

    在教育信息與考試安全雙重驅(qū)動下,標(biāo)準(zhǔn)化考場建設(shè)已成為高校提升考試管理水平的核心抓手。作為深耕教育信息領(lǐng)域的高新技術(shù)企業(yè),??廣凌科技(廣凌股份)憑借“高校
    的頭像 發(fā)表于 05-29 17:04 ?738次閱讀
    廣凌高校<b class='flag-5'>標(biāo)準(zhǔn)化</b>考場建設(shè)解決方案

    摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    , 支持原生FP8數(shù)據(jù)類型,支持PyTorch 2.5.0 ,并通過多項針對MUSA計算平臺的性能優(yōu)化,進(jìn)一步提升了對AI模型和大規(guī)模數(shù)據(jù)處理的支持能力。 FP8原生支持,國產(chǎn)GPU的技術(shù)突破
    的頭像 發(fā)表于 05-11 16:41 ?1666次閱讀

    禾賽科技引領(lǐng)全球激光雷達(dá)標(biāo)準(zhǔn)化建設(shè)

    日前,由國家市場監(jiān)督管理總局、國家標(biāo)準(zhǔn)化管理委員會批準(zhǔn),禾賽作為牽頭單位及第一起草單位主持編制的《車載激光雷達(dá)國家標(biāo)準(zhǔn)GB/T 45500-2025》正式發(fā)布并實施。該
    的頭像 發(fā)表于 05-06 16:17 ?783次閱讀

    瑞為技術(shù)牽頭制定的國家標(biāo)準(zhǔn)《信息技術(shù) 可擴(kuò)展的生物特征識別數(shù)據(jù)交換格式 第1部分:框架》正式發(fā)布

    圖像、步態(tài)圖像等模態(tài))也一同發(fā)布。 至此,瑞為已累計牽頭及參與的國家/行業(yè)標(biāo)準(zhǔn)近30項,其中已發(fā)布實施的國家標(biāo)準(zhǔn)16項。 作為《信息技術(shù) 可
    的頭像 發(fā)表于 04-22 18:05 ?923次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體體驗領(lǐng)航計劃”。更值得注意的是,其三大AI工具鏈的發(fā)布——天璣開發(fā)工具集、AI開發(fā)套件2.0,以及升級的天璣星速引擎與旗艦芯片天璣
    發(fā)表于 04-13 19:52

    摩爾線程GPU原生FP8計算助力AI訓(xùn)練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓(xùn)練策略和高性能算子庫,這兩大框架在國產(chǎn)全功能GPU上實現(xiàn)了高效的混合
    的頭像 發(fā)表于 03-17 17:05 ?1528次閱讀
    摩爾線程GPU原生<b class='flag-5'>FP8</b>計算助力<b class='flag-5'>AI</b>訓(xùn)練