91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦黃氏定律:NVIDIA 首席科學家 Bill Dally 介紹推動 GPU 性能提升的關(guān)鍵因素

NVIDIA英偉達 ? 來源:未知 ? 2023-10-12 19:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在近期舉行的處理器和系統(tǒng)工程師年度盛會Hot Chips上,NVIDIA 首席科學家 Bill Dally 發(fā)表了主題演講。在演講中,其描述了后摩爾定律時代計算機性能正在發(fā)生結(jié)構(gòu)性的變化。

點擊觀看 Bill Dally 在 Hot Chips 主題演講完整視頻

他表示,每一款新處理器都具備獨創(chuàng)性,需要經(jīng)過不懈的努力,發(fā)明并驗證新的電子元件。這與上一代產(chǎn)品的開發(fā)截然不同,當時的工程師主要依賴于芯片更小、更快的物理特性。

Dally 在 NVIDIA Research 領(lǐng)導著一支 300 多人的團隊,過去十年間他們將單個 GPUAI 推理性能提高了 1000 倍(詳見下圖)。

wKgaomUt2zaAUzc7AADX7XjyyqQ650.jpg

IEEE Spectrum 最先以 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛的名字將這一驚人的性能提升命名為 "黃氏定律(Huang’s Law) ",后來《華爾街日報》的一篇專欄文章又讓該定律廣為流傳。

這樣的飆升速度是對以同樣驚人的速度崛起的大語言模型的回應,該模型用于生成式 AI,并且每年都以數(shù)量級的速度增長。

Dally 說:"這為硬件行業(yè)的發(fā)展設(shè)定了步調(diào),因為我們必須滿足這種需求。”

在演講中,Dally 詳細介紹了推動性能提升 1000 倍的要素。

其中,提升幅度最大的一次達到了 16 倍,這源于人們找到了更簡單的方法來表示計算機運算使用的數(shù)字。

新的運算方法

最新的 NVIDIA Hopper 架構(gòu)及其 Transformer 引擎采用 8 位和 16 位浮點與整數(shù)運算的動態(tài)組合。這種運算方法專為滿足當今生成式 AI 模型的需求而量身定制。Dally 詳細介紹了該運算方法帶來的性能提升和節(jié)能效果。

Dally 領(lǐng)導的團隊通過編寫高級指令,指導 GPU 組織工作,實現(xiàn)了 12.5 倍的性能提升。這些復雜的指令有助于以更低的能耗做更多的工作。

因此,計算機就可以像“專用加速器一樣高效,同時保留 GPU 的所有可編程性”,Dally 介紹道。

此外,NVIDIA Ampere 架構(gòu)還增加了結(jié)構(gòu)化稀疏功能,這種創(chuàng)新方法可以在不影響模型精度的前提下簡化了 AI 模型的權(quán)重。Dally 表示,這項技術(shù)將性能提高了兩倍,并且未來有望實現(xiàn)更大的性能提升。

Dally 還介紹了可實現(xiàn) GPU 之間高速互聯(lián)的 NVLink 以及用于系統(tǒng)間的 NVIDIA 網(wǎng)絡如何使單個 GPU 的性能提高 1000 倍。

進步之路不止步

Dally 指出,盡管 NVIDIA 在過去十年里將 GPU 的半導體節(jié)點從 28 納米推進到 5 納米,但這種技術(shù)僅僅貢獻了性能提升總量的 2.5 倍。

與摩爾定律下的前一代計算機設(shè)計相比,這是巨大的轉(zhuǎn)變。摩爾定律認為,隨著芯片變得越來越小、越來越快,處理器的性能每隔兩年翻一倍。

登納德縮放比例定律(Dennard scaling)在某種程度上對此進行了描述。該定律由 IBM 科學家 Robert Denard 在 1974 年與人合著的一篇論文中提出。但遺憾的是,物理微縮遇到了自然限制,例如更小、更快的器件所能承受的熱量。

前景樂觀

Dally 表示,盡管摩爾定律提出的性能提升在放緩,但黃氏定律仍將繼續(xù)存在,他對此充滿信心。

例如,他概括介紹了未來的幾個機會,包括進一步簡化數(shù)字表示方式、在 AI 模型中創(chuàng)建更多稀疏性以及設(shè)計更優(yōu)的內(nèi)存和通信電路。

因為每一代新的芯片和系統(tǒng)都需要新的創(chuàng)新,所以這是屬于計算機工程師的美好時代,Dally 補充說。

Dally 相信,計算機設(shè)計領(lǐng)域的新動態(tài)為 NVIDIA 工程師們提供了他們最渴望的三個機會:成為致勝團隊的一員、與聰明人共事以及從事有影響力的設(shè)計。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”掃描下方海報二維碼,關(guān)注更多會議及活動信息。

wKgaomUt2zaAC-fDAAFtccdApf0108.jpg


原文標題:聚焦黃氏定律:NVIDIA 首席科學家 Bill Dally 介紹推動 GPU 性能提升的關(guān)鍵因素

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4086

    瀏覽量

    99169

原文標題:聚焦黃氏定律:NVIDIA 首席科學家 Bill Dally 介紹推動 GPU 性能提升的關(guān)鍵因素

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時代的專業(yè) GPU 在真實應用場景中的表現(xiàn)究竟如何?今天,我們將通過深度實測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1333次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>測試

    思必馳首席科學家俞凱教授當選2026年度IEEE Fellow

    日前,全球最大的專業(yè)技術(shù)組織國際電氣電子工程師協(xié)會(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(會士)名單,上海交通大學特聘教授、思必馳聯(lián)合創(chuàng)始人、首席科學家
    的頭像 發(fā)表于 12-12 11:36 ?809次閱讀

    中興通訊崔麗受邀出席2025騰沖科學家論壇

    近日,“2025騰沖科學家論壇”在云南啟幕。本屆論壇以“科學·AI改變世界”為主題,匯聚包括諾貝爾獎、圖靈獎、菲爾茲獎得主在內(nèi)的國際頂尖科學家,以及百余位兩院院士、高校校長、科技精英與產(chǎn)業(yè)領(lǐng)袖,共話
    的頭像 發(fā)表于 12-09 11:36 ?593次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6281次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>測試

    國際類腦計算科學家Yulia Sandamirskaya教授加盟時識科技

    近日,國際類腦計算與神經(jīng)形態(tài)機器人領(lǐng)域知名科學家Yulia Sandamirskaya 教授,作為科學家顧問正式加入時識科技(SynSense)。
    的頭像 發(fā)表于 10-13 13:50 ?732次閱讀

    喜報|ZYNALOG徴格半導體首席模擬設(shè)計科學家喬納森·史卓德被授予2025年度“錢江友誼使者”稱號

    9月28日上午,2025杭州國際人才交流與項目合作大會在杭州國際博覽中心隆重開幕。在開幕式上,徴格半導體(杭州)有限公司的首席模擬設(shè)計科學家喬納森·史卓德被授予2025杭州市外國專家"錢江
    的頭像 發(fā)表于 09-30 14:06 ?1008次閱讀
    喜報|ZYNALOG徴格半導體<b class='flag-5'>首席</b>模擬設(shè)計<b class='flag-5'>科學家</b>喬納森·史卓德被授予2025年度“錢江友誼使者”稱號

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    靈感的過程中發(fā)揮關(guān)鍵作用。五、用AI實現(xiàn)諾貝爾獎級別的科學發(fā)現(xiàn) 這想法這能夠大膽的。 1、AI科學家的構(gòu)建 全自主科學實驗室需要哪些部分: ①自動實驗設(shè)備 ②流程管理系統(tǒng) ③數(shù)據(jù)處理和
    發(fā)表于 09-17 11:45

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?3982次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    聚焦離子束(FIB)技術(shù)介紹

    聚焦離子束(FIB)技術(shù)因液態(tài)金屬離子源突破而飛速發(fā)展。1970年初期,多國科學家研發(fā)多種液態(tài)金屬離子源。1978年,美國加州休斯研究所搭建首臺Ga+基FIB加工系統(tǒng),推動技術(shù)實用化。80至90年代
    的頭像 發(fā)表于 08-19 21:35 ?1086次閱讀
    <b class='flag-5'>聚焦</b>離子束(FIB)技術(shù)<b class='flag-5'>介紹</b>

    NVIDIA桌面GPU系列擴展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1409次閱讀

    UPS電源—決定UPS電源性能關(guān)鍵因素

    在工業(yè)自動化、數(shù)據(jù)中心及眾多關(guān)鍵領(lǐng)域,UPS(不間斷電源)的性能直接關(guān)系到電力供應的穩(wěn)定性和可靠性。然而,UPS電源的性能并非一成不變,而是受到多種因素的影響。下面對影響UPS電源
    的頭像 發(fā)表于 08-07 10:21 ?884次閱讀
    UPS電源—決定UPS電源<b class='flag-5'>性能</b>的<b class='flag-5'>關(guān)鍵因素</b>

    影響圖像采集卡性能關(guān)鍵因素

    關(guān)鍵因素,對于選擇合適的采集卡、優(yōu)化系統(tǒng)配置、提高應用效率具有重要意義。本文將從分辨率與幀率、接口類型與帶寬、信號處理能力、觸發(fā)與同步機制、軟件支持與兼容性、噪
    的頭像 發(fā)表于 07-03 15:20 ?748次閱讀
    影響圖像采集卡<b class='flag-5'>性能</b>的<b class='flag-5'>關(guān)鍵因素</b>

    選擇適合微機消諧器的關(guān)鍵因素

    選擇適合的微機消諧器是保障電力系統(tǒng)(尤其是中性點非有效接地系統(tǒng))安全穩(wěn)定運行的重要環(huán)節(jié)。以下是關(guān)鍵因素的詳細分條列舉: 選擇適合微機消諧器的關(guān)鍵因素: 1. ?系統(tǒng)基本參數(shù)匹配性: ? ? ?額定
    的頭像 發(fā)表于 06-13 16:27 ?523次閱讀

    DeepSeek推動AI算力需求:800G光模塊的關(guān)鍵作用

    力集群的部署過程中,帶寬瓶頸成為制約算力發(fā)揮的關(guān)鍵因素,而光模塊的速率躍升成為突破這一瓶頸的核心驅(qū)動力。 光模塊速率躍升 隨著算力集群的規(guī)模不斷擴展,AI應用所需的帶寬要求也在急劇上升。傳統(tǒng)
    發(fā)表于 03-25 12:00

    商湯絕影王曉剛亮相NVIDIA GTC 2025并發(fā)表主題演講

    商湯科技聯(lián)合創(chuàng)始人、首席科學家、商湯絕影CEO王曉剛在NVIDIA GTC 2025發(fā)表演講《激發(fā)通用人工智能的創(chuàng)造力,引領(lǐng)智能汽車走向全新的未來》。
    的頭像 發(fā)表于 03-21 14:37 ?1173次閱讀