NVIDIA發(fā)布重磅最新軟件應(yīng)用、硬件系統(tǒng)以及與寶馬集團(tuán)合作
NVIDIA提出了下一代計(jì)算的愿景,該愿景將全球信息經(jīng)濟(jì)的重心從服務(wù)器轉(zhuǎn)移到了新型的強(qiáng)大且靈活的數(shù)據(jù)中心。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在其加州住宅的廚房中錄制的六集同時(shí)發(fā)布的主題演講中,介紹了NVIDIA最近對(duì)Mellanox的收購(gòu),還有重盼所歸的基于NVIDIA Ampere GPU架構(gòu)的新產(chǎn)品以及重要的最新軟件技術(shù)。
這場(chǎng)主題演講原計(jì)劃于3月底在圣何塞舉行的NVIDIA GPU技術(shù)大會(huì)上現(xiàn)場(chǎng)直播,但因冠狀病毒疫情而受到影響。
“我要感謝正前線抗擊COVID-19所有勇敢的戰(zhàn)士們。”黃仁勛在開(kāi)場(chǎng)時(shí)說(shuō)到,“NVIDIA正在與研究人員和科學(xué)家合作,使用GPU和AI計(jì)算來(lái)治療、緩解、控制和追蹤這種大規(guī)模傳染性疾病?!?/p>
NVIDIA也宣布了其N(xiāo)VIDIA Clara醫(yī)療平臺(tái)的更新,旨在對(duì)抗COVID-19新型冠狀病毒。
“研究人員和科學(xué)家們正在使用NVIDIA加速計(jì)算來(lái)挽救生命——這完美地詮釋了我們公司的宗旨:通過(guò)制造計(jì)算機(jī),解決普通計(jì)算機(jī)不能解決的問(wèn)題?!秉S仁勛說(shuō)。
演講主要圍繞作為現(xiàn)代全球信息經(jīng)濟(jì)機(jī)房的數(shù)據(jù)中心如何變化,以及在上月完成交易的收購(gòu)案雙方NVIDIA和Mellanox如何共同推動(dòng)這些變化的愿景。
“數(shù)據(jù)中心是新的計(jì)算單元,NVIDIA正在加速?gòu)男酒?a target="_blank">CPU和GPU的連接方式,再到整個(gè)軟件堆棧,以及最終跨整個(gè)數(shù)據(jù)中心的性能提升?!?/p>
數(shù)據(jù)中心規(guī)模計(jì)算的系統(tǒng)優(yōu)化
首先,NVIDIA為這種新型的數(shù)據(jù)中心規(guī)模計(jì)算優(yōu)化了新的GPU架構(gòu),集AI訓(xùn)練和推理于一身,并實(shí)現(xiàn)了靈活且彈性的加速。
NVIDIA A100是第一個(gè)基于NVIDIA Ampere架構(gòu)的GPU,提供了在NVIDIA八代GPU里最大的性能提升,它還可用于數(shù)據(jù)分析,科學(xué)計(jì)算和云圖形,并已全面投產(chǎn)并交付給全球客戶(hù)。
全球18家領(lǐng)先的服務(wù)提供商和系統(tǒng)構(gòu)建商正在將NVIDIA A100整合到他們的服務(wù)和產(chǎn)品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。
相比上一代,NVIDIA Ampere架構(gòu)的A100將性能提升了20倍。A100的五大關(guān)鍵特性包括:
超過(guò)540億個(gè)晶體管,使其成為世界上最大的7納米處理器
帶有TF32的第三代Tensor Core核心,這是一種新的數(shù)值格式,可加速開(kāi)箱即用的單精度AI訓(xùn)練。NVIDIA廣泛使用的Tensor Core現(xiàn)在更加靈活,快速,且更易于使用
結(jié)構(gòu)稀疏性(Structural sparsity)加速,這是一種新的高效技術(shù),可以利用AI數(shù)學(xué)固有的稀疏性來(lái)獲得更高的性能
多實(shí)例GPU(Multi-instance GPU或MIG),允許將一個(gè)A100分割為多達(dá)七個(gè)獨(dú)立的GPU,每個(gè)GPU都有自己的資源
第三代NVLink技術(shù),使GPU之間的高速聯(lián)接能力加倍,從而可以使多個(gè)A100服務(wù)器充當(dāng)一個(gè)巨型GPU
以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構(gòu)相比,訓(xùn)練性能提高了6倍,推理性能提高了7倍。
NVIDIA DGX A100具備5 Petaflops的性能
NVIDIA還將發(fā)售第三代NVIDIA DGX AI系統(tǒng)—基于NVIDIA A100的NVIDIA DGX A100—世界上第一臺(tái)5 petaflops服務(wù)器。每臺(tái)DGX A100可以分割為多達(dá)56個(gè)獨(dú)立運(yùn)行的實(shí)例。
這使得單個(gè)服務(wù)器可以“縱向擴(kuò)展”以完成諸如AI訓(xùn)練之類(lèi)的計(jì)算密集型任務(wù),或者“橫向擴(kuò)展”以進(jìn)行AI部署或推理。
該系統(tǒng)的最初使用者是美國(guó)能源部的阿貢國(guó)家實(shí)驗(yàn)室,該實(shí)驗(yàn)室將利用該集群的AI和計(jì)算能力更好地理解和對(duì)抗COVID-19。此外,還有佛羅里達(dá)大學(xué)和德國(guó)人工智能研究中心。
美國(guó)能源部阿貢國(guó)家實(shí)驗(yàn)室,將使用DGX A100賦能的AI和算力更好地了解并抗擊COVID-19
A100也將作為HGX A100提供給云合作伙伴和服務(wù)器制造商。
一套由五臺(tái)DGX A100系統(tǒng)提供動(dòng)力的數(shù)據(jù)中心,其成本僅為100萬(wàn)美元,功耗僅為28千瓦,但其性能足以媲美一套典型數(shù)據(jù)中心(由50臺(tái)用于AI訓(xùn)練的DGX-1系統(tǒng)和600個(gè)總功耗高達(dá)630千瓦的CPU系統(tǒng)構(gòu)成,成本超過(guò)1100萬(wàn)美元)。
NVIDIA還宣布了下一代DGX SuperPOD。它由140臺(tái)DGX A100系統(tǒng)和Mellanox網(wǎng)絡(luò)技術(shù)搭建而成,可提供700 petaflops的AI性能,堪比全球20臺(tái)最快的計(jì)算機(jī)中的任何一臺(tái)。
新一代DGX SuperPOD實(shí)現(xiàn)了強(qiáng)達(dá)每秒70 petaflops的AI算力
NVIDIA正在用四個(gè)DGX SuperPOD來(lái)擴(kuò)展自己的數(shù)據(jù)中心,為其內(nèi)部超級(jí)計(jì)算機(jī)SATURNV,增加了2.8 exaflops的AI計(jì)算能力(總計(jì)4.6 exaflops),使其成為世界上最快的AI超級(jí)計(jì)算機(jī)。
NVIDIA同時(shí)也發(fā)布了NVIDIA EGX A100,將強(qiáng)大的實(shí)時(shí)云計(jì)算功能帶到了邊緣。其N(xiāo)VIDIA Ampere架構(gòu)GPU提供了第三代Tensor Core和新的安全功能。得益于其N(xiāo)VIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯(lián)網(wǎng)功能。
當(dāng)今世界上最重要的應(yīng)用軟件
NVIDIA GPU將為主要軟件應(yīng)用程序提供動(dòng)力,以加速三個(gè)關(guān)鍵用途:管理大數(shù)據(jù),創(chuàng)建推薦系統(tǒng)和構(gòu)建實(shí)時(shí)會(huì)話(huà)式AI。
隨著機(jī)器學(xué)習(xí)的有效性推動(dòng)公司收集了越來(lái)越多的數(shù)據(jù),這些新工具應(yīng)運(yùn)而生。積極的反饋使我們體驗(yàn)到的數(shù)據(jù)收集量呈指數(shù)級(jí)增長(zhǎng)。
為了幫助各類(lèi)組織順應(yīng)潮流,NVIDIA宣布在Spark 3.0上支持NVIDIA GPU加速,大數(shù)據(jù)分析將成為當(dāng)今世界上最重要的應(yīng)用程序之一。
基于RAPIDS的Spark 3.0,打破了提取,轉(zhuǎn)換和加載數(shù)據(jù)的性能基準(zhǔn)。它已經(jīng)幫助Adobe Intelligent Services將計(jì)算成本降低了90%。
關(guān)鍵的云分析平臺(tái)(包括Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI和Google Cloud Dataproc)都將借助NVIDIA加速。
黃仁勛還宣布推出了NVIDIA Merlin,這是一個(gè)用于構(gòu)建下一代推薦系統(tǒng)的端到端框架,該系統(tǒng)正迅速成為更加個(gè)性化互聯(lián)網(wǎng)的引擎。Merlin將創(chuàng)建一個(gè)100 TB數(shù)據(jù)集推薦系統(tǒng)所需的時(shí)間從四天減少到20分鐘。
他還詳細(xì)介紹了NVIDIA Jarvis,這是一個(gè)新的端到端平臺(tái),可以充分發(fā)揮NVIDIA AI平臺(tái)的強(qiáng)大功能,創(chuàng)建實(shí)時(shí)多模態(tài)對(duì)話(huà)式AI。
他通過(guò)一個(gè)演示來(lái)展示了與名為Misty的AI進(jìn)行交互的過(guò)程,Misty可實(shí)時(shí)理解并回答一系列有關(guān)天氣的復(fù)雜問(wèn)題。
自2018年在SIGGRAPH上發(fā)布NVIDIA RTX以來(lái),NVIDIA在實(shí)時(shí)光線追蹤方面取得了迅猛發(fā)展,當(dāng)時(shí)宣布的NVIDIA Omniverse可以讓位于不同地方使用不同工具的設(shè)計(jì)師,在同個(gè)設(shè)計(jì)的不同部分同時(shí)工作?,F(xiàn)在已經(jīng)可供搶先體驗(yàn)客戶(hù)使用。
自動(dòng)駕駛汽車(chē)
自動(dòng)駕駛汽車(chē)是我們這個(gè)時(shí)代最大的計(jì)算挑戰(zhàn)之一,NVIDIA將持續(xù)通過(guò)NVIDIA DRIVE推動(dòng)整個(gè)行業(yè)發(fā)展。
NVIDIA DRIVE將使用全新Orin SoC和NVIDIA Ampere GPU,以實(shí)現(xiàn)能效和性能,入門(mén)級(jí)ADAS系統(tǒng)開(kāi)發(fā)所需功率僅需5瓦,并為L(zhǎng)5級(jí)別robotaxi系統(tǒng)提供2,000 TOPS的性能。
現(xiàn)在,汽車(chē)制造商僅需單一計(jì)算架構(gòu)和軟件堆棧,即可將AI集成到每一輛車(chē)中。汽車(chē)制造商可以利用一種架構(gòu)來(lái)開(kāi)發(fā)整個(gè)車(chē)隊(duì),并利用整個(gè)車(chē)隊(duì)來(lái)進(jìn)行軟件開(kāi)發(fā)。
NVIDIA DRIVE生態(tài)系統(tǒng)現(xiàn)已覆蓋汽車(chē)、卡車(chē)、一級(jí)汽車(chē)供應(yīng)商、下一代出行服務(wù)、初創(chuàng)公司、地圖服務(wù)和仿真。NVIDIA將在NVIDIA DRIVE技術(shù)套件中增加用于管理整個(gè)自動(dòng)駕駛車(chē)隊(duì)的NVIDIA DRIVE RC。
機(jī)器人技術(shù)
NVIDIA還將繼續(xù)推進(jìn)其N(xiāo)VIDIA Isaac軟件定義的機(jī)器人平臺(tái),宣布寶馬集團(tuán)已選擇NVIDIA Isaac機(jī)器人技術(shù)為其下一代工廠提供動(dòng)力。
每56秒鐘,寶馬集團(tuán)在全球的30家工廠就會(huì)生產(chǎn)一輛汽車(chē):40種不同型號(hào)的汽車(chē),每種都有數(shù)百種不同的選擇,3000萬(wàn)個(gè)零件來(lái)自全球近2,000家供應(yīng)商。
寶馬集團(tuán)加入了一個(gè)龐大的NVIDIA機(jī)器人技術(shù)全球生態(tài)系統(tǒng),該生態(tài)系統(tǒng)涵蓋配送、零售、自主移動(dòng)機(jī)器人、農(nóng)業(yè)、服務(wù)業(yè)、物流、制造和醫(yī)療保健。
未來(lái),工廠實(shí)際上將成為巨大的機(jī)器人。“里面的所有運(yùn)動(dòng)部件都會(huì)由AI驅(qū)動(dòng)?!秉S仁勛說(shuō)?!皩?lái),每個(gè)批量生產(chǎn)的產(chǎn)品都將被逐一量身定制。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5592瀏覽量
109721 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135431 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10251瀏覽量
91480 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
18文章
5647瀏覽量
75009 -
Ampere
+關(guān)注
關(guān)注
1文章
81瀏覽量
4888
發(fā)布評(píng)論請(qǐng)先 登錄
超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺(tái)
NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
NVIDIA推出NVQLink高速互連架構(gòu)
使用NVIDIA NVLink Fusion技術(shù)提升AI推理性能
NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析
NVIDIA介紹NVIDIA Ampere架構(gòu)的NVIDIA A100 GPU技術(shù)
評(píng)論