日本真人在线视频观看无码,日本a视频网站免费

英偉達 | GTC2022| 高性能計算

NVIDIA | RTX4090 |液冷服務(wù)器

在東數(shù)西算、生命科學(xué)、遙感測繪、地質(zhì)勘探、真空羽流、冷凍電鏡等技術(shù)的快速發(fā)展下，高性能計算的發(fā)展逐漸被人們所重視。GTC 2022會上指出高性能計算是推動科學(xué)發(fā)展的關(guān)鍵工具之一。

昨天GeForce RTX 4090顯卡正式公布，是全新GeForce RTX 40系列的旗艦產(chǎn)品，也是全球首款基于全新NVIDIA Ada Lovelace架構(gòu)。與上一代采用DLSS 2的RTX 3090 Ti相比，采用DLSS 3的RTX 4090的性能提升可達4倍。RTX 4090具有760億個晶體管、16384個CUDA 核心和 24GB 高速美光 GDDR6X 顯存。

本文將從英偉達為何在高性能計算中處于不敗地位、高性能計算發(fā)展趨勢、以及高性能計算解決方案為大家解讀。

高端GPU

英偉達獨角戲？

作為通用計算的“加速神器”--——高端GPU正在成為大型數(shù)據(jù)中心、人工智能、超算等領(lǐng)域的剛需。英偉達在高端GPU市場長期占據(jù)主導(dǎo)地位，市場份額一度超過90%。目前國內(nèi)企業(yè)要突破英偉達等國外公司的壟斷還有很長的路要走。而國內(nèi)基于架構(gòu)創(chuàng)新的DSA（針對特定領(lǐng)域的可編程處理器）芯片產(chǎn)品日益豐富，可能會帶來一些曙光。

高端GPU與傳統(tǒng)GPU“涇渭分明”

傳統(tǒng)GPU聚焦圖像學(xué)，關(guān)注幀數(shù)、渲染逼真度、對于真實場景的映射程度等指標，主要用于運行游戲、專業(yè)圖像處理、加密貨幣處理等場景。而高端GPU是用于計算加速的芯片產(chǎn)品，專注于基礎(chǔ)科學(xué)等超算領(lǐng)域和訓(xùn)練、推理等大規(guī)模人工智能計算場景。

衡量高端GPU的主要維度是通用性、易用性和高性能。通用硬件架構(gòu)應(yīng)該足夠靈活，以適應(yīng)人工智能的迭代算法和場景。易用性是指開發(fā)門檻更低，開發(fā)者更容易上手，結(jié)合實際場景進行定制化開發(fā)。高性能是指芯片產(chǎn)品的基本性能和性價比必須達到國際先進水平，才能進行市場開拓。

2022年第二季度獨立GPU市場（包括AIB 合作伙伴顯卡）份額

來源：Jon Peddie Research

算力往往是市場對GPU性能優(yōu)劣的“第一印象”。但高端GPU的性能不等于紙面性能，尤其不能用單一性能的紙面數(shù)據(jù)來衡量。

在實際使用的過程中，GPU的通用性、易用性、實際性的重要程度遠大于紙面標出的算力這一單一性能。紙面指標標得再高，也要關(guān)注內(nèi)存和帶寬夠不夠，以及芯片之間的互聯(lián)等問題解決得好不好。用單一性能來衡量GPU是否高端，是一個常見的誤區(qū)。

高性能計算將是主要“競技場”

長期以來，英偉達一直主導(dǎo)著高端GPU市場，市場份額超過90%，尤其是在人工智能計算領(lǐng)域。到目前為止，英偉達已經(jīng)推出Volta、Ampere、Hopper等用于高性能計算和AI訓(xùn)練的架構(gòu)，并在此基礎(chǔ)上推出了V100、A100、H100等高端GPU。面向向量的雙精度浮點運算能力從7.8 TFLOPS一路走到30 TFLOPS。

作為全球第二大獨立GPU供應(yīng)商，AMD雖在高端GPU的整體份額與英偉達存在差距，但在超算領(lǐng)域闖出了一片天。在最新全球超級計算機TOP500榜單上，世界上最快的超級計算機橡樹嶺國家實驗室（ORNL）前沿、世界排名第三的超級計算機LUMI，都采用了AMD EPYC處理器和AMD Instinct MI250X GPU加速器。

AMD在超算領(lǐng)域的亮眼表現(xiàn)，是建立在針對性的軟硬件設(shè)計上，基于CDNA 2架構(gòu)的GPU加速器、ROCm軟件平臺與開源應(yīng)用程序資源中心AMD Infinity Hub的組合，構(gòu)成了對于科研人員更加友好的硬件性能和編程環(huán)境。

雖然直接使用GPU進行高性能或AI計算更方便，但上層應(yīng)用降本增效的核心需求對底層算力提出了更高的要求。國外AI創(chuàng)業(yè)公司推出的AI芯片往往基于一種新的架構(gòu)，全面提升并側(cè)重優(yōu)化并行計算能力。國內(nèi)領(lǐng)先的AI芯片公司也出于同樣的考慮，推出了一系列基于DSA架構(gòu)的人工智能計算芯片。

在國內(nèi)市場，基于架構(gòu)創(chuàng)新的DSA芯片產(chǎn)品日益豐富。如華為自研的面向AI計算的架構(gòu)特色達芬奇，昆侖芯科技推出的第一代架構(gòu)XPU-K和第二代架構(gòu)XPU-R，燧原科技的自研架構(gòu)GCU-CARA等，都已經(jīng)進入規(guī)模落地階段。隨著AI計算的應(yīng)用場景越來越細分和復(fù)雜，定制化和異構(gòu)化DSA有望在下一代計算平臺中發(fā)揮更大的作用。

新應(yīng)用領(lǐng)域?qū)映霾桓F

全球災(zāi)難性氣候事件正在不斷增加，提前預(yù)測此類事件對保護人類安全越來越重要，因此未來一年與氣候預(yù)測相關(guān)的應(yīng)用程序?qū)⒃贖PC領(lǐng)域備受關(guān)注。此外，隨著HPC在云端的使用，將有更多HPC應(yīng)用于消費導(dǎo)向的軟件程序開發(fā)，虛擬世界和元宇宙概念的出現(xiàn)，也讓HPC迎來新的發(fā)展機遇，既可用于游戲（AR/VR）等娛樂應(yīng)用，也可用于數(shù)字孿生等模擬應(yīng)用。

HPC市場正在擴展新的領(lǐng)域，在傳統(tǒng)的模擬和建模過程中加入人工智能（AI）和數(shù)據(jù)分析技術(shù)。新冠疫情的爆發(fā)增加了對靈活、可擴展的云端HPC解決方案的需求，這一需求連同各個垂直行業(yè)（生命科學(xué)、汽車、金融、游戲、制造業(yè)、航空航天等）對快速處理數(shù)據(jù)和高精度日益增長的需求，將會是未來幾年推動HPC應(yīng)用增長的主要因素。AI、邊緣計算、5G等技術(shù)將拓寬HPC的功能，從而形成新的芯片/系統(tǒng)架構(gòu)，為各個行業(yè)提供高效處理和分析能力。

提高HPC安全性將成為關(guān)鍵

當(dāng)市場整體的數(shù)字化程度提升，則安全風(fēng)險也將隨之增加。越來越多的高性能計算正在遠離數(shù)據(jù)中心，將直接導(dǎo)致無法通過軟件補丁處理的攻擊數(shù)量增加。這給開發(fā)團隊帶來巨大壓力，迫使他們緊急推出硬件來解決這些問題，由此縮短硬件設(shè)計周期。因此提高開發(fā)者的生產(chǎn)效率以緊跟上市需求的步伐將成為下一步布局重點。

HPC處理器架構(gòu)多樣化

隨著數(shù)據(jù)量增加，不僅是安全性，基礎(chǔ)設(shè)施存儲以及數(shù)據(jù)處理的計算能力必須得到提升。此外，新的架構(gòu)包括芯片間的連接也是推動新需求所必需的。

受到不斷變化的AI工作負載、靈活的計算（CPU、GPU、FPGA、DPU等）、成本、內(nèi)存和IO吞吐量等因素共同驅(qū)動，HPC架構(gòu)正在經(jīng)歷巨變。微架構(gòu)層面變得互連更快、計算密度更高存儲可拓展、基礎(chǔ)設(shè)施效率更高、生態(tài)友好性、空間管理和安全性更高。從系統(tǒng)的角度來看，下一代HPC架構(gòu)將出現(xiàn)分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長，不同的專用處理架構(gòu)將集成在單個節(jié)點中，在模塊之間實現(xiàn)精密、靈活的切換。如此復(fù)雜的系統(tǒng)也帶來了巨大的驗證挑戰(zhàn)，尤其是系統(tǒng)的IP或節(jié)點、軟硬件動態(tài)協(xié)調(diào)、基于工作負載的性能、電源等相關(guān)驗證。要滿足這些驗證需求，需要開發(fā)新的軟硬件驗證方法。

移動數(shù)據(jù)對電力和時間有很大的需求，這是系統(tǒng)管理者現(xiàn)在面臨的挑戰(zhàn)之一，減少數(shù)據(jù)移動量將成為未來的一種趨勢。我們需要繼續(xù)擴展資源，利用高級封裝和芯片間接口來支持更高性能的設(shè)備，即通過使用多裸晶來擴展設(shè)備內(nèi)的處理能力，這在未來一年內(nèi)有望真正實現(xiàn)。

高性能計算

液冷解決方案

在深度學(xué)習(xí)、視覺計算、圖像渲染、數(shù)據(jù)科學(xué)、機器學(xué)習(xí)的迅猛發(fā)展的大背景下，高性能計算HPC、液冷散熱已經(jīng)不再是少數(shù)大公司或大型科研機構(gòu)的專屬要求，而是被越來越多的包括政府、教育科研、遙感測繪、醫(yī)藥研發(fā)、小分子研究、細胞治療、圖像識別的客戶所需要和接受。

藍海大腦為滿足客戶需求，結(jié)合行業(yè)特點從計算節(jié)點、網(wǎng)絡(luò)、存儲、功耗、擴展、散熱等方面出發(fā)，提出完善的解決方案。

產(chǎn)品特性

機架式液冷設(shè)計，即插即用，快速輕松投入使用；

支持最多9塊GPU圖形卡和2顆CPU處理器；

機架的存儲空間可大大擴展，可用于云存儲服務(wù)；

液冷系統(tǒng)密度更高、更節(jié)能、防噪音效果更好；

高效節(jié)能、綠色環(huán)保

客戶收益

超融合架構(gòu)承擔(dān)著計算資源池和分布式存儲資源池的作用，極大地簡化了數(shù)據(jù)中心的基礎(chǔ)架構(gòu)，通過軟件定義的計算資源虛擬化和分布式存儲架構(gòu)實現(xiàn)無單點故障、無單點瓶頸、彈性擴展、性能線性增長等能力。

通過簡單方便的統(tǒng)一管理界面，實現(xiàn)對數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)、虛擬化等資源的統(tǒng)一監(jiān)控、管理和運維。

超融合基礎(chǔ)架構(gòu)形成的計算資源池和存儲資源池直接可以被云計算平臺進行調(diào)配，服務(wù)于OpenStack、EDP、Docker、Hadoop、R、HPC等IaaS、PaaS、SaaS平臺，對上層的應(yīng)用系統(tǒng)或應(yīng)用集群等進行支撐。

分布式存儲架構(gòu)簡化容災(zāi)方式，實現(xiàn)同城數(shù)據(jù)雙活和異地容災(zāi)。現(xiàn)有的超融合基礎(chǔ)架構(gòu)可以延伸到公有云，可以輕松將私有云業(yè)務(wù)遷到公有云服務(wù)。

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴