亚洲久无码永久在线观看,免费A片在线网站完整

今天想跟大家一起學(xué)習(xí)下GPU之間是怎么通信互聯(lián)的。

自從GPU出現(xiàn)后，計(jì)算機(jī)愛(ài)好者和發(fā)燒友們就一直尋找新的方法來(lái)進(jìn)一步提高系統(tǒng)GPU性能。

在單個(gè)GPU性能有限的情況下，將兩個(gè)或多個(gè)GPU連接起來(lái)這種在當(dāng)時(shí)看起來(lái)非常荒謬的想法竟然漸漸成為提升系統(tǒng)GPU性能的主流方法。

特別是隨著游戲、圖形應(yīng)用的發(fā)展，以及AI、HPC等新興應(yīng)用的助推，多個(gè)GPU之間的互聯(lián)技術(shù)得到了快速迭代和發(fā)展，如今的GPU互聯(lián)已經(jīng)成為系統(tǒng)內(nèi)非常常見(jiàn)的一種技術(shù)。今天我們就來(lái)聊聊這些GPU互聯(lián)的那些技術(shù)。

第一個(gè)連接多個(gè)GPU解決方案：SLI

SLI，全稱(chēng)為 " 可擴(kuò)展的鏈接接口 "（ Scalable Link Interface），最早是由 3DFx Interactive 開(kāi)發(fā)。

然而，3DFx Interactive這家公司在2000年破產(chǎn)，NVIDIA公司收購(gòu)了這家公司并獲得了多GPU技術(shù)的權(quán)利。

于是，在2004年，NVIDIA首次推出了SLI技術(shù)版本，同時(shí)發(fā)布了GeForce 6800 Ultra GPU。該技術(shù)允許兩個(gè)GeForce 6800 Ultra GPU一起工作，以增強(qiáng)游戲時(shí)的圖形性能**。**因此，SLI技術(shù)迅速在游戲玩家和愛(ài)好者中流行起來(lái)。

SLI采用主從配置方式在系統(tǒng)中實(shí)現(xiàn)使用多個(gè)GPU，這種配置的重點(diǎn)是使用一個(gè)GPU作為主車(chē)，其他GPU作為從卡，SLI能夠同時(shí)連接4個(gè)GPU。

**SLI是第一個(gè)連接多個(gè)GPU的解決方案。**但是與所有技術(shù)一樣，SLI也有各種優(yōu)點(diǎn)和局限性。SLI配置必須選擇相同型號(hào)的兼容GPU。同時(shí)還需要分配一個(gè)單獨(dú)的PSU來(lái)滿(mǎn)足多個(gè)GPU的協(xié)調(diào)要求，導(dǎo)致GPU之間的通信延遲較高，且GPU之間的數(shù)據(jù)共享缺乏靈活性。

另外，NVIDIA大約在兩年前停止了對(duì)該技術(shù)的支持，為開(kāi)發(fā)NVLink等新技術(shù)讓路。

SLI與CrossFire：多GPU解決方案之爭(zhēng)

雖然NVIDIA的SLI走在了多GPU互聯(lián)的前面，但也并非沒(méi)有競(jìng)爭(zhēng)。

作為NVIDIA GPU市場(chǎng)上多年的老對(duì)手，AMD也推出了CrossFire這個(gè)技術(shù)來(lái)參與競(jìng)爭(zhēng)。

與SLI技術(shù)類(lèi)似，使用CrossFire技術(shù)時(shí)，用戶(hù)可選擇使用兩個(gè)或更多顯卡進(jìn)行渲染，從而增加幀數(shù)和提高游戲運(yùn)行效率。

CrossFire技術(shù)的一大優(yōu)點(diǎn)是用戶(hù)可以使用不同型號(hào)的AMD顯卡，從而節(jié)省成本。

然而，CrossFire也有其自身的優(yōu)勢(shì)和挑戰(zhàn)，CrossFire經(jīng)常因其軟件堆棧而受到批評(píng)，一些用戶(hù)發(fā)現(xiàn)該軟件堆棧不如NVIDIA SLI可靠且配置更復(fù)雜。

盡管存在這些差異，但這兩種技術(shù)都致力于實(shí)現(xiàn)相同的目標(biāo)：增強(qiáng)游戲和消費(fèi)者圖形體驗(yàn)。它們?cè)谔幚砀呒?jí)、數(shù)據(jù)密集型任務(wù)方面的局限性最終將為 NVLink等下一代解決方案鋪平道路。

隨著2010年代的到來(lái)，計(jì)算領(lǐng)域開(kāi)始發(fā)生巨大變化。人工智能 (AI)、高性能計(jì)算(HPC)和大數(shù)據(jù)分析的興起需要更強(qiáng)大的多GPU解決方案。很明顯，最初設(shè)計(jì)時(shí)考慮到游戲和消費(fèi)者工作負(fù)載的SLI不足以滿(mǎn)足這些計(jì)算密集型任務(wù)。NVIDIA需要一個(gè)新的GPU互聯(lián)技術(shù)。

雙GPU卡：多GPU計(jì)算的獨(dú)特存在

雖然SLI和CrossFire等技術(shù)專(zhuān)注于連接多個(gè)獨(dú)立GPU，但還有另一種不太常見(jiàn)或者可以說(shuō)是奇葩的多 GPU配置方法：雙GPU卡。

這些專(zhuān)用顯卡在單個(gè)PCB（印刷電路板）上安裝了兩個(gè)GPU核心，有效地充當(dāng)單張卡上的SLI或CrossFire 設(shè)置。NVIDIA GeForce GTX 690和AMD Radeon HD 6990等卡是這種方法的流行示例。

雙GPU卡具有多種優(yōu)勢(shì)，他們通過(guò)將兩個(gè)GPU壓縮到一個(gè)卡槽中來(lái)節(jié)省空間，這使得它們對(duì)小型PC很有吸引力。同時(shí)他們還無(wú)需將單獨(dú)的卡與外部連接器連接起來(lái)，從而簡(jiǎn)化了設(shè)置。

然而，這些雙GPU卡散熱是一個(gè)重大問(wèn)題，可以說(shuō)每一個(gè)卡都是一個(gè)**"小火爐"****。**通常這種配置方式需要先進(jìn)的冷卻解決方案。同時(shí)功耗也很高，需要強(qiáng)大的電源來(lái)提供穩(wěn)定的電流。

雙GPU卡的方式看起來(lái)是一種"兩全其美"的解決方案，將多GPU設(shè)置的原始功能與單卡的簡(jiǎn)單性結(jié)合在一起。然而，由于其高成本和相關(guān)的技術(shù)挑戰(zhàn)，雙GPU卡經(jīng)常被視為雞肋產(chǎn)品。

隨著NVLink等多GPU技術(shù)不斷發(fā)展以提供更高的帶寬和更低的延遲，對(duì)雙 GPU卡的需求已經(jīng)減少。盡管如此，它仍然是GPU發(fā)展史上一個(gè)獨(dú)特的存在。

****** NVLink 的誕生******

NVLink是2017年隨NVIDIA Volta架構(gòu)推出的技術(shù)。這項(xiàng)技術(shù)不僅僅是SLI技術(shù)的升級(jí)，而且是對(duì)GPU如何互連的根本性重新思考。

NVLink提供了更高的帶寬（最新版本高達(dá)900 GB/s）、更低的延遲以及允許GPU之間更復(fù)雜和大量互連的網(wǎng)狀拓?fù)?。此外，NVLink引入了統(tǒng)一內(nèi)存的概念，支持連接的 GPU 之間的內(nèi)存池，這對(duì)于需要大型數(shù)據(jù)集的任務(wù)來(lái)說(shuō)是一個(gè)至關(guān)重要的功能。

SLI與NVLink有何區(qū)別？

乍一看，人們可能會(huì)認(rèn)為NVLink是SLI的簡(jiǎn)單升級(jí)，但這過(guò)于武斷了。雖然這兩種技術(shù)都旨在連接多個(gè)GPU，但NVLink的設(shè)計(jì)考慮了不同的受眾。它專(zhuān)為科學(xué)研究、數(shù)據(jù)分析，尤其是人工智能和機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計(jì)。更高的帶寬、更低的延遲和統(tǒng)一的內(nèi)存使NVLink成為應(yīng)對(duì)當(dāng)今計(jì)算挑戰(zhàn)的更加靈活和強(qiáng)大的解決方案。

雖然NVLink和SLI兩者均由Nvidia開(kāi)發(fā)，但存在一些差異。S****LI按照主從關(guān)系原理運(yùn)行，而NVLink通過(guò)網(wǎng)狀網(wǎng)絡(luò)運(yùn)行。結(jié)果，SLI中形成了NVLink中不存在的數(shù)據(jù)瓶頸。

采用網(wǎng)狀網(wǎng)絡(luò)開(kāi)發(fā)的并行連接可增強(qiáng)GPU的性能。因此，多個(gè)GPU作為一個(gè)單元，有助于提供增強(qiáng)的處理能力。連接的GPU擁有自己的內(nèi)存，從而增加了系統(tǒng)的總可用內(nèi)存。NVLink橋還支持20至30 GB/s 的帶寬，為4個(gè)GPU 的設(shè)置提供超過(guò)100GB/s 的速度。

網(wǎng)狀網(wǎng)絡(luò)消除 GPU之間的層級(jí)關(guān)系。計(jì)算數(shù)據(jù)因此連接到每個(gè)GPU的節(jié)點(diǎn)，從而提高了整體渲染速度。因此，150至200GB/s的帶寬也可以實(shí)現(xiàn)。與SLI 相比，NVLink的延遲非常低。

****** NVLink的技術(shù)原理******

NVLink代表了多GPU互聯(lián)技術(shù)的邏輯演變，不僅在速度方面，而且在架構(gòu)設(shè)計(jì)方面。NVLink的結(jié)構(gòu)由可以雙向傳輸數(shù)據(jù)的高速數(shù)據(jù)通道組成。與傳統(tǒng)的基于總線(xiàn)的系統(tǒng)不同，NVLink采用點(diǎn)對(duì)點(diǎn)連接，有效減少瓶頸并提高數(shù)據(jù)吞吐量。最新的迭代提供高達(dá)900GB/s的帶寬，比SLI的功能有了顯著增強(qiáng)。

NVLink與眾不同的關(guān)鍵功能之一是它支持網(wǎng)狀拓?fù)涞哪芰Α?/strong>與舊技術(shù)的菊花鏈或中心輻射型拓?fù)湎啾?，網(wǎng)格設(shè)置允許GPU之間實(shí)現(xiàn)更通用且數(shù)量更多的連接。這在數(shù)據(jù)中心和高性能計(jì)算應(yīng)用程序中特別有用，在這些應(yīng)用程序中，復(fù)雜的數(shù)據(jù)路由是常態(tài)。

統(tǒng)一內(nèi)存是NVLink的另一個(gè)特點(diǎn)。這允許GPU共享公共內(nèi)存池，從而實(shí)現(xiàn)更高效的數(shù)據(jù)共享并減少在GPU之間復(fù)制數(shù)據(jù)的需要。這對(duì)于機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析等應(yīng)用程序來(lái)說(shuō)是一個(gè)巨大的推動(dòng)，在這些應(yīng)用程序中，大型數(shù)據(jù)集通常超過(guò)單個(gè)GPU的內(nèi)存容量。

NVLink還改善了延遲，這是任何高性能計(jì)算設(shè)置中的一個(gè)關(guān)鍵因素。較低的延遲可確保GPU之間更快的數(shù)據(jù)傳輸和同步，從而實(shí)現(xiàn)更高效的并行計(jì)算。這是通過(guò)NVLink的直接內(nèi)存訪(fǎng)問(wèn) (DMA) 功能實(shí)現(xiàn)的，允許GPU直接讀寫(xiě)彼此的內(nèi)存，而不需要CPU的參與。

NVlink的影響

鑒于人工智能在現(xiàn)代計(jì)算中的重要性日益增加，NVLink的優(yōu)勢(shì)不僅是漸進(jìn)式的，而且是變革性的。在AI模型訓(xùn)練和數(shù)據(jù)創(chuàng)建中，NVLink可實(shí)現(xiàn)GPU之間更快的數(shù)據(jù)傳輸，從而實(shí)現(xiàn)更高效的并行處理。這在處理大型訓(xùn)練數(shù)據(jù)集時(shí)尤其有用，這是一個(gè)與人工智能模型訓(xùn)練數(shù)據(jù)創(chuàng)建的新興領(lǐng)域密切相關(guān)的主題。

隨著量子模擬、實(shí)時(shí)分析和下一代人工智能算法等先進(jìn)計(jì)算的需求不斷增長(zhǎng)，我們可以期待NVLink的功能進(jìn)一步增強(qiáng)。無(wú)論是帶寬的增加還是促進(jìn)GPU之間更好合作的新功能，NVLink或其后繼者無(wú)疑仍將是滿(mǎn)足未來(lái)計(jì)算需求的核心。

從SLI到NVLink的過(guò)渡是多GPU技術(shù)的一個(gè)重要里程碑，它反映了NVIDIA 對(duì)創(chuàng)新的承諾以及對(duì)不斷變化的計(jì)算環(huán)境的敏銳理解。從游戲到人工智能，從消費(fèi)應(yīng)用程序到數(shù)據(jù)中心，NVLink和SLI的發(fā)展歷程說(shuō)明了需求對(duì)孕育創(chuàng)新、推動(dòng)技術(shù)發(fā)展的重要價(jià)值。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5594

瀏覽量
109759

gpu

gpu

+關(guān)注

關(guān)注
28

文章
5194

瀏覽量
135483

HPC

HPC

+關(guān)注

關(guān)注
0

文章
346

瀏覽量
24980

PSU

PSU

+關(guān)注

關(guān)注
0

文章
53

瀏覽量
12495

原文標(biāo)題：一文讀懂：多卡GPU是如何互聯(lián)通信的？

文章出處：【微信號(hào)：SDNLAB，微信公眾號(hào)：SDNLAB】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

評(píng)論

發(fā)布評(píng)論請(qǐng)先登錄

相關(guān)推薦

熱點(diǎn)推薦

DSP、FPGA之間SRIO通信的問(wèn)題？

目前在使用DSP和FPGA之間通過(guò)SRIO的SWRITE事務(wù)完成雙向數(shù)據(jù)通信，大多數(shù)情況下都正常，但是在我不停的給DSP進(jìn)行燒寫(xiě)程序時(shí)，會(huì)偶爾出錯(cuò)，F(xiàn)PGA無(wú)法收到DSP下發(fā)的數(shù)據(jù)。偶爾故障情況下buf_lcl_phy_buf_stat_out始終是5\'b10000，且

發(fā)表于 11-15 16:22

NICE接口和協(xié)處理器之間怎樣實(shí)現(xiàn)通信？

NICE接口和協(xié)處理器之間怎樣實(shí)現(xiàn)通信

發(fā)表于 11-05 12:42

如何看懂GPU架構(gòu)？一分鐘帶你了解GPU參數(shù)指標(biāo)

GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等，并非“冰冷的數(shù)字”，而是直接關(guān)系設(shè)備能否滿(mǎn)足需求、如何發(fā)揮最大價(jià)值、是否避免資源浪費(fèi)等問(wèn)題的核心要素。本篇文章將全面

發(fā)表于 10-09 09:28 ?1142次閱讀

工控核心板GPU實(shí)測(cè)！工業(yè)級(jí)圖形加速到底有多強(qiáng)？#核心板 #GPU #嵌入式

gpu

ZLG致遠(yuǎn)電子
發(fā)布于 :2025年09月30日 16:07:05

aicube的n卡gpu索引該如何添加？

請(qǐng)問(wèn)有人知道aicube怎樣才能讀取n卡的gpu索引呢，我已經(jīng)安裝了cuda和cudnn，在全局的py里添加了torch，能夠調(diào)用gpu，當(dāng)還是只能看到默認(rèn)的gpu0，顯示不了

發(fā)表于 07-25 08:18

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

帶來(lái)了總雙向帶寬160GB/s的通訊速率，遠(yuǎn)高于當(dāng)時(shí)的PCIe接口（實(shí)際比現(xiàn)在的PCIe5.0也還要快）。首代的NVlink主要是增強(qiáng)了GPU到GPU的通信性能和GPU對(duì)系統(tǒng)內(nèi)存的訪(fǎng)問(wèn)

發(fā)表于 06-18 19:31

華為助力算力互聯(lián)網(wǎng)跨域算間無(wú)損互聯(lián)

近日，NIDA發(fā)布的《工信部首提數(shù)據(jù)通信產(chǎn)業(yè)，賦能算力互聯(lián)網(wǎng)新征程》一文引發(fā)廣泛關(guān)注。文章解讀工信部最新發(fā)布的《算力互聯(lián)互通行動(dòng)計(jì)劃》，清晰地揭示了數(shù)據(jù)通信產(chǎn)業(yè)與算力

發(fā)表于 06-14 11:17 ?1248次閱讀

GPU架構(gòu)深度解析

GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元（GPU），作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分，已經(jīng)從最初的圖形渲染專(zhuān)用處理器，發(fā)展成為強(qiáng)大的并行計(jì)算引擎，廣泛應(yīng)用于人工智能、科學(xué)計(jì)算

發(fā)表于 05-30 10:36 ?1858次閱讀

上位機(jī)和下位機(jī)之間的通信是通過(guò)什么實(shí)現(xiàn)的

上位機(jī)和下位機(jī)之間的通信可通過(guò)多種方式實(shí)現(xiàn)，以下從有線(xiàn)通信和無(wú)線(xiàn)通信兩大類(lèi)別展開(kāi)介紹：有線(xiàn)通信串口通

發(fā)表于 05-29 09:24 ?1089次閱讀

如何破解GPU集群集合通信路徑的“黑盒”難題？

集合通信庫(kù)（如NCCL、HCCL）的運(yùn)行細(xì)節(jié)用戶(hù)完全無(wú)感知，形成“黑盒”狀態(tài)。EPS通過(guò)實(shí)時(shí)解析集合通信庫(kù)的底層運(yùn)行狀態(tài)，將隱蔽的通信路徑、GPU與網(wǎng)卡狀態(tài)等信息可視化，并提供智能路由

發(fā)表于 05-22 10:13 ?935次閱讀

認(rèn)識(shí) Thread 協(xié)議的互聯(lián)能力

Thread 是專(zhuān)門(mén)為 loT 設(shè)備提供無(wú)線(xiàn)網(wǎng)狀網(wǎng)絡(luò)通信的協(xié)議，由三星、ARM、Nest 三家企業(yè)共同推出。為了加速 Thread 協(xié)議普及，多家公司于2014年7月組成 \"Thread

發(fā)表于 04-26 23:17

奇異摩爾以互聯(lián)之長(zhǎng)推進(jìn)OISA GPU卡間互聯(lián)生態(tài)適配

進(jìn)行了精彩的主題分享。作為AI網(wǎng)絡(luò)特別組及網(wǎng)絡(luò)工作組的成員，奇異摩爾積極參與大會(huì)，與業(yè)界同仁共同探討AI網(wǎng)絡(luò)互聯(lián)應(yīng)用的發(fā)展趨勢(shì)。當(dāng)前，國(guó)內(nèi)外GPU卡間互聯(lián)技術(shù)正呈現(xiàn)出多樣化的繁榮景象，不同標(biāo)準(zhǔn)、協(xié)議及產(chǎn)業(yè)鏈生態(tài)迅速發(fā)展，

發(fā)表于 04-01 19:35 ?1762次閱讀

可以手動(dòng)構(gòu)建imx-gpu-viv嗎？

使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要

發(fā)表于 03-28 06:35

高性能GPU服務(wù)器推薦

面對(duì)市場(chǎng)上種類(lèi)繁多的GPU服務(wù)器，如何選擇一款適合自身需求的設(shè)備呢？接下來(lái)，AI部落小編為您推薦。

發(fā)表于 03-20 10:14 ?1079次閱讀

智能座艙SoC，急需更強(qiáng)大的GPU IP

? 電子發(fā)燒友網(wǎng)報(bào)道（文/梁浩斌）汽車(chē)智能化的浪潮勢(shì)不可擋，傳統(tǒng)ECU架構(gòu)因硬件冗余、通信效率低等缺陷逐漸被淘汰，電子電氣架構(gòu)從分布式向集中式演進(jìn)，取而代之的是高性能CPU、GPU所支持的中央計(jì)算

發(fā)表于 03-09 08:36 ?2787次閱讀

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

GPU之間是怎么通信互聯(lián)的呢？

評(píng)論

搜索歷史

GPU之間是怎么通信互聯(lián)的呢？

評(píng)論

GPU之間是怎么通信互聯(lián)的呢？