91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何通過(guò)組件配置為深度學(xué)習(xí)培訓(xùn)選擇企業(yè)服務(wù)器

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Charu Chaubal ? 2022-04-19 15:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)已經(jīng)成為執(zhí)行許多人工智能任務(wù)的最常見(jiàn)的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。數(shù)據(jù)科學(xué)家使用 TensorFlow 和 PyTorch 等軟件框架來(lái)開(kāi)發(fā)和運(yùn)行 DL 算法

到目前為止,已經(jīng)有很多關(guān)于深度學(xué)習(xí)的文章,你可以從許多來(lái)源找到更詳細(xì)的信息。有關(guān)良好的高層總結(jié),請(qǐng)參見(jiàn) 人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間有什么區(qū)別?

開(kāi)始深度學(xué)習(xí)的一種流行方式是在云中運(yùn)行這些框架。然而,隨著企業(yè)開(kāi)始增長(zhǎng)和成熟其人工智能專業(yè)技能,他們會(huì)尋找在自己的數(shù)據(jù)中心運(yùn)行這些框架的方法,以避免基于云的人工智能的成本和其他挑戰(zhàn)。

在本文中,我將討論如何為 深度學(xué)習(xí)培訓(xùn)選擇企業(yè)服務(wù)器。我回顧了這個(gè)獨(dú)特工作負(fù)載的具體計(jì)算需求,然后討論了如何通過(guò)組件配置的最佳選擇來(lái)滿足這些需求。

DL 培訓(xùn)的系統(tǒng)要求

深度學(xué)習(xí)培訓(xùn)通常被設(shè)計(jì)為數(shù)據(jù)處理管道。必須首先根據(jù)數(shù)據(jù)格式、大小和其他因素準(zhǔn)備原始輸入數(shù)據(jù)。

數(shù)據(jù)通常也會(huì)經(jīng)過(guò)預(yù)處理,以便相同的輸入可以以不同的方式呈現(xiàn)給模型,這取決于數(shù)據(jù)科學(xué)家所確定的將提供更強(qiáng)大的訓(xùn)練集的內(nèi)容。例如,圖像可以隨機(jī)旋轉(zhuǎn),以便模型學(xué)習(xí)識(shí)別對(duì)象,而不考慮方向。然后將準(zhǔn)備好的數(shù)據(jù)輸入 DL 算法。

pYYBAGJeYeqAJmOBAABlS6A6Eyk644.png

圖 1 深度學(xué)習(xí)培訓(xùn)數(shù)據(jù)管道

了解了 DL 培訓(xùn)的工作原理后,以下是以最快、最有效的方式執(zhí)行此任務(wù)的具體計(jì)算需求。

GPU

深度學(xué)習(xí)的核心是 GPU 。計(jì)算網(wǎng)絡(luò)每一層的值的過(guò)程最終是一組龐大的矩陣乘法。每個(gè)層的數(shù)據(jù)通??梢圆⑿刑幚?,各層之間有協(xié)調(diào)步驟。

GPU 設(shè)計(jì)用于以大規(guī)模并行方式執(zhí)行矩陣乘法,并已被證明是實(shí)現(xiàn) 深度學(xué)習(xí)的巨大速度 的理想選擇。

對(duì)于訓(xùn)練,模型的大小是驅(qū)動(dòng)因素,因此具有更大更快內(nèi)存的 GPU ,比如 NVIDIA A100 GPU 核心張量 ,能夠更快地處理成批的訓(xùn)練數(shù)據(jù)。

中央處理器

DL 訓(xùn)練所需的數(shù)據(jù)準(zhǔn)備和預(yù)處理計(jì)算通常在 CPU 上執(zhí)行,盡管 recent innovations 已經(jīng)使越來(lái)越多的計(jì)算能夠在 GPU 上執(zhí)行。

使用高性能的 CPU 以足夠快的速度維持這些操作是至關(guān)重要的,這樣 GPU 就不會(huì)因?yàn)榈却龜?shù)據(jù)而感到饑餓。 CPU 應(yīng)該是企業(yè)級(jí)的,例如來(lái)自英特爾至強(qiáng)可擴(kuò)展處理器系列或 AMD EPYC 系列,而且 CPU 內(nèi)核與 GPU 的比例應(yīng)該足夠大,以保持流水線運(yùn)行。

系統(tǒng)存儲(chǔ)器

特別是對(duì)于當(dāng)今最大的機(jī)型, DL 訓(xùn)練只有在有大量輸入數(shù)據(jù)可供訓(xùn)練時(shí)才有效。這些數(shù)據(jù)從存儲(chǔ)器中批量檢索,然后由 CPU 在系統(tǒng)內(nèi)存中處理,然后再饋送到 GPU 。

為了保持該進(jìn)程以持續(xù)的速度運(yùn)行,系統(tǒng)內(nèi)存應(yīng)該足夠大,以便 CPU 處理的速率可以與 GPU 處理數(shù)據(jù)的速率相匹配。這可以用系統(tǒng)內(nèi)存與 GPU 內(nèi)存的比率來(lái)表示(在服務(wù)器中的所有 GPU 中)。

不同的模型和算法需要不同的比率,但最好有更高的比率,這樣 GPU 就永遠(yuǎn)不會(huì)等待數(shù)據(jù)。

網(wǎng)絡(luò)適配器

隨著 DL 模型變得越來(lái)越大,已經(jīng)開(kāi)發(fā)出了多種技術(shù)來(lái)執(zhí)行訓(xùn)練,多個(gè) GPU 一起工作。當(dāng)一臺(tái)服務(wù)器中安裝了多個(gè) GPU 時(shí),它們可以通過(guò) PCIe 總線相互通信,盡管可以使用 NVLink 和 NVSwitch 等更專業(yè)的技術(shù)來(lái)實(shí)現(xiàn)最高性能。

Multi- GPU 培訓(xùn)也可以擴(kuò)展到跨多臺(tái)服務(wù)器的工作。在這種情況下,網(wǎng)絡(luò)適配器成為服務(wù)器設(shè)計(jì)的關(guān)鍵組件。在執(zhí)行多節(jié)點(diǎn) DL 訓(xùn)練時(shí),需要高帶寬 Ethernet 或 InfiniBand 適配器來(lái)最大限度地減少由于數(shù)據(jù)傳輸而產(chǎn)生的瓶頸。

DL 框架利用 NCCL 等庫(kù)以最佳和性能的方式執(zhí)行 GPU 之間的協(xié)調(diào)。 GPUDirect RDMA 等技術(shù)使數(shù)據(jù)能夠從網(wǎng)絡(luò)直接傳輸?shù)?GPU ,而無(wú)需通過(guò) CPU ,從而消除了延遲源。

理想情況下,系統(tǒng)中每一兩個(gè) GPU 就應(yīng)該有一個(gè)網(wǎng)絡(luò)適配器,以便在必須傳輸數(shù)據(jù)時(shí)最大限度地減少爭(zhēng)用。

存儲(chǔ)

DL 培訓(xùn)數(shù)據(jù)通常駐留在外部存儲(chǔ)陣列上。服務(wù)器上的 NVMe 驅(qū)動(dòng)器通過(guò)提供緩存數(shù)據(jù)的方法,可以大大加快培訓(xùn)過(guò)程。

DL I / O 模式通常由讀取訓(xùn)練數(shù)據(jù)的多次迭代組成。訓(xùn)練的第一步(或 epoch )讀取用于開(kāi)始訓(xùn)練模型的數(shù)據(jù)。如果在節(jié)點(diǎn)上提供了足夠的本地緩存,則后續(xù)的數(shù)據(jù)傳遞可以避免從遠(yuǎn)程存儲(chǔ)中重新讀取數(shù)據(jù)。

為了避免從遠(yuǎn)程存儲(chǔ)中提取數(shù)據(jù)時(shí)發(fā)生爭(zhēng)用,每個(gè) CPU 應(yīng)該有一個(gè) NVMe 驅(qū)動(dòng)器。

PCIe 拓?fù)?/p>

由于 CPU 、 GPU 和網(wǎng)絡(luò)之間存在復(fù)雜的相互作用,因此應(yīng)該清楚的是,具有減少 DL 培訓(xùn)管道中任何潛在瓶頸的連接設(shè)計(jì)對(duì)于實(shí)現(xiàn)最佳性能至關(guān)重要。

如今,大多數(shù)企業(yè)服務(wù)器使用 PCIe 作為組件之間的通信手段。 PCIe 總線上的主要流量發(fā)生在以下路徑上:

從系統(tǒng)內(nèi)存到 GPU

在多次 GPU 培訓(xùn)期間,在相同服務(wù)器上的 GPU 之間

在多節(jié)點(diǎn)培訓(xùn)期間 GPU 與網(wǎng)絡(luò)適配器之間

poYBAGJeYfSAL-GgAAB__2rvYgs178.png

圖 2 主 PCIe 數(shù)據(jù)通信路徑

用于深度學(xué)習(xí)的服務(wù)器應(yīng)具有平衡的 PCIe 拓?fù)浣Y(jié)構(gòu), GPU 均勻分布在 CPU 插槽和 PCIe 根端口上。在所有情況下,每個(gè) GPU 的 PCIe 通道數(shù)應(yīng)為支持的最大數(shù)量。

如果存在多個(gè) GPU ,且 CPU 的 PCIe 通道數(shù)量不足以容納所有通道,則可能需要 PCIe 交換機(jī)。在這種情況下, PCIe 交換機(jī)層的數(shù)量應(yīng)限制為一層或兩層,以最小化 PCIe 延遲。

類似地,網(wǎng)絡(luò)適配器和 NVMe 驅(qū)動(dòng)器應(yīng)與 GPU 處于同一 PCIe 交換機(jī)或 PCIe 根復(fù)合體之下。在使用 PCIe 交換機(jī)的服務(wù)器配置中,這些設(shè)備應(yīng)與 GPU 位于同一 PCIe 交換機(jī)下,以獲得最佳性能。

選擇支持 DL 培訓(xùn)的經(jīng)過(guò)驗(yàn)證的系統(tǒng)

設(shè)計(jì)一個(gè)為 DL 培訓(xùn)而優(yōu)化的服務(wù)器很復(fù)雜。 NVIDIA 已經(jīng)發(fā)布了 關(guān)于為各種類型的加速工作負(fù)載配置服務(wù)器的指南 ,基于多年在這些工作負(fù)載方面的經(jīng)驗(yàn),并與開(kāi)發(fā)人員合作優(yōu)化代碼。

為了讓你更容易上手,NVIDIA 開(kāi)發(fā)了 NVIDIA-Certified Systems 程序。系統(tǒng)供應(yīng)商合作伙伴已使用特定的 NVIDIA GPU 和網(wǎng)絡(luò)適配器配置并測(cè)試了多種形式的服務(wù)器型號(hào),以驗(yàn)證 優(yōu)化設(shè)計(jì)以獲得最佳性能 的有效性。

驗(yàn)證還包括生產(chǎn)部署的其他重要功能,如可管理性、安全性和可伸縮性。系統(tǒng)經(jīng)過(guò)針對(duì)不同工作負(fù)載類型的一系列類別認(rèn)證。 合格系統(tǒng)目錄 有一份由 NVIDIA partners 提供的經(jīng) NVIDIA 認(rèn)證的系統(tǒng)列表。數(shù)據(jù)中心類別的服務(wù)器已經(jīng)過(guò)驗(yàn)證,可以為 DL 培訓(xùn)提供最佳性能。

NVIDIA 人工智能企業(yè)

除了合適的硬件,企業(yè)客戶還希望為 AI 工作負(fù)載選擇受支持的軟件解決方案。 NVIDIA 人工智能企業(yè) 是一套端到端、云計(jì)算原生的人工智能和數(shù)據(jù)分析軟件。它經(jīng)過(guò)優(yōu)化,因此每個(gè)組織都可以擅長(zhǎng)人工智能,經(jīng)過(guò)認(rèn)證可以部署在從企業(yè)數(shù)據(jù)中心到公共云的任何地方。人工智能企業(yè)包括全球企業(yè)支持,以便人工智能項(xiàng)目保持正常運(yùn)行。

當(dāng)您在優(yōu)化配置的服務(wù)器上運(yùn)行 NVIDIA AI Enterprise 時(shí),您可以放心,您正在從硬件和軟件投資中獲得最佳回報(bào)。

總結(jié)

在本文中,我向您展示了如何為 深度學(xué)習(xí)培訓(xùn) 選擇具有特定計(jì)算需求的企業(yè)服務(wù)器。希望您已經(jīng)學(xué)會(huì)了如何通過(guò)組件配置的最佳選擇來(lái)滿足這些需求。

關(guān)于作者

Charu Chaubal 在NVIDIA 企業(yè)計(jì)算平臺(tái)集團(tuán)從事產(chǎn)品營(yíng)銷工作。他在市場(chǎng)營(yíng)銷、客戶教育以及技術(shù)產(chǎn)品和服務(wù)的售前工作方面擁有 20 多年的經(jīng)驗(yàn)。 Charu 曾在云計(jì)算、超融合基礎(chǔ)設(shè)施和 IT 安全等多個(gè)領(lǐng)域工作。作為 VMware 的技術(shù)營(yíng)銷領(lǐng)導(dǎo)者,他幫助推出了許多產(chǎn)品,這些產(chǎn)品共同發(fā)展成為數(shù)十億美元的業(yè)務(wù)。此前,他曾在 Sun Microsystems 工作,在那里他設(shè)計(jì)了分布式資源管理和 HPC 基礎(chǔ)設(shè)施軟件解決方案。查魯擁有化學(xué)工程博士學(xué)位,并擁有多項(xiàng)專利。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109722
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    8021

    瀏覽量

    144379
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10251

    瀏覽量

    91480
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是企業(yè)服務(wù)器-云計(jì)算

    企業(yè)服務(wù)器是指為企業(yè)提供的基于云計(jì)算技術(shù)的服務(wù)器解決方案。華納云是一家云計(jì)算服務(wù)提供商,
    的頭像 發(fā)表于 12-29 17:57 ?788次閱讀

    恒訊科技解析:服務(wù)器監(jiān)控與告警設(shè)置—企業(yè)必備指南

    一、為什么企業(yè)必須配置服務(wù)器監(jiān)控和告警 要是沒(méi)有監(jiān)控系統(tǒng),企業(yè),就只能在故障出現(xiàn)之后,才發(fā)覺(jué)問(wèn)題,進(jìn)而造成業(yè)務(wù)方面的損失。恒訊科技長(zhǎng)期服務(wù)
    的頭像 發(fā)表于 11-25 17:42 ?655次閱讀

    服務(wù)器配置怎么選擇?2025年全方位選購(gòu)指南

    服務(wù)器配置怎么選擇需綜合考量業(yè)務(wù)規(guī)模、流量預(yù)期與應(yīng)用類型。核心關(guān)注四大要素:CPU處理(常規(guī)應(yīng)用4-8核,高并發(fā)需16核以上)、內(nèi)存容量(基礎(chǔ)應(yīng)用16-32GB,數(shù)據(jù)庫(kù)建議32-64
    的頭像 發(fā)表于 09-22 10:51 ?866次閱讀

    輕量云服務(wù)器和云服務(wù)器區(qū)別:2025年終極選擇指南

    資源、穩(wěn)定計(jì)算性能及完整管理權(quán)限,支持垂直與水平擴(kuò)展,適合企業(yè)級(jí)應(yīng)用和高并發(fā)場(chǎng)景。選擇取決于業(yè)務(wù)需求:輕量服務(wù)器適用于成本敏感型場(chǎng)景,標(biāo)準(zhǔn)云服務(wù)器則為高性能、高穩(wěn)定性要求的業(yè)務(wù)提供保障
    的頭像 發(fā)表于 09-01 13:58 ?1253次閱讀
    輕量云<b class='flag-5'>服務(wù)器</b>和云<b class='flag-5'>服務(wù)器</b>區(qū)別:2025年終極<b class='flag-5'>選擇</b>指南

    華納云服務(wù)器Linux系統(tǒng)電源管理與節(jié)能優(yōu)化配置方法

    在云計(jì)算時(shí)代,Linux系統(tǒng)的電源管理優(yōu)化成為提升云服務(wù)器能效的關(guān)鍵環(huán)節(jié)。本文將深入解析Linux內(nèi)核的電源管理機(jī)制,從CPU調(diào)頻策略到磁盤(pán)休眠設(shè)置,提供一套完整的節(jié)能配置方案。通過(guò)調(diào)整系統(tǒng)參數(shù)
    的頭像 發(fā)表于 08-21 15:09 ?916次閱讀

    2025年服務(wù)器配置推薦:從入門(mén)到企業(yè)級(jí)方案匯總

    本文2025年服務(wù)器配置指南,按初創(chuàng)、成長(zhǎng)、成熟階段推薦差異化方案,涵蓋硬件參數(shù)與架構(gòu)設(shè)計(jì)。針對(duì)游戲、電商、大數(shù)據(jù)等行業(yè)特性,提出低延遲、彈性擴(kuò)容、海量存儲(chǔ)等專項(xiàng)優(yōu)化策略。強(qiáng)調(diào)平衡性能與成本,避免
    的頭像 發(fā)表于 08-13 11:30 ?1w次閱讀
    2025年<b class='flag-5'>服務(wù)器</b><b class='flag-5'>配置</b>推薦:從入門(mén)到<b class='flag-5'>企業(yè)</b>級(jí)方案匯總

    恒訊科技分析:云儲(chǔ)存服務(wù)器搭建教程

    共享,還是作為備份用途。這將決定后續(xù)的硬件選擇和軟件配置。 二、選擇硬件設(shè)備 硬件是搭建云存儲(chǔ)服務(wù)器的基礎(chǔ)。根據(jù)需求,可以選擇普通的家用電腦
    的頭像 發(fā)表于 07-07 11:07 ?1304次閱讀

    Jtti.cc深度剖析:服務(wù)器線路選擇的關(guān)鍵考量因素

    在數(shù)字化浪潮席卷全球的當(dāng)下,服務(wù)器作為企業(yè)和互聯(lián)網(wǎng)業(yè)務(wù)運(yùn)行的核心基礎(chǔ)設(shè)施,其線路選擇的優(yōu)劣,直接決定了數(shù)據(jù)傳輸?shù)乃俣?、穩(wěn)定性以及業(yè)務(wù)的連續(xù)性。從電商平臺(tái)的實(shí)時(shí)交易處理,到視頻網(wǎng)站的高清內(nèi)容分發(fā),再到
    的頭像 發(fā)表于 06-24 17:12 ?388次閱讀

    如何配置Linux防火墻和Web服務(wù)器

    在當(dāng)今數(shù)字化時(shí)代,網(wǎng)絡(luò)安全顯得尤為重要。Linux作為一種開(kāi)源操作系統(tǒng),廣泛應(yīng)用于服務(wù)器管理和網(wǎng)絡(luò)配置中。本篇文章將詳細(xì)介紹如何配置Linux防火墻和Web服務(wù)器,確保內(nèi)網(wǎng)與外網(wǎng)的安全
    的頭像 發(fā)表于 05-24 15:26 ?1881次閱讀
    如何<b class='flag-5'>配置</b>Linux防火墻和Web<b class='flag-5'>服務(wù)器</b>

    服務(wù)器和獨(dú)立服務(wù)器的區(qū)別在哪?一文讀懂如何選擇

    面對(duì)云服務(wù)器與獨(dú)立服務(wù)器選擇,許多人常因概念模糊而糾結(jié)。云服務(wù)器和獨(dú)立服務(wù)器的區(qū)別在于資源分配方式、擴(kuò)展性及成本結(jié)構(gòu),
    的頭像 發(fā)表于 05-19 10:19 ?668次閱讀

    如何在Linux中配置DNS服務(wù)器

    本文詳細(xì)介紹了如何在Linux中配置DNS服務(wù)器,包括DNS工作原理、本地緩存、DNS查詢過(guò)程,以及正向和反向查詢的配置。步驟包括服務(wù)器配置
    的頭像 發(fā)表于 05-09 13:38 ?2602次閱讀
    如何在Linux中<b class='flag-5'>配置</b>DNS<b class='flag-5'>服務(wù)器</b>

    從入門(mén)到精通,一文搞懂vps云服務(wù)器配置怎么選擇

    選擇VPS云服務(wù)器之前,首先要明確自己的需求。這包括網(wǎng)站或應(yīng)用的類型、預(yù)計(jì)的流量、所需的存儲(chǔ)空間以及預(yù)算等因素。只有充分了解自己的需求,才能選擇到最適合自己的VPS云服務(wù)器
    的頭像 發(fā)表于 04-08 11:05 ?839次閱讀

    DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算 以raksmart裸機(jī)云服務(wù)器

    以RakSmart裸機(jī)云服務(wù)器例,針對(duì)DeepSeek企業(yè)級(jí)部署的服務(wù)器資源計(jì)算指南,涵蓋GPU/CPU/內(nèi)存/存儲(chǔ)/網(wǎng)絡(luò)等核心維度的詳細(xì)計(jì)算方法與
    的頭像 發(fā)表于 03-21 10:17 ?1077次閱讀

    DeepSeek企業(yè)級(jí)部署實(shí)戰(zhàn)指南:以Raksmart企業(yè)服務(wù)器

    隨著人工智能技術(shù)的快速發(fā)展,DeepSeek作為一款強(qiáng)大的AI工具,正在成為企業(yè)智能化轉(zhuǎn)型的重要驅(qū)動(dòng)力。本文將結(jié)合Raksmart企業(yè)服務(wù)器的實(shí)際案例,詳細(xì)解析DeepSeek的企業(yè)級(jí)
    的頭像 發(fā)表于 03-12 11:33 ?1113次閱讀