国产精品成人动漫网站,亚洲AⅤ无码播放网,黄色视频无码网址

十年前，AWS（Amazon Web Services）發(fā)布了首個采用 NVIDIA M2050 GPU 的實例。當時，基于 CUDA 的應用主要專注于加速科學模擬，AI 和深度學習還遙遙無期。

自那時起，AW 就不斷擴充云端 GPU 實例陣容，包括 K80（p2）、K520（g3）、M60（g4）、V100（p3 / p3dn）和 T4（g4）。

現(xiàn)在，已全面上市的全新 AWS P4d 實例采用最新 NVIDIA A100 Tensor Core GPU，開啟了加速計算的下一個十年。

全新的 P4d 實例，為機器學習訓練和高性能計算應用提供 AWS 上性能與成本效益最高的 GPU 平臺。與默認的 FP32 精度相比，全新實例將 FP16 機器學習模型的訓練時間減少多達 3 倍，將 TF32 機器學習模型的訓練的時間減少多達 6 倍。

這些實例還提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基準測試中一騎絕塵，實現(xiàn)了比 CPU 快 237 倍的性能。

每個 P4d 實例均內(nèi)置八個 NVIDIA A100 GPU，通過 AWS UltraClusters，客戶可以利用 AWS 的 Elastic Fabric Adapter（EFA）和 Amazon FSx 提供的可擴展高性能存儲，按需、可擴展地同時訪問多達 4,000 多個 GPU。P4d 提供 400Gbps 網(wǎng)絡，通過使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技術(shù)，進一步加速深度學習訓練的工作負載。EFA 上的 NVIDIA GPUDirect RDMA 在服務器之間可通過 GPU 傳輸數(shù)據(jù)，無需通過 CPU 和系統(tǒng)內(nèi)存，從而確保網(wǎng)絡的低延遲。

此外，許多 AWS 服務都支持 P4d 實例，包括 Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster 和 Amazon SageMaker。P4d 還可使用所有 NGC 提供的經(jīng)過優(yōu)化的容器化軟件，包括 HPC 應用、AI 框架、預訓練模型、Helm 圖表以及 TensorRT 和 Triton Inference Server 等推理軟件。

目前，P4d 實例已在美國東部和西部上市，并將很快擴展到其他地區(qū)。用戶可以通過按需實例（On-Demand）、Savings Plans、預留實例（Reserved Instances）或競價型實例（Spot Instances）幾種不同的方式進行購買。

GPU 云計算發(fā)展最初的十年，已為市場帶來超過 100 exaflops 的 AI 計算。隨著基于 NVIDIA A100 GPU 的 Amazon EC2 P4d 實例的問世，GPU 云計算的下一個十年將迎來一個美好的開端。

NVIDIA 和 AWS 不斷幫助各種應用突破 AI 的界限，以便了解客戶將如何運用 AI 強大的性能。

編輯：hfy

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴