91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch 1.8發(fā)布,支持AMD ROCm

深度學(xué)習(xí)自然語言處理 ? 來源:量子位 ? 作者:夢晨 ? 2021-03-08 10:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.8版本中,官方終于加入了對AMD ROCm的支持,可以方便的在原生環(huán)境下運行,不用去配置Docker了。

△AMD ROCm只支持Linux操作系統(tǒng)

1.8版本集合了自2020年10月1.7發(fā)布以來的超過3000次GitHub提交。 此外,本次更新還有諸多亮點:

優(yōu)化代碼,更新編譯器

Python內(nèi)函數(shù)轉(zhuǎn)換

增強分布式訓(xùn)練

新的移動端教程與演示

新的性能檢測工具

相關(guān)的庫TorchCSPRNG, TorchVision, TorchText和TorchAudio也會隨之更新。 要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。

Python to Python函數(shù)轉(zhuǎn)換

新增的Beta特性torch.fx可以實現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。

新的API,向NumPy學(xué)習(xí)!

1.7版本中增加的Beta特性torch.fft已成為正式特性。實現(xiàn)了與Numpy中的np.fft類似的快速傅立葉變換,還增加了硬件加速支持與自動求導(dǎo),以更好的支持科學(xué)計算。 還增加了Beta版NumPy風(fēng)格的線性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增強分布式訓(xùn)練

增加了穩(wěn)定的異步錯誤與超時處理,增加NCCL的可靠性。 增加了Beta版的流水線并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計算效率。

△Pipeline Parallelism使用4個GPU時的工作示意圖

增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。 另外還有一些Prototype版的分布式訓(xùn)練新特性。ZeroRedundancyOptimizer:用于減少所有參與進程的內(nèi)存占用。Process Group NCCL Send/Recv:讓用戶可在Python而不是C++上進行集合運算。CUDA-support in RPC using TensorPipe:增加對N卡多卡運算的效率。Remote Module:讓用戶像操作本地模塊一樣操作遠程模塊。

移動端新教程

隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細教程。 以及圖像分割、目標(biāo)檢測、神經(jīng)機器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。

另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運行時文件的大小。

原文標(biāo)題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5682

    瀏覽量

    139941
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4876

    瀏覽量

    90025
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    813

    瀏覽量

    14850

原文標(biāo)題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Pytorch 與 Visionfive2 兼容嗎?

    Pytorch 與 Visionfive2 兼容嗎? $ pip3 install torch torchvision torchaudio --index-url https
    發(fā)表于 02-06 08:28

    Robotec.ai與AMD Silo AI的合作實踐

    AMD Silo AI 正與領(lǐng)先的機器人應(yīng)用仿真平臺開發(fā)商 Robotec.ai 合作,優(yōu)化和擴展基于 AMD GPU 和 ROCm 軟件堆棧的下一代汽車和機器人系統(tǒng)的數(shù)字孿生和場景重建工作負載
    的頭像 發(fā)表于 01-28 16:23 ?434次閱讀

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.10.1發(fā)布

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.10.1發(fā)布
    的頭像 發(fā)表于 12-26 08:33 ?860次閱讀
    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.10.1<b class='flag-5'>發(fā)布</b>

    AMD Power Design Manager 2025.2版本現(xiàn)已發(fā)布

    AMD Power Design Manager 2025.2 版本現(xiàn)已發(fā)布,并正式支持第二代 AMD Versal AI Edge 系列器件和第二代 Prime 系列器件。
    的頭像 發(fā)表于 12-24 11:08 ?632次閱讀

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對 AMD Versal 自適應(yīng) SoC 的設(shè)計支持,包含新器件支持
    的頭像 發(fā)表于 12-09 15:11 ?942次閱讀

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我們在上一篇文章中介紹了ROCm+PP-OCRv5,為實現(xiàn)在AMD計算平臺上完成復(fù)雜文檔的端到端智能解析,本文基于ROCm軟件棧,提供一套完整的PP-StructureV3
    的頭像 發(fā)表于 11-13 16:56 ?5532次閱讀
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis AI 包含優(yōu)化的 NPU IP、模型編
    的頭像 發(fā)表于 10-31 12:46 ?791次閱讀

    全新升級 | 匠芯創(chuàng)AiUIBuilder V2.0.0發(fā)布

    近日,匠芯創(chuàng)自主研發(fā)的GUI開發(fā)工具AiUIBuilderV2.0.0發(fā)布。作為一款基于LVGL的UI設(shè)計工具,AiUIBuilder致力于通過拖拽式操作,加速基于匠芯創(chuàng)嵌入式平臺的圖形應(yīng)用開發(fā)
    的頭像 發(fā)表于 10-29 10:03 ?895次閱讀
    全新升級 | 匠芯創(chuàng)AiUIBuilder V2.0.0<b class='flag-5'>發(fā)布</b>

    G2發(fā)布最新報告,Splashtop 榮膺多區(qū)域領(lǐng)導(dǎo)者,IT 遠程解決方案獲全球認可

    近日,全球權(quán)威軟件評測平臺G2發(fā)布了2025年秋季報告,Splashtop在端點管理、補丁管理、遠程支持和遠程桌面類別中表現(xiàn)亮眼,榮獲多項榮譽。憑借在歐洲、中東和非洲(EMEA)、歐洲、英國和加
    的頭像 發(fā)表于 10-20 17:02 ?1187次閱讀
    G2<b class='flag-5'>發(fā)布</b>最新報告,Splashtop 榮膺多區(qū)域領(lǐng)導(dǎo)者,IT 遠程解決方案獲全球認可

    技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元

    體驗優(yōu)化,全方位展現(xiàn)技嘉在主板、整機、軟件工具等領(lǐng)域的技術(shù)沉淀與產(chǎn)品實力,為全球硬件愛好者呈現(xiàn)一場 “始于需求,忠于體驗” 的科技盛宴。 在技嘉新品發(fā)布會上,行業(yè)巨頭與意見領(lǐng)袖齊聚一堂。英偉達、英特爾和AMD代表共同出席,同時邀
    的頭像 發(fā)表于 09-19 10:07 ?512次閱讀
    技嘉2025<b class='flag-5'>發(fā)布</b>會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!

    AMD7900xtxonSOPHGOSG2044PCLT團隊傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨特架構(gòu)的復(fù)雜工作。這包括:內(nèi)核級適配:確保ROCm驅(qū)動程序和底層組件能夠與SG
    的頭像 發(fā)表于 07-14 17:04 ?1196次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!

    請問CYUSB232開發(fā)板 是否支持1.8V Uart輸入?

    請問CYUSB232開發(fā)板 是否支持1.8V Uart輸入
    發(fā)表于 05-30 06:51

    雷軍官宣小米發(fā)布會:首款SUV將亮相 雷軍官宣小米YU7發(fā)布時間

    雷軍官宣小米YU7發(fā)布時間在22號,雷軍發(fā)文稱:小米戰(zhàn)略新品發(fā)布會,定在5月22日晚7點。 這次重磅新品特別多:手機SoC芯片小米玄戒o1,小米15SPro,小米平板7 Ultra,小米首款SUV
    的頭像 發(fā)表于 05-19 16:42 ?1372次閱讀

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0發(fā)布

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0發(fā)布
    的頭像 發(fā)表于 05-13 11:29 ?1784次閱讀
    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0<b class='flag-5'>發(fā)布</b>

    摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    近日,摩爾線程正式發(fā)布Torch-MUSA v2.0.0版本,這是其面向PyTorch深度學(xué)習(xí)框架的MUSA擴展庫的重要升級。新版本基于MUSA Compute Capability 3.1計算架構(gòu)
    的頭像 發(fā)表于 05-11 16:41 ?1603次閱讀