91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-09-09 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖神經(jīng)網(wǎng)絡(luò)(GNN)的統(tǒng)一 API,以及無需更改代碼即可實(shí)現(xiàn)的支持向量機(jī)加速功能。在本篇博客中,我們將介紹其中的幾項(xiàng)重要更新。

Polars GPU 引擎更新

2024 年 9 月,NVIDIA 與 Polars 團(tuán)隊(duì)合作推出了基于 NVIDIA cuDF 開發(fā)的 Polars GPU 引擎。此次發(fā)布的 25.06 版對 Polars GPU 引擎的功能進(jìn)行了重大更新。

流執(zhí)行器現(xiàn)已進(jìn)入實(shí)驗(yàn)階段

25.06 版在 Polars GPU 引擎中引入了流執(zhí)行功能。流執(zhí)行器利用數(shù)據(jù)分區(qū)和并行處理技術(shù),能夠處理超出顯存容量的數(shù)據(jù)集。要使用這個(gè)新的流執(zhí)行器,用戶可以將恰當(dāng)配置的 GPUEngine 對象傳遞給 Polars 的 collect 調(diào)用。

這種新的流模式還能讓用戶將數(shù)據(jù)處理工作流擴(kuò)展到多個(gè) GPU,有助于加速分析數(shù)百 GB 到 TB 級的數(shù)據(jù)集。對于需要在分區(qū)之間移動數(shù)據(jù)的操作(例如連接和分組),新引入的數(shù)據(jù)混洗(shuffle)機(jī)制可在設(shè)備之間重新分配數(shù)據(jù)。多 GPU 執(zhí)行通過 Dask 分布式調(diào)度器進(jìn)行編排,使用前需要先設(shè)置一個(gè) Dask 客戶端。

流執(zhí)行器目前仍在積極開發(fā)中,尚未支持的操作將自動回退到內(nèi)存執(zhí)行器。

支持滾動聚合及更多列操作

最新版本還包含了對 Polars GPU 引擎中一些關(guān)鍵新 DataFrame 功能的支持。首先,我們在 Polars 中添加了對 .rolling() 操作的支持,允許用戶基于一些 DataFrame 中的其他列創(chuàng)建滾動組。這在處理時(shí)間序列數(shù)據(jù)集時(shí)尤為實(shí)用。

此外 GPU 引擎現(xiàn)在支持更豐富的日期時(shí)間列表達(dá)式,目前已支持的新方法包括 .strftime() 和 .cast_time_unit()。隨著我們繼續(xù)擴(kuò)展整體 API 覆蓋范圍,未來版本還將支持更多方法。

統(tǒng)一的 GNN API

NVIDIA cuGraph-PyG 進(jìn)一步集成了 WholeGraph 以加速特征提取,形成了我們所說的統(tǒng)一 API。這個(gè)新 API 現(xiàn)在允許用戶在單 GPU 工作流中使用 WholeGraph 的加速特征存儲,同時(shí)無需修改腳本即可用于多 GPU 或多節(jié)點(diǎn)工作流。

借助統(tǒng)一 API,在單 GPU 上進(jìn)行原型開發(fā)時(shí)使用相同的 GNN 訓(xùn)練腳本就能在具有多個(gè) GPU 的單節(jié)點(diǎn)以及多節(jié)點(diǎn)上運(yùn)行。通過 PyTorch 的 torchrun 命令管理進(jìn)程設(shè)置,使得大多數(shù) PyTorch 用戶都可以熟練地使用統(tǒng)一 API。

無需更改代碼的 cuML 增強(qiáng)功能

今年 3 月,NVIDIA 推出了由 cuML 驅(qū)動、用于 scikit-learn 的無需更改代碼的加速器,該加速器已進(jìn)入公測階段。在 25.06 版本中,cuML 為用戶帶來了更多無需更改代碼的功能。

無需更改代碼的支持向量機(jī)

NVIDIA cuML 擴(kuò)展了其無需更改代碼的加速功能,新增了對支持向量機(jī)的支持。支持向量分類(SVC)和支持向量回歸(SVR)這兩種強(qiáng)大的算法在 GPU 上執(zhí)行時(shí),能很好地處理高維數(shù)據(jù)并顯著地提升速度。通過在 cuML 的零代碼變更接口中添加這些估計(jì)器,利用支持向量機(jī)的現(xiàn)有 scikit-learn 工作流無需修改即可加速。cuML 和 scikit-learn 在 SVC 和 SVR 的實(shí)現(xiàn)上存在一些關(guān)鍵差異,還請用戶加以了解。

改進(jìn)的 scikit-learn 兼容性

25.06 版本對 cuML 加速 scikit-learn 估計(jì)器的方式進(jìn)行了重大重構(gòu),增強(qiáng)了 scikit-learn 一致性,還改進(jìn)了參數(shù)驗(yàn)證和異常處理。此外,通過這次重新設(shè)計(jì),cuML 也增強(qiáng)了與 scikit-learn API 的兼容性,可以更輕松地加速目前與 scikit-learn 集成的第三方庫。

隨機(jī)森林與更新后的森林推理庫(FIL)集成

通過集成更快、更強(qiáng)大的森林推理庫(FIL),cuML 的隨機(jī)森林估計(jì)器得到了升級,在保持向后兼容性的同時(shí),提供了更高的性能和更好的內(nèi)存管理。

需注意,舊版特有的一些 API 調(diào)節(jié)參數(shù)(knobs)現(xiàn)已棄用,并將在即將發(fā)布的 25.08 版本中移除。

RAPIDS 內(nèi)存管理器與NVIDIABlackwell 解壓縮引擎的兼容性

RAPIDS 內(nèi)存管理器(RMM)庫增加了全新功能,確保用戶能夠使用最新的 NVIDIA 硬件功能。在最新版本中,RMM 異步內(nèi)存資源可支持兼容 NVIDIA Blackwell GPU 上基于硬件的解壓縮引擎,讓 IO 密集型工作流中的性能得到提升。

此外,RMM 現(xiàn)在以一個(gè)預(yù)編譯共享庫的形式存在,取代了之前的僅包含頭文件的庫。我們相信這一變化將為未來解鎖新功能奠定基礎(chǔ)。

平臺更新:Python 和NVIDIA CUDA 支持

25.06 版本為所有 RAPIDS 庫添加了對 Python 3.13 的支持,同時(shí)也是最后一個(gè)支持 CUDA 11 的版本。從 25.08 版開始,RAPIDS 將不再支持 CUDA 11。如需繼續(xù)使用 CUDA 11,可以固定使用 25.06 版本。

結(jié)語

RAPIDS 25.06 版為新的機(jī)器學(xué)習(xí)算法帶來了零代碼變更功能、新的 Polars GPU 流引擎、異步內(nèi)存資源的硬件解壓縮功能等多項(xiàng)功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109704
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135409
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    368

    瀏覽量

    23451

原文標(biāo)題:RAPIDS 新增 GPU Polars 流執(zhí)行等多項(xiàng)新功能

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    索尼更新相機(jī)遙控軟件開發(fā)包2.01版本

    2026年2月03日,索尼(中國)有限公司正式發(fā)布了可通過電腦遠(yuǎn)程操控索尼相機(jī)的相機(jī)遙控軟件開發(fā)包(Camera Remote SDK)2.01版本,本次更新帶來了2個(gè)新功能,新增支持機(jī)型ILCE-7M5、PXW-Z380、DS
    的頭像 發(fā)表于 02-03 16:59 ?648次閱讀

    西門子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多項(xiàng)檢查功能、提升制造風(fēng)險(xiǎn)識別,并推出令人矚目的 3D 可視化增強(qiáng)特性,這標(biāo)志著產(chǎn)品的重大升級。Valor NPI 的 3D 視圖經(jīng)過重新設(shè)計(jì),讓可制造性設(shè)計(jì) (DFM) 結(jié)果的查看更直觀、
    的頭像 發(fā)表于 01-04 16:10 ?386次閱讀
    西門子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b><b class='flag-5'>功能</b>

    睿擎平臺v1.7.2版本正式發(fā)布|技術(shù)集結(jié)

    核心亮點(diǎn):●RC3562新產(chǎn)品系列重磅上線●RC3506平臺新增多項(xiàng)核心功能RC3562新產(chǎn)品系列重磅推出RC3562作為睿擎平臺全新產(chǎn)品系列,具備以下核心優(yōu)勢:●默認(rèn)集成AMP混合部署方案,提升
    的頭像 發(fā)表于 12-17 18:10 ?558次閱讀
    睿擎平臺v1.7.2<b class='flag-5'>版本</b>正式發(fā)布|技術(shù)集結(jié)

    NVIDIA CUDA 13.1版本新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2199次閱讀

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對 AMD Versal 自適應(yīng) SoC 的設(shè)計(jì)支持,包含新器件支持、QoR 功能及易用性增強(qiáng)。
    的頭像 發(fā)表于 12-09 15:11 ?940次閱讀

    連接標(biāo)準(zhǔn)聯(lián)盟正式推出Matter 1.5版本

    、土壤傳感器的支持,同時(shí)還新增多項(xiàng)能源管理功能。此次更新延續(xù)了 Matter 的核心使命,即簡化智能家居開發(fā)流程、增強(qiáng)設(shè)備互操作性,為消費(fèi)者與開發(fā)者打造更豐富、更可持續(xù)的互操作體驗(yàn)。
    的頭像 發(fā)表于 11-30 10:34 ?1073次閱讀

    開鴻Bot系列大版本更新:體驗(yàn)穩(wěn)定升級,樂享高效協(xié)同!

    V5.0.1.22版本開鴻Bot系列今日,開鴻Bot系列迎來第二次大版本更新——V5.0.1.22。此次版本更新致力于進(jìn)一步提升系統(tǒng)穩(wěn)定性與用戶體驗(yàn),新增多項(xiàng)實(shí)用
    的頭像 發(fā)表于 09-26 17:06 ?1342次閱讀
    開鴻Bot系列大<b class='flag-5'>版本</b>更新:體驗(yàn)穩(wěn)定升級,樂享高效協(xié)同!

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實(shí)用的新功能,進(jìn)一步提升了設(shè)計(jì)體驗(yàn)和開發(fā)效率。在V1.3.0版本中,AiUIBuilder新增了多國語言切換功能
    的頭像 發(fā)表于 08-07 15:36 ?1295次閱讀
    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 <b class='flag-5'>新增多</b>國語言設(shè)置等<b class='flag-5'>功能</b>

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實(shí)用的新功能,進(jìn)一步提升了設(shè)計(jì)體驗(yàn)和開發(fā)效率。 在V1.3.0版本中,AiUIBuilder新增了 多國語言切換功能
    發(fā)表于 07-16 13:54

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個(gè)版本都擴(kuò)展了
    的頭像 發(fā)表于 07-04 14:27 ?1233次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0<b class='flag-5'>版本</b>的亮點(diǎn)解析

    CANoe產(chǎn)品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當(dāng)前車輛E/E架構(gòu)中ECU開發(fā)驗(yàn)證,同時(shí)賦能后續(xù)智能網(wǎng)聯(lián)電動車型預(yù)研驗(yàn)證。新版本CANoe產(chǎn)品體系新增數(shù)據(jù)驅(qū)動的DDS、車輛互聯(lián)服務(wù)和高效電機(jī)模型庫,進(jìn)一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?2908次閱讀
    CANoe產(chǎn)品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    NVIDIA在ICRA 2025展示多項(xiàng)最新研究成果

    在亞特蘭大舉行的國際機(jī)器人與自動化大會 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領(lǐng)域的多項(xiàng)研究成果。
    的頭像 發(fā)表于 06-06 14:56 ?1393次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅(qū)動工作負(fù)載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1428次閱讀

    Altium Designer 25.4.2版本的新功能

    在原理圖元件的屬性中,新增了對動態(tài)(條目級)參數(shù)的可見性支持。這些動態(tài)參數(shù)的值可以在源數(shù)據(jù)庫 / PLM系統(tǒng)中進(jìn)行更改,并同步到已放置的工作區(qū)庫元件中,而無需創(chuàng)建這些元件的新修訂版本?,F(xiàn)在,當(dāng)在
    的頭像 發(fā)表于 03-24 11:34 ?1901次閱讀
    Altium Designer 25.4.2<b class='flag-5'>版本</b>的新<b class='flag-5'>功能</b>

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55