91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA RAPIDS cuDF加速預(yù)處理工作流

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 2024-11-19 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文屬于《解碼 AI》系列欄目,該系列的目的是讓技術(shù)更加簡(jiǎn)單易懂,從而解密 AI,同時(shí)向 RTX 工作站和 PC 用戶展示全新硬件、軟件、工具和加速特性。

AI 正幫助各行各業(yè)推動(dòng)創(chuàng)新和提高效率,但要充分發(fā)揮其潛力,必須基于海量的高質(zhì)量數(shù)據(jù)對(duì)各種模型進(jìn)行訓(xùn)練。數(shù)據(jù)科學(xué)家在準(zhǔn)備這類數(shù)據(jù)方面發(fā)揮著關(guān)鍵作用,在專業(yè)數(shù)據(jù)(通常為專有數(shù)據(jù))對(duì)于增強(qiáng) AI 功能至關(guān)重要的特定領(lǐng)域尤其如此。

為了幫助數(shù)據(jù)科學(xué)家應(yīng)對(duì)日益增長(zhǎng)的工作負(fù)載需求,NVIDIA 發(fā)布了 RAPIDS cuDF 庫(kù),以便用戶更輕松地處理數(shù)據(jù),并且無(wú)需更改代碼即可加速 pandas 軟件庫(kù)。Pandas 是面向 Python 的一個(gè)靈活、功能強(qiáng)大的熱門數(shù)據(jù)分析和處理庫(kù)。借助 cuDF,數(shù)據(jù)科學(xué)家現(xiàn)在可以在他們首選的代碼庫(kù)上全速運(yùn)行數(shù)據(jù)處理。

NVIDIA RTX AI 硬件和技術(shù)也可以加速數(shù)據(jù)處理。這包括強(qiáng)大的 GPU,可提供在各個(gè)層面快速高效地加速 AI 所需的計(jì)算性能 — 從數(shù)據(jù)科學(xué)工作流到 PC 和工作站上的模型訓(xùn)練和定制。

數(shù)據(jù)科學(xué)的瓶頸

最常用的數(shù)據(jù)格式是按行和列組織的表格數(shù)據(jù)。小型數(shù)據(jù)集可以使用 Excel 等電子表格工具進(jìn)行管理,但是,包含數(shù)千萬(wàn)行的數(shù)據(jù)集和建模工作流通常依賴于采用了例如 Python 等編程語(yǔ)言的 DataFrame 程序庫(kù)。

Python 是進(jìn)行數(shù)據(jù)分析時(shí)的熱門選擇,主要是因?yàn)?pandas 庫(kù)采用易于使用的應(yīng)用編程接口(API)。然而,隨著數(shù)據(jù)集的規(guī)模不斷增長(zhǎng),pandas 在純 CPU 系統(tǒng)中難以實(shí)現(xiàn)理想的處理速度和效率。該庫(kù)在處理文本密集型數(shù)據(jù)集時(shí)的性能也為人所詬病,而對(duì)大語(yǔ)言模型來(lái)說(shuō),這是一種重要的數(shù)據(jù)類型。

當(dāng)數(shù)據(jù)需求超出 pandas 的能力時(shí),數(shù)據(jù)科學(xué)家會(huì)面臨兩難境地:要么忍受緩慢的處理速度,要么采取復(fù)雜且成本高昂的措施,即轉(zhuǎn)而采用更高效但對(duì)用戶不夠友好的工具。

使用 RAPIDS cuDF加速預(yù)處理工作流

RAPIDS cuDF 配合 RTX AI PC 和工作站,可為熱門的 pandas 軟件庫(kù)提供最高達(dá) 100 倍加速

借助 RAPIDS cuDF,數(shù)據(jù)科學(xué)家現(xiàn)在可以在他們首選的代碼庫(kù)上全速運(yùn)行數(shù)據(jù)處理。RAPIDS 是一套開(kāi)源 GPU 加速的 Python 庫(kù),旨在改進(jìn)數(shù)據(jù)科學(xué)和分析工作流。cuDF 是一個(gè) GPU DataFrame 庫(kù),可提供類似于 pandas 的 API 來(lái)加載、過(guò)濾和操作數(shù)據(jù)。

使用 cuDF 的“pandas 加速器模式”,數(shù)據(jù)科學(xué)家可以在 GPU 上運(yùn)行現(xiàn)有的 pandas 代碼,充分利用強(qiáng)大的并行處理功能,并可放心的將代碼在必要時(shí)移植到 CPU 上。這種互通性提供了出色、可靠的性能。

最新版本的 cuDF 支持更大規(guī)模的數(shù)據(jù)集和數(shù)十億行的表格文本數(shù)據(jù)。這樣,數(shù)據(jù)科學(xué)家就能夠使用 pandas 代碼來(lái)預(yù)處理生成式 AI 的數(shù)據(jù)。

在 NVIDIA RTX 加持的 AI 工作站

和 PC 上加速數(shù)據(jù)科學(xué)

最近的一項(xiàng)研究表明,57% 的數(shù)據(jù)科學(xué)家使用 PC、臺(tái)式機(jī)或工作站等本地資源來(lái)執(zhí)行數(shù)據(jù)科學(xué)任務(wù)。

從 NVIDIA GeForce RTX 4090 GPU 開(kāi)始,數(shù)據(jù)科學(xué)家可以實(shí)現(xiàn)顯著的速度提升。隨著數(shù)據(jù)集規(guī)模不斷增長(zhǎng),處理工作占用更多內(nèi)存,相比于基于傳統(tǒng) CPU 的解決方案,在工作站中配合使用 cuDF 和 NVIDIA RTX 5880 Ada 架構(gòu) GPU,可以將性能提升多達(dá) 100 倍。

ea062c2c-9ffd-11ef-93f3-92fbcf53809c.png

y 軸表示兩種常見(jiàn)的數(shù)據(jù)科學(xué)操作—“join”和“groupby”,而 x 軸顯示運(yùn)行每項(xiàng)操作所需的時(shí)間

數(shù)據(jù)科學(xué)家可以在 NVIDIA AI Workbench 上輕松開(kāi)始使用 RAPIDS cuDF。利用這個(gè)基于容器的免費(fèi)開(kāi)發(fā)者環(huán)境管理器,數(shù)據(jù)科學(xué)家和開(kāi)發(fā)者可以跨 GPU 系統(tǒng)創(chuàng)建、遷移 AI 和數(shù)據(jù)科學(xué)工作負(fù)載并進(jìn)行協(xié)作。用戶可以從 NVIDIA GitHub 倉(cāng)庫(kù)中提供的幾個(gè)示例項(xiàng)目開(kāi)始,例如 cuDF AI Workbench 項(xiàng)目。

HP AI Studio 也默認(rèn)支持 cuDF,這是一個(gè)集中式數(shù)據(jù)科學(xué)平臺(tái),旨在幫助 AI 開(kāi)發(fā)者將其開(kāi)發(fā)環(huán)境從工作站無(wú)縫復(fù)制到云端。這便于他們創(chuàng)建、開(kāi)發(fā)項(xiàng)目并進(jìn)行協(xié)作,而無(wú)需管理多個(gè)環(huán)境。

在 RTX 加持的 AI PC 和工作站上,cuDF 的優(yōu)勢(shì)并不僅限于提升原始性能。還包括:

在強(qiáng)大的 GPU 上進(jìn)行固定成本的本地開(kāi)發(fā),并可以無(wú)縫復(fù)制到本地部署的服務(wù)器或云實(shí)例,從而節(jié)省時(shí)間和支出。

加快數(shù)據(jù)處理以實(shí)現(xiàn)更快迭代,以便數(shù)據(jù)科學(xué)家以交互式的速度進(jìn)行實(shí)驗(yàn)、優(yōu)化并從數(shù)據(jù)集中產(chǎn)生洞察。

實(shí)現(xiàn)更有效的數(shù)據(jù)處理,以在后續(xù)工作流獲得更好的模型結(jié)果。

數(shù)據(jù)科學(xué)的新時(shí)代

隨著 AI 和數(shù)據(jù)科學(xué)的不斷發(fā)展,快速處理和分析大量數(shù)據(jù)集的能力將成為各行業(yè)實(shí)現(xiàn)突破的關(guān)鍵差異化因素。無(wú)論是開(kāi)發(fā)復(fù)雜的機(jī)器學(xué)習(xí)模型、執(zhí)行復(fù)雜的統(tǒng)計(jì)分析還是探索生成式 AI,RAPIDS cuDF 都可為新一代數(shù)據(jù)處理奠定基礎(chǔ)。

NVIDIA 正通過(guò)增加對(duì)最熱門的 DataFrame 工具的支持來(lái)鞏固這一基礎(chǔ),其中包括 Polars,它是增長(zhǎng)最快的 Python 庫(kù)之一,與其他開(kāi)箱即用的純 CPU 工具相比,可幫助顯著加速數(shù)據(jù)處理。

Polars 本月宣布推出由 RAPIDS cuDF 提供支持的 Polars GPU 引擎公開(kāi)測(cè)試版。Polars 用戶現(xiàn)在可以將本已極快的 DataFrame 庫(kù)性能提升多達(dá) 13 倍。

RTX AI 為未來(lái)的工程師創(chuàng)造無(wú)限可能

無(wú)論在大學(xué)數(shù)據(jù)中心、GeForce RTX 筆記本電腦還是 NVIDIA RTX 工作站上運(yùn)行,NVIDIA GPU 都可加速學(xué)習(xí)過(guò)程。數(shù)據(jù)科學(xué)領(lǐng)域及其他領(lǐng)域的學(xué)生將增強(qiáng)其學(xué)習(xí)體驗(yàn),并通過(guò)廣泛應(yīng)用于現(xiàn)實(shí)世界應(yīng)用的硬件獲得實(shí)戰(zhàn)經(jīng)驗(yàn)。

生成式 AI 正在深入改變游戲、視頻會(huì)議和各種交互體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109708
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39716

    瀏覽量

    301327
  • 工作流
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    12906

原文標(biāo)題:解密 AI 如何加速數(shù)據(jù)科學(xué)工作流

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用NVIDIA Nemotron開(kāi)放模型構(gòu)建智能文檔處理系統(tǒng)

    基于 NVIDIA Nemotron 開(kāi)放模型的 AI 驅(qū)動(dòng)文檔智能,增強(qiáng)科學(xué)研究、金融和法律等領(lǐng)域工作流。
    的頭像 發(fā)表于 02-25 11:21 ?379次閱讀

    生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺(tái)加速 AI 驅(qū)動(dòng)的藥物研發(fā)

    —— NVIDIA 近日宣布對(duì) NVIDIA BioNeMo? 進(jìn)行重大擴(kuò)展, 將通過(guò)一個(gè)開(kāi)放式開(kāi)發(fā)平臺(tái)支持實(shí)現(xiàn)實(shí)驗(yàn)室閉環(huán)(lab-in-the-loop)工作流,以推動(dòng) AI 驅(qū)動(dòng)的
    的頭像 發(fā)表于 01-14 11:40 ?461次閱讀
    生命科學(xué)領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺(tái)<b class='flag-5'>加速</b> AI 驅(qū)動(dòng)的藥物研發(fā)

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流
    的頭像 發(fā)表于 01-06 09:51 ?2216次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    數(shù)據(jù)預(yù)處理軟核加速模塊設(shè)計(jì)

    數(shù)據(jù)拼接操作,其預(yù)處理模塊結(jié)構(gòu)框圖如下圖 模塊最后得到的信號(hào)為ddr_q、ddr_clk和ddr_wrreq。ddr_q是并行128bits圖像數(shù)據(jù),ddr_clk是RAM的出口時(shí)鐘,同時(shí)引出作為下一模塊的數(shù)據(jù)時(shí)鐘,ddr_wrreq置高時(shí)代表有效數(shù)據(jù)。
    發(fā)表于 10-29 08:09

    NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫(kù),最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1058次閱讀

    MATLAB 助力香港中文大學(xué)解決生物醫(yī)學(xué)圖像處理挑戰(zhàn)

    Processing Toolbox? 加速了生物醫(yī)學(xué)圖像處理工作流程。借助 MathWorks 的軟件,研究人員高效地對(duì)萬(wàn)億體素級(jí)別的圖像進(jìn)行了分割和分析,以往這些任務(wù)需要高端計(jì)算基礎(chǔ)設(shè)施和大量手動(dòng)編程
    的頭像 發(fā)表于 08-28 15:07 ?602次閱讀

    NVIDIA在Hot Chips 2025大會(huì)展示創(chuàng)新技術(shù)

    本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會(huì)上,NVIDIA 專家詳細(xì)介紹了 NVIDIA NVLink 和Spectrum-X 以太網(wǎng)技術(shù)、Blackwell 以及 CUDA 如何為全球數(shù)百萬(wàn)的 AI
    的頭像 發(fā)表于 08-27 12:52 ?1921次閱讀

    鋰電池制造 | 電芯預(yù)處理工藝的步驟詳解

    電芯預(yù)處理是鋰電池包制造的首要工序,無(wú)論是新能源汽車的續(xù)航穩(wěn)定性,還是儲(chǔ)能系統(tǒng)的循環(huán)壽命,其根基都可追溯至預(yù)處理工序?qū)﹄娦疽恢滦缘陌芽?,其核心在于通過(guò)系統(tǒng)檢測(cè)與篩選消除量產(chǎn)電芯的性能差異,為后續(xù)組裝
    的頭像 發(fā)表于 08-11 14:53 ?1498次閱讀
    鋰電池制造 | 電芯<b class='flag-5'>預(yù)處理工</b>藝的步驟詳解

    使用NVIDIA Cosmos模型提高未來(lái)智能汽車安全性

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse” 重點(diǎn)介紹開(kāi)發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進(jìn)展深入改變他們的工作流。
    的頭像 發(fā)表于 07-14 11:46 ?1164次閱讀

    高效地?cái)U(kuò)展Polars GPU Parquet讀取器

    處理大型數(shù)據(jù)集時(shí),數(shù)據(jù)處理工具的性能至關(guān)重要。Polars 作為一個(gè)以速度和效率著稱的開(kāi)源數(shù)據(jù)處理庫(kù),它提供了由 cuDF 驅(qū)動(dòng)的 GPU 加速
    的頭像 發(fā)表于 04-21 17:12 ?897次閱讀
    高效地?cái)U(kuò)展Polars GPU Parquet讀取器

    非技術(shù)人員如何用n8n + DeepSeek打造AI自動(dòng)化工作流

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 本文從零開(kāi)始介紹使用n8n和DeepSeek快速實(shí)現(xiàn)一個(gè)AI Agent,全自動(dòng)實(shí)現(xiàn)一個(gè)Python代碼的生成和執(zhí)行工作流。 一,什么是n8n? n8n
    的頭像 發(fā)表于 04-09 14:28 ?8427次閱讀
    非技術(shù)人員如何用n8n + DeepSeek打造AI自動(dòng)化<b class='flag-5'>工作流</b>?

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    生產(chǎn)力、安全性和性能。新版軟件可幫助企業(yè)和開(kāi)發(fā)者進(jìn)一步推動(dòng)創(chuàng)新、改變工作流并更大限度地發(fā)揮加速計(jì)算的潛力。
    的頭像 發(fā)表于 04-07 11:28 ?1428次閱讀

    FPGA Verilog HDL語(yǔ)法之編譯預(yù)處理

    Verilog HDL語(yǔ)言和C語(yǔ)言一樣也提供了編譯預(yù)處理的功能?!熬幾g預(yù)處理”是Verilog HDL編譯系統(tǒng)的一個(gè)組成部分。Verilog HDL語(yǔ)言允許在程序中使用幾種特殊的命令(它們不是一般
    的頭像 發(fā)表于 03-27 13:30 ?1432次閱讀
    FPGA Verilog HDL語(yǔ)法之編譯<b class='flag-5'>預(yù)處理</b>

    NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

    隨著 NVIDIA 推出 Aether 項(xiàng)目,通過(guò)采用 NVIDIA 加速的 Apache Spark 企業(yè)得以自動(dòng)加速其數(shù)據(jù)中心規(guī)模的分析工作
    的頭像 發(fā)表于 03-25 15:09 ?1154次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>的Apache Spark助力企業(yè)節(jié)省大量成本

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無(wú)法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55