91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用PyCaret + RAPIDS簡(jiǎn)化模型構(gòu)建

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Sofia Sayyah ? 2022-04-19 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

PyCaret是一個(gè)低代碼 Python 機(jī)器學(xué)習(xí)庫,基于流行的 R Caret 庫。它自動(dòng)化了從數(shù)據(jù)預(yù)處理到 i NSight 的數(shù)據(jù)科學(xué)過程,因此短代碼行可以用最少的人工完成每個(gè)步驟。此外,使用簡(jiǎn)單的命令比較和調(diào)整許多模型的能力可以簡(jiǎn)化效率和生產(chǎn)效率,同時(shí)減少創(chuàng)建有用模型的時(shí)間。

PyCaret 團(tuán)隊(duì)在 2 . 2 版中添加了 NVIDIA GPU 支持,包括RAPIDS中所有最新和最偉大的版本。使用 GPU 加速, PyCaret 建模時(shí)間可以快 2 到 200 倍,具體取決于工作負(fù)載。

這篇文章將介紹如何在 GPU 上使用 PyCaret 以節(jié)省大量的開發(fā)和計(jì)算成本。

所有基準(zhǔn)測(cè)試都是在一臺(tái) 32 核 CPU 和四個(gè) NVIDIA Tesla T4 的機(jī)器上運(yùn)行的,代碼幾乎相同。為簡(jiǎn)單起見, GPU 代碼編寫為在單個(gè) GPU 上運(yùn)行。

PyCaret 入門

使用 PyCaret 與導(dǎo)入庫和執(zhí)行 setup 語句一樣簡(jiǎn)單。setup()功能創(chuàng)建環(huán)境,并提供一系列預(yù)處理功能,一氣呵成。

from pycaret.regression import * exp_reg = setup(data = df, target = ‘Year’, session_id = 123, normalize = True)

在一個(gè)簡(jiǎn)單的設(shè)置之后,數(shù)據(jù)科學(xué)家可以開發(fā)其管道的其余部分,包括數(shù)據(jù)預(yù)處理/準(zhǔn)備、模型訓(xùn)練、集成、分析和部署。在準(zhǔn)備好數(shù)據(jù)后,最好從比較模型開始。

與 PyCaret 的簡(jiǎn)約精神一樣,我們可以通過一行代碼來比較一系列標(biāo)準(zhǔn)模型,看看哪些模型最適合我們的數(shù)據(jù)。 compare _ models 命令使用默認(rèn)超參數(shù)訓(xùn)練 PyCaret 模型庫中的所有模型,并使用交叉驗(yàn)證評(píng)估性能指標(biāo)。然后,數(shù)據(jù)科學(xué)家可以根據(jù)這些信息選擇他們想要使用的模型、調(diào)整和集成。

top3 = compare_models(exclude = [‘ransac’], n_select=3)

比較模型

pYYBAGJec6KAEuJVAAJfAB5I3Mw802.png

圖 1 : PyCaret 中 compare _ models 命令的輸出。

**模型從最佳到最差排序, PyCaret 突出顯示了每個(gè)度量類別中的最佳結(jié)果,以便于使用。

用 RAPIDS cuML 加速 PyCaret

PyCaret 對(duì)于任何數(shù)據(jù)科學(xué)家來說都是一個(gè)很好的工具,因?yàn)樗?jiǎn)化了模型構(gòu)建并使運(yùn)行許多模型變得簡(jiǎn)單。使用 GPU s , PyCaret 可以做得更好。由于 PyCaret 在幕后做了大量工作,因此看似簡(jiǎn)單的命令可能需要很長時(shí)間。例如,我們?cè)谝粋€(gè)具有大約 50 萬個(gè)實(shí)例和 90 多個(gè)屬性(加州大學(xué)歐文分校的年度預(yù)測(cè) MSD 數(shù)據(jù)集)的數(shù)據(jù)集上運(yùn)行了前面的命令。在 CPU 上,花費(fèi)了 3 個(gè)多小時(shí)。在 GPU 上,只花了不到一半的時(shí)間。

在過去,在 GPU 上使用 PyCaret 需要許多手動(dòng)編碼,但謝天謝地, PyCaret 團(tuán)隊(duì)集成了 RAPIDS 機(jī)器學(xué)習(xí)庫( cuML ),這意味著您可以使用使 PyCaret 如此有效的相同簡(jiǎn)單 API ,同時(shí)還可以使用 GPU 的計(jì)算能力。

在 GPU 上運(yùn)行 PyCaret 往往要快得多,這意味著您可以充分利用 PyCaret 提供的一切,而無需平衡時(shí)間成本。使用剛才提到的同一個(gè)數(shù)據(jù)集,我們?cè)?CPU 和 GPU 上測(cè)試了 PyCaret ML 功能,包括比較、創(chuàng)建、調(diào)優(yōu)和集成模型。切換到 GPU 很簡(jiǎn)單;我們?cè)谠O(shè)置函數(shù)中將use_gpu設(shè)置為True:

exp_reg = setup(data = df, target = ‘Year’, session_id = 123, normalize = True, use_gpu = True)

PyCaret 設(shè)置為在 GPU 上運(yùn)行,它使用 cuML 來訓(xùn)練以下所有型號(hào):

對(duì)數(shù)幾率回歸

脊分類器

隨機(jī)森林

K 鄰域分類器

K 鄰域回歸器

支持向量機(jī)

線性回歸

嶺回歸

套索回歸

群集分析

基于密度的空間聚類

僅在 GPU 上運(yùn)行相同的compare_models代碼的速度是 GPU 的2.5倍多。

對(duì)于流行但計(jì)算昂貴的模型,在模型基礎(chǔ)上的影響更大。例如, K 鄰域回歸器在 GPU 上的速度是其 265 倍。

poYBAGJec6aAZgk7AABQVDYtMHQ115.png

圖 2 : CPU 和 GPU 上運(yùn)行的常見 PyCaret 操作的比較。

影響

PyCaret API 的簡(jiǎn)單性釋放了原本用于編碼的時(shí)間,因此數(shù)據(jù)科學(xué)家可以做更多的實(shí)驗(yàn)并對(duì)實(shí)驗(yàn)進(jìn)行微調(diào)。當(dāng)與 GPU 配合使用時(shí),這種影響甚至更大,因?yàn)槌浞掷?PyCaret 的評(píng)估和比較工具套件的計(jì)算成本顯著降低。

結(jié)論

廣泛的比較和評(píng)估模型有助于提高結(jié)果的質(zhì)量,而 PyCaret 正是為了這樣做。 GPU 上的 PyCaret 抵消了大量處理所帶來的時(shí)間成本。

RAPIDS 的目標(biāo)是加速您的數(shù)據(jù)科學(xué), PyCaret 是越來越多的庫之一,它們與 RAPIDS 套件的兼容性有助于為您的機(jī)器學(xué)習(xí)追求帶來新的效率。

關(guān)于作者

Sofia Sayyah 是 NVIDIA 的數(shù)據(jù)工程實(shí)習(xí)生。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5209

    瀏覽量

    135605
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137052
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何<b class='flag-5'>構(gòu)建</b>適合自動(dòng)駕駛的世界<b class='flag-5'>模型</b>?

    安寶特產(chǎn)品丨3DE-實(shí)體模型簡(jiǎn)化-快捷簡(jiǎn)化和表面收縮

    CAD 實(shí)體模型如何輕量化?快捷簡(jiǎn)化與表面收縮助力版權(quán)保護(hù)和營銷素材制作成本優(yōu)化。
    的頭像 發(fā)表于 12-01 13:28 ?297次閱讀
    安寶特產(chǎn)品丨3DE-實(shí)體<b class='flag-5'>模型</b><b class='flag-5'>簡(jiǎn)化</b>-快捷<b class='flag-5'>簡(jiǎn)化</b>和表面收縮

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    通過實(shí)踐,本文總結(jié)了構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議,這些建議將會(huì)在構(gòu)建高準(zhǔn)確率輕量級(jí)CNN神經(jīng)網(wǎng)絡(luò)模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡(luò):我們清楚神經(jīng)網(wǎng)絡(luò)本身是需要不斷抽象出
    發(fā)表于 10-28 08:02

    如何在vivadoHLS中使用.TLite模型

    測(cè)試 在Vivado HLS中運(yùn)行綜合、高級(jí)綜合和RTL仿真,確保設(shè)計(jì)正確。 注意事項(xiàng) 以上步驟是一個(gè)簡(jiǎn)化的示例,具體的實(shí)現(xiàn)可能因您的模型和需求而有所不同。在實(shí)際應(yīng)用中,您可能需要進(jìn)一步優(yōu)化接口和數(shù)據(jù)傳輸,以滿足性能和資源要求。
    發(fā)表于 10-22 06:29

    NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1100次閱讀

    構(gòu)建適用于三維集成系統(tǒng)的互連線長分布模型

    在三維集成電路設(shè)計(jì)中,TSV技術(shù)通過垂直互連顯著優(yōu)化了互連線長分布特性。基于倫特定律的經(jīng)典分析框架,可構(gòu)建適用于三維集成系統(tǒng)的互連線長分布模型。
    的頭像 發(fā)表于 08-21 10:41 ?1171次閱讀
    <b class='flag-5'>構(gòu)建</b>適用于三維集成系統(tǒng)的互連線長分布<b class='flag-5'>模型</b>

    實(shí)現(xiàn)SSC-EARSM湍流模型的關(guān)鍵技術(shù)

    簡(jiǎn)化基線顯式代數(shù)雷諾應(yīng)力模型(S-BSL-EARSM)相比,分離敏感型修正顯式代數(shù)雷諾應(yīng)力模型(SSC-EARSM)旨在更好地預(yù)測(cè)分離流動(dòng)。
    的頭像 發(fā)表于 08-13 15:08 ?740次閱讀
    實(shí)現(xiàn)SSC-EARSM湍流<b class='flag-5'>模型</b>的關(guān)鍵技術(shù)

    十二相同步發(fā)電機(jī)降階等效模型研究

    摘要:十二相同步發(fā)電機(jī)整流系統(tǒng)能夠提供高品質(zhì)直流電能,但是發(fā)電機(jī)模型復(fù)雜,解析分析困難。為此,推導(dǎo)了十二相整流發(fā)電機(jī)的等效三相降階模型和狀態(tài)空間平均模型,簡(jiǎn)化
    發(fā)表于 06-17 08:59

    瑞芯微模型量化文件構(gòu)建

    模型是一張圖片輸入時(shí),量化文件如上圖所示。但是我現(xiàn)在想量化deepprivacy人臉匿名模型,他的輸入是四個(gè)輸入。該模型訓(xùn)練時(shí)數(shù)據(jù)集只標(biāo)注了人臉框和關(guān)鍵點(diǎn),該模型的預(yù)處理是放到
    發(fā)表于 06-13 09:07

    知識(shí)分享 | 評(píng)估模型架構(gòu)——如何實(shí)現(xiàn)?

    確保良好的模型架構(gòu)對(duì)于開發(fā)安全和可靠的軟件非常重要。本文為您介紹MES Model Examiner? (MXAM)如何優(yōu)化模型架構(gòu),簡(jiǎn)化復(fù)雜度管理步驟,并最終提升軟件質(zhì)量。
    的頭像 發(fā)表于 06-05 11:46 ?677次閱讀
    知識(shí)分享 | 評(píng)估<b class='flag-5'>模型</b>架構(gòu)——如何實(shí)現(xiàn)?

    碳化硅襯底厚度測(cè)量中探頭溫漂的熱傳導(dǎo)模型與實(shí)驗(yàn)驗(yàn)證

    引言 在碳化硅襯底厚度測(cè)量過程中,探頭溫漂會(huì)嚴(yán)重影響測(cè)量精度。構(gòu)建探頭溫漂的熱傳導(dǎo)模型并進(jìn)行實(shí)驗(yàn)驗(yàn)證,有助于深入理解探頭溫漂的產(chǎn)生機(jī)理,為提高測(cè)量準(zhǔn)確性提供理論依據(jù)與技術(shù)支持。 熱傳導(dǎo)模型構(gòu)
    的頭像 發(fā)表于 06-04 09:37 ?556次閱讀
    碳化硅襯底厚度測(cè)量中探頭溫漂的熱傳導(dǎo)<b class='flag-5'>模型</b>與實(shí)驗(yàn)驗(yàn)證

    如何使用Docker部署大模型

    隨著深度學(xué)習(xí)和大模型的快速發(fā)展,如何高效地部署這些模型成為了一個(gè)重要的挑戰(zhàn)。Docker 作為一種輕量級(jí)的容器化技術(shù),能夠?qū)?b class='flag-5'>模型及其依賴環(huán)境打包成一個(gè)可移植的容器,極大地簡(jiǎn)化了部署流程
    的頭像 發(fā)表于 05-24 16:39 ?1188次閱讀

    望石智慧基于亞馬遜云科技構(gòu)建醫(yī)藥行業(yè)專屬大模型 推動(dòng)藥物研發(fā)創(chuàng)新

    北京 ——2025 年 5 月 13 日 創(chuàng)新型生物醫(yī)藥科技企業(yè)望石智慧應(yīng)用亞馬遜云科技的底層基礎(chǔ)設(shè)施、高性能計(jì)算和存儲(chǔ)等技術(shù)與服務(wù),構(gòu)建多模態(tài)3D分子生成大模型,在降低運(yùn)維負(fù)擔(dān)與成本的同時(shí),推動(dòng)
    發(fā)表于 05-13 14:21 ?1095次閱讀

    小白學(xué)大模型:從零實(shí)現(xiàn) LLM語言模型

    ://github.com/FareedKhan-dev/train-llm-from-scratch本文將為你提供一個(gè)簡(jiǎn)單直接的方法,從下載數(shù)據(jù)到生成文本,帶你一步步構(gòu)建大院模型。步
    的頭像 發(fā)表于 04-30 18:34 ?1344次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:從零實(shí)現(xiàn) LLM語言<b class='flag-5'>模型</b>

    大華星漢大模型2.0重塑產(chǎn)業(yè)格局

    模型的蓬勃發(fā)展,正以前所未有的速度和方式融入社會(huì)各領(lǐng)域。大華星漢大模型2.0創(chuàng)新構(gòu)建行業(yè)智能體,重塑產(chǎn)業(yè)格局。
    的頭像 發(fā)表于 04-15 10:38 ?1275次閱讀