91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

如意 ? 來源:機器之心 ? 作者:Andre Ye ? 2020-09-22 14:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AutoML 是當(dāng)前深度學(xué)習(xí)領(lǐng)域的熱門話題。只需要很少的工作,AutoML 就能通過快速有效的方式,為你的 ML 任務(wù)構(gòu)建好網(wǎng)絡(luò)模型,并實現(xiàn)高準確率。簡單有效!數(shù)據(jù)預(yù)處理、特征工程、特征提取和特征選擇等任務(wù)皆可通過 AutoML 自動構(gòu)建。

自動機器學(xué)習(xí)(Automated Machine Learning, AutoML)是一個新興的領(lǐng)域,在這個領(lǐng)域中,建立機器學(xué)習(xí)模型來建模數(shù)據(jù)的過程是自動化的。AutoML 使得建模更容易,并且每個人都更容易掌握。

在本文中,作者詳細介紹了四種自動化的 ML 工具包,分別是 auto-sklearn、TPOT、HyperOpt 以及 AutoKeras。如果你對 AutoML 感興趣,這四個 Python 庫是最好的選擇。作者還在文章結(jié)尾文章對這四個工具包進行了比較。

auto-sklearn

auto-sklearn 是一個自動機器學(xué)習(xí)工具包,它與標準 sklearn 接口無縫集成,因此社區(qū)中很多人都很熟悉該工具。通過使用最近的一些方法,比如貝葉斯優(yōu)化,該庫被用來導(dǎo)航模型的可能空間,并學(xué)習(xí)推理特定配置是否能很好地完成給定任務(wù)。

該庫由 Matthias Feurer 等人提出,技術(shù)細節(jié)請查閱論文《Efficient and Robust Machine Learning》。Feurer 在這篇論文中寫道:

我們提出了一個新的、基于 scikit-learn 的魯棒 AutoML 系統(tǒng),其中使用 15 個分類器、14 種特征預(yù)處理方法和 4 種數(shù)據(jù)預(yù)處理方法,生成了一個具有 110 個超參數(shù)的結(jié)構(gòu)化假設(shè)空間。

auto-sklearn 可能最適合剛接觸 AutoML 的用戶。除了發(fā)現(xiàn)數(shù)據(jù)集的數(shù)據(jù)準備和模型選擇之外,該庫還可以從在類似數(shù)據(jù)集上表現(xiàn)良好的模型中學(xué)習(xí)。表現(xiàn)最好的模型聚集在一個集合中。

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

圖源:《Efficient and Robust Automated Machine Learning》

在高效實現(xiàn)方面,auto-sklearn 需要的用戶交互最少。使用 pip install auto-sklearn 即可安裝庫。

該庫可以使用的兩個主要類是 AutoSklearnClassifier 和 AutoSklearnRegressor,它們分別用來做分類和回歸任務(wù)。兩者具有相同的用戶指定參數(shù),其中最重要的是時間約束和集合大小。

更多 AutoSklearn 相關(guān)文檔請查閱:https://automl.github.io/auto-sklearn/master/。

TPOT

TPOT 是另一種基于 Python 的自動機器學(xué)習(xí)開發(fā)工具,該工具更關(guān)注數(shù)據(jù)準備、建模算法和模型超參數(shù)。它通過一種基于進化樹的結(jié),即自動設(shè)計和優(yōu)化機器學(xué)習(xí) pipelie 的樹表示工作流優(yōu)化(Tree-based Pipeline Optimization Tool, TPOT),從而實現(xiàn)特征選擇、預(yù)處理和構(gòu)建的自動化。

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

圖源:《Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science》 。

程序或 pipeline 用樹表示。遺傳編程(Genetic Program, GP)選擇并演化某些程序,以最大化每個自動化機器學(xué)習(xí)管道的最終結(jié)果。

正如 Pedro Domingos 所說,「數(shù)據(jù)量大的愚蠢算法勝過數(shù)據(jù)有限的聰明算法」。事實就是這樣:TPOT 可以生成復(fù)雜的數(shù)據(jù)預(yù)處理 pipeline。

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

潛在的 pipelie(圖源:TPOT 文檔)。

TPOT pipeline 優(yōu)化器可能需要幾個小時才能產(chǎn)生很好的結(jié)果,就像很多 AutoML 算法一樣(除非數(shù)據(jù)集很小)。用戶可以在 Kaggle commits 或 Google Colab 中運行這些耗時的程序。

也許 TPOT 最好的特性是它將模型導(dǎo)出為 Python 代碼文件,后續(xù)可以使用它。具體文檔和教程示例參見以下兩個鏈接:

TPOT 文檔地址:https://epistasislab.github.io/tpot/。

TPOT 的教程示例地址:https://epistasislab.github.io/tpot/examples/

HyperOpt

HyperOpt 是一個用于貝葉斯優(yōu)化的 Python 庫,由 James Bergstra 開發(fā)。該庫專為大規(guī)模優(yōu)化具有數(shù)百個參數(shù)的模型而設(shè)計,顯式地用于優(yōu)化機器學(xué)習(xí) pipeline,并可選擇在多個核心和機器上擴展優(yōu)化過程。

但是,HyperOpt 很難直接使用,因為它非常具有技術(shù)性,需要仔細指定優(yōu)化程序和參數(shù)。相反,作者建議使用 HyperOpt-sklearn,這是一個融合了 sklearn 庫的 HyperOpt 包裝器。

具體來說,HyperOpt 雖然支持預(yù)處理,但非常關(guān)注進入特定模型的幾十個超參數(shù)。就一次 HyperOpt sklearn 搜索的結(jié)果來說,它生成了一個沒有預(yù)處理的梯度提升分類器:

如何構(gòu)建 HyperOpt-sklearn 模型可以查看源文檔。它比 auto-sklearn 復(fù)雜得多,也比 TPOT 復(fù)雜一點。但是如果超參數(shù)很重要的話,它可能是值得的。

文檔地址:http://hyperopt.github.io/hyperopt-sklearn/

AutoKeras

與標準機器學(xué)習(xí)庫相比,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)功能更強大,因此更難實現(xiàn)自動化。AutoKeras 庫有哪些功效呢?具體如下:

通過 AutoKeras,神經(jīng)框架搜索算法可以找到最佳架構(gòu),如單個網(wǎng)絡(luò)層中的神經(jīng)元數(shù)量、層數(shù)量、要合并的層、以及濾波器大小或 Dropout 中丟失神經(jīng)元百分比等特定于層的參數(shù)。一旦搜索完成,用戶可以將其作為普通的 TF/Keras 模型使用;

通過 AutoKeras,用戶可以構(gòu)建一個包含嵌入和空間縮減等復(fù)雜元素的模型,這些元素對于學(xué)習(xí)深度學(xué)習(xí)過程中的人來說是不太容易訪問的;

當(dāng)使用 AutoKeras 創(chuàng)建模型時,向量化或清除文本數(shù)據(jù)等許多預(yù)處理操作都能完成并進行優(yōu)化;

初始化和訓(xùn)練一次搜索需要兩行代碼。AutoKeras 擁有一個類似于 keras 的界面,所以它并不難記憶和使用。

AutoKeras 支持文本、圖像和結(jié)構(gòu)化數(shù)據(jù),為初學(xué)者和尋求更多參與技術(shù)知識的人提供界面。AutoKeras 使用進化神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索方法來減輕研究人員的繁重和模棱兩可的工作。

盡管 AutoKeras 的運行需要很長時間,但用戶可以指定參數(shù)來控制運行時間、探索模型的數(shù)量以及搜索空間大小等。

AutoKeras 的相關(guān)內(nèi)容參閱以下兩個鏈接:

文檔地址:https://autokeras.com/

教程地址:https://towardsdatascience.com/automl-creating-top-performing-neural-networks-without-defining-architecture-c7d3b08cddc

四個庫各有特色,應(yīng)該選哪個?

用戶可以根據(jù)自己的需求選擇合適的 Python 庫,作者給出了以下幾個建議:

如果你的首要任務(wù)是獲取一個干凈、簡單的界面和相對快速的結(jié)果,選擇 auto-sklearn。另外:該庫與 sklearn 自然集成,可以使用常用的模型和方法,能很好地控制時間;

如果你的首要任務(wù)是實現(xiàn)高準確率,并且不需要考慮長時間的訓(xùn)練,則使用 TPOT。額外收獲:為最佳模型輸出 Python 代碼;

如果你的首要任務(wù)是實現(xiàn)高準確率,依然不需要考慮長時間的訓(xùn)練,也可選擇使用 HyperOpt-sklearn。該庫強調(diào)模型的超參數(shù)優(yōu)化,是否富有成效取決于數(shù)據(jù)集和算法;

如果你需要神經(jīng)網(wǎng)絡(luò)(警告:不要高估它們的能力),就使用 AutoKeras,尤其是以文本或圖像形式出現(xiàn)時。訓(xùn)練確實需要很長時間,但有很多措施可以控制時間和搜索空間大小。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    31

    文章

    5945

    瀏覽量

    90343
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3764

    瀏覽量

    52135
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137035
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    強化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    是一機器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強化
    的頭像 發(fā)表于 01-31 09:34 ?687次閱讀
    強化<b class='flag-5'>學(xué)習(xí)</b>會讓<b class='flag-5'>自動</b>駕駛<b class='flag-5'>模型</b><b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    是德示波器DSOX1202A與電腦的四種連接方式及操作步驟詳解

    是德科技(Keysight)DSOX1202A示波器作為高精度電子測量設(shè)備,廣泛應(yīng)用于電子工程、通信測試與自動化調(diào)試場景。為實現(xiàn)數(shù)據(jù)實時采集、波形分析與遠程控制,用戶需通過USB、LAN、GPIB或串口將示波器與電腦互聯(lián)。本文將結(jié)合官方指南與實操經(jīng)驗,系統(tǒng)介紹
    的頭像 發(fā)表于 01-13 17:48 ?1557次閱讀
    是德示波器DSOX1202A與電腦的<b class='flag-5'>四種</b>連接方式及操作步驟詳解

    嵌入式軟件單元測試中AI自動化與人工檢查的協(xié)同機制研究:基于專業(yè)工具的實證分析

    ? ?摘要****? 本文系統(tǒng)探討嵌入式軟件相較于通用軟件在單元測試層面的特殊性,分析其對高覆蓋率、可追溯性與實時性驗證的嚴苛需求,并以專業(yè)工具winAMS為技術(shù)載體,深入研究AI驅(qū)動的自動化測試在
    發(fā)表于 12-31 11:22

    自動化設(shè)備機器視覺檢測光源產(chǎn)品的優(yōu)勢和劣勢

    機器視覺光源,缺陷檢測,自動化視覺檢測機器視覺光源
    的頭像 發(fā)表于 11-27 10:17 ?345次閱讀
    <b class='flag-5'>自動化</b>設(shè)備<b class='flag-5'>機器</b>視覺檢測光源產(chǎn)品的優(yōu)勢和劣勢

    從入門到精通:基于開源代碼的BLE四種模式開發(fā)詳解

    通過分析BLE低功耗藍牙的四種核心工作模式,結(jié)合可下載、可修改的開放源碼,本教程為開發(fā)者提供一套系統(tǒng)、實用的開發(fā)學(xué)習(xí)路徑。 BLE(Bluetooth Low Energy): 也稱為
    的頭像 發(fā)表于 10-09 18:00 ?554次閱讀
    從入門到精通:基于開源代碼的BLE<b class='flag-5'>四種</b>模式開發(fā)詳解

    現(xiàn)代農(nóng)業(yè)自動化的技術(shù)演進與應(yīng)用

    自動化依賴多源傳感網(wǎng)絡(luò)(如土壤濕度、光照、溫濕度傳感器)實時采集環(huán)境數(shù)據(jù),結(jié)合氣象預(yù)報和作物生長模型,通過云端或邊緣計算平臺(如AI芯片)進行數(shù)據(jù)分析,
    的頭像 發(fā)表于 09-09 11:38 ?587次閱讀

    天吶!耐達訊自動化Profibus 集線器讓水質(zhì)分析徹底“改頭換面”

    悄然成為解決這一問題的關(guān)鍵角色。 耐達訊自動化Profibus 集線器是一專門用于 Profibus 網(wǎng)絡(luò)的連接設(shè)備,它能夠擴展網(wǎng)絡(luò)節(jié)點數(shù)量,增強信號傳輸能力,提高
    的頭像 發(fā)表于 08-26 15:29 ?617次閱讀
    天吶!耐達訊<b class='flag-5'>自動化</b>Profibus 集線器讓水質(zhì)<b class='flag-5'>分析</b>徹底“改頭換面”

    自動化測試如何繞過Cloudflare驗證碼?Python + Selenium 腳本實戰(zhàn)指南!

    01什么是Cloudflare驗證碼Cloudflare提供網(wǎng)絡(luò)工具,并提供一套全面的安全功能,以保護網(wǎng)站免受各種在線威脅。Cloudflare驗證碼是一用于區(qū)分人類用戶和自動化機器
    的頭像 發(fā)表于 08-15 10:01 ?1371次閱讀
    <b class='flag-5'>自動化</b>測試如何繞過Cloudflare驗證碼?Python + Selenium 腳本實戰(zhàn)指南!

    玉林在線自動測寬儀 自動化產(chǎn)線升級

    包包應(yīng)用廣泛,書包、背包、旅行包等,而包包帶子更是其重要組成部分,在自動化包包產(chǎn)線中,在線自動測寬儀可自動檢測帶寬度,剔除不合格品。并且其是光電測量原理,與材質(zhì)無關(guān),因此可適用于各種
    發(fā)表于 07-23 15:23

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是一家專注于超小型機器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了一獨特的神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 06-28 14:18

    RDMA簡介3之四種子協(xié)議對比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的網(wǎng)絡(luò)層級實現(xiàn)上有所不同,如圖1所示,接下來將
    發(fā)表于 06-04 16:05

    機器人和自動化的未來(2)

    本文是第二屆電力電子科普征文大賽的獲獎作品,來自西南交通大學(xué)黃雯珂的投稿。3機器人與自動化的未來展望隨著機器人和自動化技術(shù)的不斷進步,未來的世界將會是一個高度
    的頭像 發(fā)表于 04-26 08:33 ?846次閱讀
    <b class='flag-5'>機器</b>人和<b class='flag-5'>自動化</b>的未來(2)

    變頻器主要支持哪四種模式?有什么區(qū)別?

    變頻器作為現(xiàn)代工業(yè)自動化領(lǐng)域中的關(guān)鍵設(shè)備,其控制模式的多樣性和靈活性對于滿足不同應(yīng)用場景的需求至關(guān)重要。變頻器主要支持四種控制模式:無PG的V/F模式、有PG的V/F模式、無PG的矢量控制模式以及有
    的頭像 發(fā)表于 04-16 18:22 ?2466次閱讀
    變頻器主要支持哪<b class='flag-5'>四種</b>模式?有什么區(qū)別?

    高效解讀機器語言,profinet轉(zhuǎn)ethernet ip網(wǎng)關(guān)煙草企業(yè)自動化升級案例分析

    高效解讀機器語言,profinet轉(zhuǎn)ethernetip網(wǎng)關(guān)煙草自動化升級案例
    的頭像 發(fā)表于 04-07 15:16 ?616次閱讀
    高效解讀<b class='flag-5'>機器</b>語言,profinet轉(zhuǎn)ethernet ip網(wǎng)關(guān)煙草企業(yè)<b class='flag-5'>自動化</b>升級案例<b class='flag-5'>分析</b>

    使用 QWQ:32B 模型搭配 VSCode 的 Cline 插件實現(xiàn)自動化代碼編程!

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,概述 隨著人工智能技術(shù)的快速發(fā)展,自動化編程工具逐漸成為開發(fā)者的得力助手。QWQ:32B 模型是一先進的自然語言處理
    的頭像 發(fā)表于 03-21 18:12 ?1335次閱讀
    使用 QWQ:32B <b class='flag-5'>模型</b>搭配 VSCode 的 Cline 插件實現(xiàn)<b class='flag-5'>自動化</b>代碼編程!