91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)特征工程的五個方面優(yōu)點

汽車玩家 ? 來源:今日頭條 ? 作者:不一樣的程序猿 ? 2020-03-15 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特征工程是用數(shù)學(xué)轉(zhuǎn)換的方法將原始輸入數(shù)據(jù)轉(zhuǎn)換為用于機器學(xué)習(xí)模型的新特征。特征工程提高了機器學(xué)習(xí)模型的準(zhǔn)確度和計算效率,體現(xiàn)在以下五個方面

1、把原始數(shù)據(jù)轉(zhuǎn)換成與目標(biāo)相關(guān)的數(shù)據(jù)

我們可以使用特征工程對原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使其更接近目標(biāo)變量,轉(zhuǎn)換后的特征對目標(biāo)更有預(yù)測性。在這種情況下,雖然未加工輸入出現(xiàn)在原始數(shù)據(jù)集中,但如果將轉(zhuǎn)換后的特征作為輸入,則機器學(xué)習(xí)將提高預(yù)測的準(zhǔn)確性。

2、引入額外的數(shù)據(jù)源

特征工程可以使從業(yè)者向機器學(xué)習(xí)模型引入額外的數(shù)據(jù)源。對于首次注冊的用戶,我們可以猜測該用戶的終生價值。在眾多指標(biāo)中,我們可以捕捉每個用戶的地理位置。雖然這個數(shù)據(jù)可以直接作為分類特征(例如,IP地址和郵政編碼)提供,但模型基于這些來確定位置信息仍存在困難。

通過第三方的人口統(tǒng)計數(shù)據(jù),我們可以做的更好。例如,這將允許我們計算每個用戶區(qū)域的平均收入和人口密度,并把這些因素直接插入到訓(xùn)練集中。現(xiàn)在,這些預(yù)測性因素立即變得更容易推斷,而不是依賴模型從原始位置數(shù)據(jù)推斷這種微妙的關(guān)系。更進(jìn)一步,位置信息轉(zhuǎn)換成收入和人口密度的特征工程,可使我們估計這些位置衍生出的特征哪一個更為重要。

3、使用非結(jié)構(gòu)化的數(shù)據(jù)源

特征工程可使我們在機器學(xué)習(xí)模型中使用非結(jié)構(gòu)化的數(shù)據(jù)源。許多數(shù)據(jù)源本質(zhì)上并不是結(jié)構(gòu)化的特征向量。非結(jié)構(gòu)化數(shù)據(jù),如文本、時間序列、圖像、視頻、日志數(shù)據(jù)和點擊流等,占創(chuàng)建數(shù)據(jù)的絕大多數(shù)。特征工程使從業(yè)者從上述原始數(shù)據(jù)流中產(chǎn)生機器學(xué)習(xí)的特征向量。

4、創(chuàng)建更容易解釋的特征

特征工程使機器學(xué)習(xí)的從業(yè)者能夠創(chuàng)建更易于解釋和實用的特征。通常,使用機器學(xué)習(xí)發(fā)現(xiàn)數(shù)據(jù)中的模式,對于產(chǎn)生精確的預(yù)測十分有用,但會遇到模型的可解釋性和模型的最終應(yīng)用的一些限制。這些情況下,在驅(qū)動數(shù)據(jù)生成、鏈接原始數(shù)據(jù)和目標(biāo)變量的過程中,產(chǎn)生更有指示性的新特征,這樣更有價值。

5、用大特征集提高創(chuàng)造性

特征工程使得我們可以扔進(jìn)大量的特征,觀察它們代表了什么。我們能創(chuàng)建盡可能多的數(shù)據(jù),觀察在訓(xùn)練模型中哪些更有預(yù)測力。這使得機器學(xué)習(xí)的從業(yè)者在創(chuàng)建和測試特征時擺脫僵化心理,并能夠發(fā)現(xiàn)新的趨勢和模式。

雖然當(dāng)幾十個甚至上百個特征用于訓(xùn)練機器學(xué)習(xí)模型時,過擬合成為一個問題,但嚴(yán)謹(jǐn)?shù)奶卣鬟x擇算法,可減少特征使其易于管理。例如,我們可以自主選擇前10個特征的預(yù)測,與所有1000個特征的預(yù)測是一樣好,還是優(yōu)于后者。

特征工程

引自《機器學(xué)習(xí)實戰(zhàn)》

在機器學(xué)習(xí)應(yīng)用領(lǐng)域中,特征工程扮演著非常重要的角色,可以說特征工程是機器學(xué)習(xí)應(yīng)用的基礎(chǔ)。在機器學(xué)習(xí)業(yè)界流傳著這樣一句話:“數(shù)據(jù)和特征決定了機器學(xué)習(xí)算法的上限,而模型和算法只是不斷逼近而已?!痹跈C器學(xué)習(xí)應(yīng)用中,特征工程介于“數(shù)據(jù)”和“模型”之間,特征工程是使用數(shù)據(jù)的專業(yè)領(lǐng)域知識創(chuàng)建能夠使機器學(xué)習(xí)算法工作的特征的過程,而好的數(shù)據(jù)勝于多的數(shù)據(jù)。美國計算機科學(xué)家Peter Norvig有兩句經(jīng)典名言:“基于大量數(shù)據(jù)的簡單模型勝于少量數(shù)據(jù)的復(fù)雜模型?!币约啊案嗟臄?shù)據(jù)勝于聰明的算法,而好的數(shù)據(jù)勝于多的數(shù)據(jù)。”因此,特征工程的前提是收集足夠多的數(shù)據(jù),其次是從大量數(shù)據(jù)中提取關(guān)鍵信息并表示為模型所需要的形式。合適的特征可以讓模型預(yù)測更加容易,機器學(xué)習(xí)應(yīng)用更有可能成功。

引自《美團(tuán)機器學(xué)習(xí)》

在監(jiān)督機器學(xué)習(xí)過程中,我們使用數(shù)據(jù)教自動系統(tǒng)如何做出準(zhǔn)確的決策。機器學(xué)習(xí)算法被設(shè)計成發(fā)現(xiàn)模式和歷史訓(xùn)練數(shù)據(jù)間的聯(lián)系;它們從數(shù)據(jù)中學(xué)習(xí)并將學(xué)習(xí)結(jié)果編碼到模型中,從而對新數(shù)據(jù)的重要屬性做出準(zhǔn)確的預(yù)測。因此,訓(xùn)練數(shù)據(jù)是機器學(xué)習(xí)中的基本問題。有了高質(zhì)量的數(shù)據(jù),就可以捕捉到細(xì)微的差別和關(guān)聯(lián)關(guān)系,從而建立高保真的預(yù)測系統(tǒng)。相反,若訓(xùn)練數(shù)據(jù)質(zhì)量不佳,則再好的機器學(xué)習(xí)算法也無濟(jì)于事。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實踐以及業(yè)務(wù)理解等多個方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運算、
    發(fā)表于 02-27 10:53

    機器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?329次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>特征</b><b class='flag-5'>工程</b>:分類變量的數(shù)值化處理方法

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?184次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    方面幫您分辨光纜是否優(yōu)質(zhì)?

    光纜是由纜芯、加強鋼絲、填充物和護(hù)套等幾部分組成,另外根據(jù)需要還有防水層、緩沖層、絕緣金屬導(dǎo)線等構(gòu)件。 方面幫您分辨光纜是否優(yōu)質(zhì)? 1、填充物油膏:它是存在于松套管中的物質(zhì),主要含有纖膏與纜膏
    的頭像 發(fā)表于 12-25 10:05 ?48次閱讀

    工程師實戰(zhàn)指南:關(guān)于離子捕捉劑應(yīng)用的關(guān)鍵問題與解答

    在考慮使用離子捕捉劑時,工程師們常有一些具體的實操疑問。本文收集了最具代表性的問題,并結(jié)合東亞合成IXE系列的產(chǎn)品特性,給出清晰的技術(shù)解答,為您掃清應(yīng)用障礙。
    的頭像 發(fā)表于 12-08 16:38 ?336次閱讀
    <b class='flag-5'>工程</b>師實戰(zhàn)指南:關(guān)于離子捕捉劑應(yīng)用的<b class='flag-5'>五</b><b class='flag-5'>個</b>關(guān)鍵問題與解答

    自動駕駛中常提的“強化學(xué)習(xí)”是啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強化學(xué)習(xí)是一類讓機器通過試錯來學(xué)會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?662次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學(xué)習(xí)</b>”是<b class='flag-5'>個</b>啥?

    大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些優(yōu)點和缺點

    大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些優(yōu)點和缺點
    的頭像 發(fā)表于 09-28 16:50 ?818次閱讀
    <b class='flag-5'>五</b>大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些<b class='flag-5'>優(yōu)點</b>和缺點

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點和缺點

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點和缺點
    的頭像 發(fā)表于 09-04 17:09 ?991次閱讀
    <b class='flag-5'>五</b>大海上安全事件應(yīng)急處置系統(tǒng):有哪些<b class='flag-5'>優(yōu)點</b>和缺點

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】 + 04 + 機器學(xué)習(xí)YOLO體驗

    、 機器學(xué)習(xí)YOLO體驗 1.在線訓(xùn)練 Sipeed矽速科技擁有自研搭建的MaixHub平臺,可以快速簡單的完成yolo訓(xùn)練。 下面我將展示訓(xùn)練集拍攝標(biāo)注和訓(xùn)練的相關(guān)圖片 數(shù)據(jù)集有直接上傳和拍攝2種
    發(fā)表于 07-24 21:35

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    ,越來越多地被應(yīng)用于機器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢。
    的頭像 發(fā)表于 07-16 15:34 ?2885次閱讀

    電子硬件工程師如何從零開始學(xué)習(xí)?(文末免費分享從零開始學(xué)習(xí)資料)

    經(jīng)常有用戶咨詢,如何學(xué)習(xí)和提升電子硬件能力,有沒有適合小白學(xué)習(xí)的資料等等;電子硬件工程師是一結(jié)合理論、實踐和創(chuàng)新能力的職業(yè),需要掌握電路設(shè)計、元器件選型、PCB設(shè)計、嵌入式系統(tǒng)、測試
    的頭像 發(fā)表于 06-04 07:36 ?2174次閱讀
    電子硬件<b class='flag-5'>工程</b>師如何從零開始<b class='flag-5'>學(xué)習(xí)</b>?(文末免費分享從零開始<b class='flag-5'>學(xué)習(xí)</b>資料)

    玻璃通孔技術(shù)的獨特優(yōu)勢

    TGV(Through Glass Via)工藝之所以選擇在玻璃上打孔,主要是因為玻璃在以下方面相較于硅具有獨特優(yōu)勢。
    的頭像 發(fā)表于 05-23 16:32 ?1088次閱讀
    玻璃通孔技術(shù)的<b class='flag-5'>五</b><b class='flag-5'>個</b>獨特優(yōu)勢

    SOLIDWORKS教育版——全方面學(xué)習(xí)資源與教程

    功能,更以其全方面學(xué)習(xí)資源與教程,為學(xué)生構(gòu)建了一從理論到實踐、從基礎(chǔ)到進(jìn)階的完整學(xué)習(xí)體系。本文將深入探討SOLIDWORKS教育版如何憑借其豐富的
    的頭像 發(fā)表于 04-23 11:03 ?877次閱讀
    SOLIDWORKS教育版——全<b class='flag-5'>方面</b>的<b class='flag-5'>學(xué)習(xí)</b>資源與教程

    機器視覺系統(tǒng)中如何評價光源的好壞

    從對比度、魯棒性、亮度、均勻性和可維護(hù)性方面探討了光源在機器視覺系統(tǒng)中的重要性。
    的頭像 發(fā)表于 04-14 13:38 ?669次閱讀

    面向AI與機器學(xué)習(xí)應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機器學(xué)習(xí)應(yīng)用的開發(fā)平臺,專為邊緣計算場景優(yōu)化設(shè)計。以下從核心配置、技術(shù)特性、應(yīng)用場景及開發(fā)支持等方面進(jìn)行詳細(xì)
    的頭像 發(fā)表于 04-11 18:33 ?2428次閱讀
    面向AI與<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280