91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)的回歸分析和回歸方法

汽車玩家 ? 來源:智能算法 ? 作者:智能算法 ? 2020-01-19 17:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

根據(jù)受歡迎程度,線性回歸和邏輯回歸經(jīng)常是我們做預(yù)測模型時(shí),且第一個(gè)學(xué)習(xí)的算法。但是如果認(rèn)為回歸就兩個(gè)算法,就大錯(cuò)特錯(cuò)了。事實(shí)上我們有許多類型的回歸方法可以去建模。每一個(gè)算法都有其重要性和特殊性。

內(nèi)容

1.什么是回歸分析?

2.我們?yōu)槭裁匆褂没貧w分析?

3.回歸有哪些類型 ?

4.線性回歸

5.邏輯回歸

6.多項(xiàng)式回歸

7.逐步回歸

8.嶺回歸

9.Lasso回歸

10.ElasticNet回歸

什么是回歸分析?

回歸分析是研究自變量和因變量之間關(guān)系的一種預(yù)測模型技術(shù)。這些技術(shù)應(yīng)用于預(yù)測,時(shí)間序列模型和找到變量之間關(guān)系。例如可以通過回歸去研究超速與交通事故發(fā)生次數(shù)的關(guān)系。

我們?yōu)槭裁匆没貧w分析?

這里有一些使用回歸分析的好處:它指示出自變量與因變量之間的顯著關(guān)系;它指示出多個(gè)自變量對因變量的影響?;貧w分析允許我們比較不同尺度的變量,例如:價(jià)格改變的影響和宣傳活動的次數(shù)。這些好處可以幫助市場研究者/數(shù)據(jù)分析師去除和評價(jià)用于建立預(yù)測模型里面的變量。

回歸有哪些類型?

我們有很多種回歸方法用預(yù)測。這些技術(shù)可通過三種方法分類:自變量的個(gè)數(shù)、因變量的類型和回歸線的形狀。

1.線性回歸

線性回歸可謂是世界上最知名的建模方法之一,也是應(yīng)該是我們第一個(gè)接觸的模型。在模型中,因變量是連續(xù)型的,自變量可以使連續(xù)型或離散型的,回歸線是線性的。

線性回歸用最適直線(回歸線)去建立因變量Y和一個(gè)或多個(gè)自變量X之間的關(guān)系??梢杂霉絹肀硎荆?/p>

Y=a+b*X+e

a為截距,b為回歸線的斜率,e是誤差項(xiàng)。

簡單線性回歸與多元線性回歸的差別在于:多元線性回歸有多個(gè)(》1)自變量,而簡單線性回歸只有一個(gè)自變量。到現(xiàn)在我們的問題就是:如何找到那條回歸線?

我們可以通過最小二乘法把這個(gè)問題解決。其實(shí)最小二乘法就是線性回歸模型的損失函數(shù),只要把損失函數(shù)做到最小時(shí)得出的參數(shù),才是我們最需要的參數(shù)。

我們一般用決定系數(shù)(R方)去評價(jià)模型的表現(xiàn)。

重點(diǎn):

1.自變量與因變量之間必須要有線性關(guān)系。

2.多重共線性、自相關(guān)和異方差對多元線性回歸的影響很大。

3.線性回歸對異常值非常敏感,其能嚴(yán)重影響回歸線,最終影響預(yù)測值。

4.在多元的自變量中,我們可以通過前進(jìn)法,后退法和逐步法去選擇最顯著的自變量。

2. 邏輯回歸

邏輯回歸是用來找到事件成功或事件失敗的概率。當(dāng)我們的因變量是二分類(0/1,True/False,Yes/No)時(shí)我們應(yīng)該使用邏輯回歸。

重點(diǎn):

1.在分類問題中使用的非常多。

2.邏輯回歸因其應(yīng)用非線性log轉(zhuǎn)換方法,使得其不需要自變量與因變量之間有線性關(guān)系。

3.為防止過擬合和低擬合,我們應(yīng)該確保每個(gè)變量是顯著的。應(yīng)該使用逐步回歸方法去估計(jì)邏輯回歸。

4.邏輯回歸需要大樣本量,因?yàn)樽畲笏迫还烙?jì)在低樣本量的情況下表現(xiàn)不好。

5.要求沒有共線性。

6.如果因變量是序數(shù)型的,則稱為序數(shù)型邏輯回歸。

7.如果因變量有多個(gè),則稱為多項(xiàng)邏輯回歸。

3. 多項(xiàng)式回歸

如果一個(gè)回歸,它的自變量指數(shù)超過1,則稱為多項(xiàng)式回歸。可以用公式表示:

y = a + b * x^2

在這個(gè)回歸技術(shù)中,最適的線不是一條直線,而是一條曲線。

重點(diǎn):

① 很多情況下,我們?yōu)榱私档驼`差,經(jīng)常會抵制不了使用多項(xiàng)式回歸的誘惑,但事實(shí)是,我們經(jīng)常會造成過擬合。所以要經(jīng)常的把數(shù)據(jù)可視化,觀察數(shù)據(jù)與模型的擬合程度。

② 特別是要看曲線的結(jié)尾部分,看它的形狀和趨勢是否有意義。高的多項(xiàng)式往往會產(chǎn)生特別古怪的預(yù)測值。

4. 逐步回歸

當(dāng)我們要處理多個(gè)自變量時(shí),我們就需要這個(gè)回歸方法。在這個(gè)方法中選擇變量都是通過自動過程實(shí)現(xiàn)的,不需要人的干預(yù)。

這個(gè)工程是通過觀察統(tǒng)計(jì)值,比如判定系數(shù),t值和最小信息準(zhǔn)則等去篩選變量。逐步回歸變量一般是基于特定的標(biāo)準(zhǔn)加入或移除變量來擬合回歸模型。

一些常用的逐步回歸方法如下:

1. 標(biāo)準(zhǔn)逐步回歸做兩件事情。只要是需要每一步它都會添加或移除一些變量。

2. 前進(jìn)法是開始于最顯著的變量然后在模型中逐漸增加次顯著變量。

3. 后退法是開始于所有變量,然后逐漸移除一些不顯著變量。

4. 這個(gè)模型技術(shù)的目的是為了用最少的變量去最大化模型的預(yù)測能力。它也是一種降維技術(shù)。

5. 嶺回歸

當(dāng)碰到數(shù)據(jù)有多重共線性時(shí),我們就會用到嶺回歸。所謂多重共線性,簡單的說就是自變量之間有高度相關(guān)關(guān)系。在多重共線性中,即使是最小二乘法是無偏的,它們的方差也會很大。通過在回歸中加入一些偏差,嶺回歸酒會減少標(biāo)準(zhǔn)誤差。

‘嶺回歸是一種專用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì)法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價(jià)獲得回歸系數(shù)更為符合實(shí)際、更可靠的回歸方法,對病態(tài)數(shù)據(jù)的擬合要強(qiáng)于最小二乘法。’ ---百度百科

嶺回歸是通過嶺參數(shù)λ去解決多重共線性的問題??聪旅娴墓剑?/p>

機(jī)器學(xué)習(xí)的回歸分析和回歸方法

其中l(wèi)oss為損失函數(shù),penalty為懲罰項(xiàng)。

重點(diǎn):

1.嶺回歸的假設(shè)與最小二乘法回歸的假設(shè)相同除了假設(shè)正態(tài)性。

2.它把系數(shù)的值收縮了,但是不會為0.

3.正則化方法是使用了l2正則。

6. LASSO回歸

和嶺回歸類似,Lasso(least Absolute Shrinkage and Selection Operator)也是通過懲罰其回歸系數(shù)的絕對值??聪旅娴墓剑?/p>

機(jī)器學(xué)習(xí)的回歸分析和回歸方法

Lasso回歸和嶺回歸不同的是,Lasso回歸在懲罰方程中用的是絕對值,而不是平方。這就使得懲罰后的值可能會變成0.

重點(diǎn):

1.其假設(shè)與最小二乘回歸相同除了正態(tài)性。

2.其能把系數(shù)收縮到0,使得其能幫助特征選擇。

3.這個(gè)正則化方法為l1正則化。

4.如果一組變量是高度相關(guān)的,lasso會選擇其中的一個(gè),然后把其他都變?yōu)?.

7. ElasticNet回歸

ElasticNet回歸是Lasso回歸和嶺回歸的組合。它會事先訓(xùn)練L1和L2作為懲罰項(xiàng)。當(dāng)許多變量是相關(guān)的時(shí)候,Elastic-net是有用的。Lasso一般會隨機(jī)選擇其中一個(gè),而Elastic-net則會選在兩個(gè)。

機(jī)器學(xué)習(xí)的回歸分析和回歸方法

與Lasso和嶺回歸的利弊比較,一個(gè)實(shí)用的優(yōu)點(diǎn)就是Elastic-Net會繼承一些嶺回歸的穩(wěn)定性。

重點(diǎn):

1.在選擇變量的數(shù)量上沒有限制

2.雙重收縮對其有影響

3.除了這7個(gè)常用的回歸技術(shù),你也可以看看貝葉斯回歸、生態(tài)學(xué)回歸和魯棒回歸。

如何選擇回歸模型?

面對如此多的回歸模型,最重要的是根據(jù)自變量因變量的類型、數(shù)據(jù)的維數(shù)和其他數(shù)據(jù)的重要特征去選擇最合適的方法。以下是我們選擇正確回歸模型時(shí)要主要考慮的因素:

1.數(shù)據(jù)探索是建立預(yù)測模型不可或缺的部分。它應(yīng)該是在選擇正確模型之前要做的。

2.為了比較不同模型的擬合程度,我們可以分析不同的度量,比如統(tǒng)計(jì)顯著性參數(shù)、R方、調(diào)整R方、最小信息標(biāo)準(zhǔn)、BIC和誤差準(zhǔn)則。另一個(gè)是Mallow‘s Cp準(zhǔn)則。

3.交叉驗(yàn)證是驗(yàn)證預(yù)測模型最好的方法。你把你的數(shù)據(jù)集分成兩組:一組用于訓(xùn)練,一組用于驗(yàn)證。

4.如果你的數(shù)據(jù)集有許多讓你困惑的變量,你就不應(yīng)該用自動模型選擇方法,因?yàn)槟悴幌氚堰@些變量放在模型當(dāng)中。

5.不強(qiáng)大的模型往往容易建立,而強(qiáng)大的模型很難建立。

6.回歸正則方法在高維度和多重共線性的情況下表現(xiàn)的很好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    :自動化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團(tuán)隊(duì)協(xié)作開發(fā)(如分支管理、代碼合并)。 機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決
    發(fā)表于 02-27 10:53

    機(jī)器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?329次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:分類變量的數(shù)值化處理<b class='flag-5'>方法</b>

    4種神經(jīng)網(wǎng)絡(luò)不確定性估計(jì)方法對比與代碼實(shí)現(xiàn)

    回歸任務(wù)在實(shí)際應(yīng)用中隨處可見——天氣預(yù)報(bào)、自動駕駛、醫(yī)療診斷、經(jīng)濟(jì)預(yù)測、能耗分析,但大部分回歸模型只給出一個(gè)預(yù)測值,對這個(gè)值到底有多靠譜卻只字不提。這在某些應(yīng)用場景下會造成很多問題,比如用模型預(yù)測
    的頭像 發(fā)表于 11-10 10:41 ?487次閱讀
    4種神經(jīng)網(wǎng)絡(luò)不確定性估計(jì)<b class='flag-5'>方法</b>對比與代碼實(shí)現(xiàn)

    數(shù)聚現(xiàn)場 | 浙商回歸,數(shù)聚股份以一站式數(shù)字方案回哺家鄉(xiāng)企業(yè)“數(shù)轉(zhuǎn)智改”

    在浙江這片民營經(jīng)濟(jì)沃土上,越來越多從浙江走出去的精英,正帶著前沿技術(shù)與創(chuàng)新理念回歸,投身于家鄉(xiāng)的數(shù)字化建設(shè)大潮。上海數(shù)聚軟件系統(tǒng)股份有限公司(簡稱:數(shù)聚股份)創(chuàng)始人陳慶華先生出生于湖州德清,帶領(lǐng)公司
    的頭像 發(fā)表于 09-26 15:32 ?220次閱讀

    46歲老將回歸,霍尼韋爾宣布重大人事變動

    正式生效。 劉彼得(Peter Lau)今年46歲,曾擔(dān)任霍尼韋爾安防、消防與電氣產(chǎn)品事業(yè)部總裁,此次回歸將接替路成(Lucian Boldea),后者將于本月底離任以尋求新的職業(yè)發(fā)展機(jī)會。 劉彼得最近擔(dān)任
    的頭像 發(fā)表于 08-28 18:59 ?1789次閱讀
    46歲老將<b class='flag-5'>回歸</b>,霍尼韋爾宣布重大人事變動

    【GUI設(shè)計(jì)】顏色對GUI的影響

    【LabviewGUI】顏色對GUI的影響 GUI最后一期了 后面回歸主線
    發(fā)表于 08-26 04:51

    基于卡爾曼濾波的無刷電機(jī)轉(zhuǎn)矩脈動抑制研究

    數(shù)據(jù)處理算法,卡爾曼濾波器同時(shí)具備良好的濾波特性。因此文章在分析永磁無刷直流電動機(jī)數(shù)學(xué)模型的基礎(chǔ)上,提出了一種基于卡爾曼濾波的無刷直流電機(jī)轉(zhuǎn)矩脈動抑制方法。利用 Madab/simuink 對此方法進(jìn)行了
    發(fā)表于 07-29 16:13

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2885次閱讀

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?

    從簡單的AI應(yīng)用入手,如使用機(jī)器學(xué)習(xí)算法進(jìn)行房價(jià)預(yù)測。收集當(dāng)?shù)胤績r(jià)的相關(guān)數(shù)據(jù),包括面積、房齡、周邊設(shè)施等信息,然后選擇合適的回歸算法(如線性回歸)來建立模型,通過不斷調(diào)整參數(shù)和優(yōu)化模
    發(fā)表于 07-08 17:44

    【嘉楠堪智K230開發(fā)板試用體驗(yàn)】K230機(jī)器視覺相關(guān)功能體驗(yàn)

    、畫十字交叉、寫字符等多種操作。具體使用方法參考官方教程機(jī)器學(xué)習(xí)-畫圖 圖像檢測 K230能夠使用MicroPython進(jìn)行邊緣檢測、線段檢測、圓形檢測、矩形檢測、快速線性回歸。官方在
    發(fā)表于 07-08 17:25

    瑞之辰:國內(nèi)芯片須踏實(shí)前行,回歸技術(shù)本質(zhì)

    迷人眼的宣傳中,深圳市瑞之辰科技卻清醒地意識到:突破源于技術(shù)!芯片行業(yè)發(fā)展道阻且長,唯有腳踏實(shí)地,加大研發(fā)投入,回歸技術(shù)本質(zhì),才能具備真正的競爭力。死磕工藝,國產(chǎn)
    的頭像 發(fā)表于 06-11 16:50 ?1032次閱讀
    瑞之辰:國內(nèi)芯片須踏實(shí)前行,<b class='flag-5'>回歸</b>技術(shù)本質(zhì)

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識。
    的頭像 發(fā)表于 05-16 14:48 ?1435次閱讀
    使用MATLAB進(jìn)行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>

    地平線CEO余凱:智能駕駛應(yīng)回歸理性

    更加理性地發(fā)展,并不會拖慢智能輔助駕駛技術(shù)的發(fā)展速度,反而會發(fā)展得更快。我們還是要把更多的精力放在輔助駕駛上,把安全作為第一位,不要一味地追自動駕駛。所以這次工業(yè)和信息化部收緊監(jiān)管,是讓整個(gè)行業(yè)回歸到正常軌道;?而前
    的頭像 發(fā)表于 04-27 11:34 ?651次閱讀

    十大鮮為人知卻功能強(qiáng)大的機(jī)器學(xué)習(xí)模型

    本文轉(zhuǎn)自:QuantML當(dāng)我們談?wù)?b class='flag-5'>機(jī)器學(xué)習(xí)時(shí),線性回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這些常見的算法往往占據(jù)了主導(dǎo)地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強(qiáng)大的算法,它們能夠以驚人的效率
    的頭像 發(fā)表于 04-02 14:10 ?1093次閱讀
    十大鮮為人知卻功能強(qiáng)大的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>模型

    端到端自動駕駛多模態(tài)軌跡生成方法GoalFlow解析

    自動駕駛軌跡規(guī)劃往往采用直接回歸軌跡的方法,這種方式雖在測試中能取得不錯(cuò)的性能,可直接輸出當(dāng)前場景下最有可能的軌跡或控制,但它難以對自動駕駛場景中常見的多模態(tài)動作分布進(jìn)行有效建模。
    的頭像 發(fā)表于 03-18 17:59 ?1530次閱讀
    端到端自動駕駛多模態(tài)軌跡生成<b class='flag-5'>方法</b>GoalFlow解析