91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

時間序列分析的定義

數(shù)據(jù)分析與開發(fā) ? 來源:一個數(shù)據(jù)人的自留地 ? 作者:數(shù)據(jù)人創(chuàng)作者聯(lián)盟 ? 2022-03-16 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

時間序列分析的定義

1.1

概念

首先,時間序列定義為在一定時間間隔內(nèi)按時間順序測量的某個數(shù)量。時間序列分析是指將歷史數(shù)據(jù)分解為四部分來看——趨勢、周期、時期和不穩(wěn)定因素,然后綜合這些因素,提出預測。時間序列分為平穩(wěn)序列和非平穩(wěn)序列兩大類。平穩(wěn)序列是不存在趨勢只存在隨機性的序列,非平穩(wěn)序列則是包含趨勢、季節(jié)性和隨機性的序列。

從最廣泛的形式來說,時間序列分析是關(guān)于推斷過去一系列數(shù)據(jù)點發(fā)生了什么,并試圖預測未來會發(fā)生什么。時間序列分析試圖了解過去并預測未來。

1.2

分類

通常,時間序列通常包含以下類型:

1、趨勢-趨勢是時間序列中一致的方向性運動。這些趨勢將是確定性的或隨機的。時間序列在長時間內(nèi)呈現(xiàn)出來的長期上升或下降的變動;

2、季節(jié)性變化-許多時間序列都包含季節(jié)性變化。在代表業(yè)務銷售或氣候水平的系列中尤其如此。我們經(jīng)??吹?a target="_blank">商品的季節(jié)性變化,特別是那些與生長季節(jié)或年度溫度變化有關(guān)的商品(例如天然氣)。

3、序列依賴性-時間序列(尤其是金融序列)最重要的特征之一就是序列相關(guān)性。當時間上相互靠近的時間序列觀測值傾向于相互關(guān)聯(lián)時,就會發(fā)生這種情況。

02

時間序列分析的步驟

時間序列預測的步驟是:

fe4a328e-9752-11ec-952b-dac502259ad0.jpg

在開始平穩(wěn)性檢驗步驟之前,我首先想和大家分享的是平穩(wěn)性檢驗的目的。平穩(wěn)性檢驗為了確定沒有隨機趨勢或確定趨勢,否則將會產(chǎn)生“偽回歸”問題.偽回歸是說,有時數(shù)據(jù)的高度相關(guān)僅僅是因為二者同時隨時間有向上或向下的變動趨勢, 并沒有真正聯(lián)系.這樣數(shù)據(jù)中的趨勢項,季節(jié)項等無法消除, 從而在殘差分析中無法準確進行分析。

2.1

平穩(wěn)性檢驗

(一)圖示法

平穩(wěn)性指的是期望不變,方差恒定,協(xié)方差不隨時間改變,協(xié)方差只依賴于K這個時間跨度,不依賴于時間點t本身。

fe63d856-9752-11ec-952b-dac502259ad0.jpgfe70d31c-9752-11ec-952b-dac502259ad0.jpgfe922b8e-9752-11ec-952b-dac502259ad0.jpg

給定這些假設(shè)前提的目的是便于后續(xù)技術(shù)上的處理。根據(jù)時序圖粗略來判斷序列是否平穩(wěn),平穩(wěn)時序圖的特征為圍繞均值不斷波動,而非平穩(wěn)時序圖表現(xiàn)為在不同時間段具有不同的均值。圖a為平穩(wěn)時序圖,圖b為非平穩(wěn)時序圖。

fea3d15e-9752-11ec-952b-dac502259ad0.jpg

然而僅依靠圖像判斷時間序列的平穩(wěn)性,肯定是不精確的,因此需要進行單位根檢驗(DF檢驗和ADF檢驗)進一步判斷。

(二)單位根檢驗

1、DF檢驗

fecc97ec-9752-11ec-952b-dac502259ad0.png

fee33434-9752-11ec-952b-dac502259ad0.png

(原假設(shè) H0:序存在單位根 ,即參數(shù)δ=0)

檢驗時間序列的平穩(wěn)性,一般可通過檢驗帶有截距項的一階自回歸模型:

fef8d03c-9752-11ec-952b-dac502259ad0.png

對上式可通過進行普通最小二乘法的t檢驗完成(t檢驗的原假設(shè):H0:βj=0。即若P值<0.05,則拒絕原假設(shè),證明δ≠0,序列平穩(wěn)。

2、ADF檢驗 因DF檢驗假設(shè)ut為白噪聲,序列為一階自回歸的模型,但實際上隨機干擾項并非為白噪聲序列,且序列并非為一階自回歸生成,因此用普通最小二乘法進行估計的t統(tǒng)計量會受到無關(guān)參數(shù)的影響,導致DF檢驗無效。

如果時間序列包含有明顯的隨時間變化的某種趨勢,DF檢驗必須保證能夠剔除這種趨勢,否則時間趨勢的成分會進入ut,導致ut非白噪聲序列,進而偏離了最初的假設(shè)。因此形成了ADF檢驗。ADF檢驗是由下面3個模型完成:

ff046ff0-9752-11ec-952b-dac502259ad0.png

其中t為時間變量,代表序列隨時間變化的趨勢。

模型的檢驗原理同DF檢驗,即t檢驗;檢驗順序為(3)、(2)、(1);三個模型全部檢驗通過,才能證明該序列是平穩(wěn)時間序列。

2.2

時間序列常見的三種模型

序列通過平穩(wěn)性檢驗后,就可以建立時間序列模型了,當序列不平穩(wěn)時,對序列進行差分或者取對數(shù)處理。對時序數(shù)據(jù)進行差分處理,例如在R語言的“diff”函數(shù)可確定(P值<0.05,則拒絕原假設(shè),序列不存在單位根,經(jīng)1階差分后,序列平穩(wěn))。

對一個時間序列預處理后檢驗出該序列為平穩(wěn)時間序列說明該模型有提取信息的價值,就要進行下一步的模型建立來擬合該模型然后做出預測。下面介紹擬合時間序列的三個重要模型。

(一)AR(p)模型

自回歸模型(Autoregressive model,簡稱AR模型),用同一變數(shù)例如x的之前各期,亦即x1至xt-1來預測本期xt的表現(xiàn),并假設(shè)它們?yōu)橐淮尉€性關(guān)系。因為這是從回歸分析中的線性回歸發(fā)展而來,只是不用x預測y,而是用x預測 x(自己);所以叫做自回歸。

AR(p)模型簡記形式如下: ff1bf1c0-9752-11ec-952b-dac502259ad0.png 其中p為自回歸階數(shù)。Φ0=0稱為中心化AR(p)模型。p階自回歸模型的自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)p階截尾。

(二)MA(q)模型 MA模型(moving average model)移動平均模型,簡記形式如下:

ff37d048-9752-11ec-952b-dac502259ad0.png

其中q為移動平均的階數(shù)。q階移動平均模型自相關(guān)系數(shù)q階截尾,偏自相關(guān)系數(shù)拖尾。

(三)ARMA(p,q)模型 自回歸滑動平均模型(Autoregressive moving average model,簡稱:ARMA模型)。是研究時間序列的重要方法,由自回歸模型(簡稱AR模型)與移動平均模型(簡稱MA模型)為基礎(chǔ)“混合”構(gòu)成。它比AR模型法與MA模型法估計更精確,但其參數(shù)估算比較繁瑣。ARMA(p,q)模型簡記形式如下:

ff46686a-9752-11ec-952b-dac502259ad0.png

當q=0時,ARMA(p,q)模型就退化成了AR(p)模型;

當p=0時,ARMA(p,q)模型就退化成了MA(q)模型;

ARMA(p,q)模型具有自相關(guān)系數(shù)不截尾,偏自相關(guān)系數(shù)也不截尾的性質(zhì)。

2.3

模型的選擇與定階

了解了時間序列的三種常見模型后,應該如何選擇模型并確定模型的階數(shù)呢?通常使用ACF與PACF圖判定法。

說到時間序列分析,一定離不開自相關(guān)函數(shù)(auto-correlation function,ACF)和偏自相關(guān)函數(shù)(Partial auto-correlation function,PACF),ACF可以提供具有滯后值的任何序列的自相關(guān)值。

簡單來說,它描述了該序列的當前值與其過去的值之間的相關(guān)程度。時間序列可以包含趨勢,季節(jié)性,周期性和殘差等成分。ACF在尋找相關(guān)性時會考慮所有這些成分。直觀上來說,ACF 描述了一個觀測值和另一個觀測值之間的自相關(guān),包括直接和間接的相關(guān)性信息。

PACF可以提供殘差(在去除了之前的滯后已經(jīng)解釋的影響之后仍然存在)與下一個滯后值的相關(guān)性。因此,如果殘差中有任何可以由下一個滯后建模的隱藏信息,我們可能會獲得良好的相關(guān)性,并且在建模時我們會將下一個滯后作為特征。

討論完兩個重要函數(shù)后,就成功了一半,接下來就是選擇模型和確定階數(shù)了,由此引入兩個詞:截尾和拖尾。

截尾是指時間序列的自相關(guān)函數(shù)(ACF)或偏自相關(guān)函數(shù)(PACF)在大于某個常數(shù)k后快速趨于0為k階截尾;拖尾是ACF或PACF始終有非零取值,不會在k大于某個常數(shù)后就恒等于零(或在0附近隨機波動)。趨于0在實際分析過程中通常被處理為在2倍標準差之內(nèi)。

ff5ebab4-9752-11ec-952b-dac502259ad0.png

ff710ac0-9752-11ec-952b-dac502259ad0.png

以上面兩張圖為例,ACF拖尾,PACF一階截尾,因此可以選擇AR(1)模型進行擬合,說到模型擬合,各位統(tǒng)計學前輩早已為我們總結(jié)好以下規(guī)律:

ff84bc32-9752-11ec-952b-dac502259ad0.png

2.4

模型的確定與檢驗

通過以上內(nèi)容,大家對時間序列的三種模型有了初步了解。那么應該如何確定最優(yōu)模型呢?通常有以下幾點:

(1)同一種模型,在盡可能描述數(shù)據(jù)信息的前提下選擇低階模型,階數(shù)越高,模型會越復雜

(2)高階AR(p)、MA(q)模型與較低階ARMA(p,q)模型之間選擇較低階ARMA(p,q)模型

(3)合適模型的殘差應滿足均值為零的正態(tài)分布,而且任何滯后階數(shù)的殘差相關(guān)系數(shù)都為零。

接下來分享的是殘差檢驗的方法:

方法一:通過繪制正態(tài)分布的QQ來檢驗:圖像近似為過原點的一條直線,則殘差服從正態(tài)分布且均值為零。該步驟可通過R語言的“qqnormt”函數(shù)實現(xiàn)。如下圖:

ff973e34-9752-11ec-952b-dac502259ad0.jpg

方法二:通過R語言的“Box.test”函數(shù)實現(xiàn)該檢驗,若P>0.05,接受原假設(shè),即任何滯后階數(shù)的殘差都不相關(guān),殘差檢驗通過。

03

示例分享

回到開頭的例子,當小毛同學拿到數(shù)據(jù)后首先應該繪制銷售額隨時間變化的曲線,觀察數(shù)據(jù)的整體趨勢,如果有季節(jié)性趨勢,應該利用差分或者移動平均的方法消除季節(jié)因素,接下來在消除增長趨勢,然后利用單位根檢驗來檢驗數(shù)據(jù)的平穩(wěn)性,最后利用數(shù)據(jù)的ACF和PACF函數(shù)確定階數(shù)和模型。

其實在這一步有一種偷懶的辦法就是利用R語言中的auto.arima”函數(shù)可自動篩選出p,q,但還是希望大家能夠了解背后的邏輯。模型確定好之后可以利用R語言中的forecast函數(shù)預測未來N期的銷量,至此小毛的預測工作終于可以告一段落了。

本次分享到此結(jié)束,歡迎大家批評指正~

審核編輯:何安

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 序列
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    20207

原文標題:時間序列分析淺談

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    JSON:簡潔代碼高效搞定序列化與反序列

    面對頻繁的數(shù)據(jù)交互需求,用最簡方式實現(xiàn)JSON序列化與反序列化已成為開發(fā)者必備技能,借助主流庫,輕松實現(xiàn)零負擔數(shù)據(jù)轉(zhuǎn)換。JSON(JavaScriptObjectNotation)是一種輕量級
    的頭像 發(fā)表于 02-25 19:04 ?89次閱讀
    JSON:簡潔代碼高效搞定<b class='flag-5'>序列</b>化與反<b class='flag-5'>序列</b>化

    極簡代碼,搞定JSON序列化與反序列

    快速實現(xiàn)JSON數(shù)據(jù)的生成(序列化)與解析(反序列化)。 目前json庫已全面支持LuatOS開發(fā)系列產(chǎn)品,開發(fā)者可根據(jù)項目實際需求,靈活選用并進行快速集成與開發(fā)。 一、 JSON基礎(chǔ)要點 在
    的頭像 發(fā)表于 02-23 21:46 ?327次閱讀
    極簡代碼,搞定JSON<b class='flag-5'>序列</b>化與反<b class='flag-5'>序列</b>化

    脈沖序列幅值的提取

    請教各位大佬,如圖這種脈沖序列,怎么把每個脈沖的幅值提取出來? *附件:脈沖序列幅值提取.rar
    發(fā)表于 02-09 11:35

    鎖存器中的時間借用概念與靜態(tài)時序分析

    對于基于鎖存器的設(shè)計,靜態(tài)時序分析會應用一個稱為時間借用的概念。本篇博文解釋了時間借用的概念,若您的設(shè)計中包含鎖存器且時序報告中存在時間借用,即可適用此概念。
    的頭像 發(fā)表于 12-31 15:25 ?5482次閱讀
    鎖存器中的<b class='flag-5'>時間</b>借用概念與靜態(tài)時序<b class='flag-5'>分析</b>

    矢量網(wǎng)絡分析儀的時域分析技術(shù):從頻域到時間的精密測量

    矢量網(wǎng)絡分析儀作為射頻與微波領(lǐng)域的核心測量工具,其頻域分析能力已廣泛應用于通信、雷達、天線設(shè)計等場景。然而,當面對復雜系統(tǒng)調(diào)試、故障定位或環(huán)境反射抑制等挑戰(zhàn)時,時域分析功能展現(xiàn)出獨特的優(yōu)勢。通過將
    的頭像 發(fā)表于 12-10 17:28 ?1116次閱讀
    矢量網(wǎng)絡<b class='flag-5'>分析</b>儀的時域<b class='flag-5'>分析</b>技術(shù):從頻域到<b class='flag-5'>時間</b>的精密測量

    ATA-D60090功率放大器在時間調(diào)制序列生成中的應用

    利用計算機生成波束掃描所需的的波束掃描的時間編碼序列。根據(jù)時間編碼序列,任意信號發(fā)生器產(chǎn)生的方波信號通過功率放大器產(chǎn)生控制電壓信號。
    的頭像 發(fā)表于 11-30 14:27 ?430次閱讀
    ATA-D60090功率放大器在<b class='flag-5'>時間</b>調(diào)制<b class='flag-5'>序列</b>生成中的應用

    時間頻率標準源有什么功能

    時間頻率
    西安同步電子科技有限公司
    發(fā)布于 :2025年11月04日 17:58:08

    TPS38700-Q1 電源供應序列器總結(jié)

    計,可與多通道電壓監(jiān)控器連接。該器件默認為預編程的OTP選項,但I2C可以根據(jù)需要對上電和斷電序列、看門狗設(shè)置和序列時序選項進行重新編程。
    的頭像 發(fā)表于 08-18 15:17 ?923次閱讀
    TPS38700-Q1 電源供應<b class='flag-5'>序列</b>器總結(jié)

    如何評估協(xié)議分析儀的性能指標?

    ,避免訂單延遲。 IoT網(wǎng)絡:大量小包(如CoAP協(xié)議)需高包處理速率防止堆積。 延遲(Latency) 定義:數(shù)據(jù)包從進入分析儀到輸出結(jié)果的耗時(納秒/微秒級)。 評估方法: 硬件時間戳:使用支持
    發(fā)表于 07-18 14:44

    構(gòu)建自定義電商數(shù)據(jù)分析API

    ? 在電商業(yè)務中,數(shù)據(jù)是驅(qū)動決策的核心。隨著數(shù)據(jù)量的增長,企業(yè)需要實時、靈活的分析工具來監(jiān)控銷售、用戶行為和庫存等指標。一個自定義電商數(shù)據(jù)分析API(應用程序接口)可以自動化數(shù)據(jù)提取和處理過程,提供
    的頭像 發(fā)表于 07-17 14:44 ?599次閱讀
    構(gòu)建自<b class='flag-5'>定義</b>電商數(shù)據(jù)<b class='flag-5'>分析</b>API

    功率分析儀運算原理 什么是同步源?有功功率運算

    橫河功率分析儀的通用運算原理則是首先檢測出指定信號的周期,并將檢測周期的整數(shù)倍時間設(shè)為測量區(qū)間,隨后對這段時間內(nèi)采集到的數(shù)據(jù)進行平均運算,這一測量方式也被稱為“同步源周期平均法”,其中用于定義
    的頭像 發(fā)表于 06-30 15:30 ?1600次閱讀
    功率<b class='flag-5'>分析</b>儀運算原理 什么是同步源?有功功率運算

    VirtualLab Fusion應用:多反射系統(tǒng)的非序列建模

    序列光學系統(tǒng),特別是那些非序列性來自組件內(nèi)部多次內(nèi)部反射的系統(tǒng),具有一系列特定的挑戰(zhàn)。將這樣的系統(tǒng)分解成一個順序等價的系統(tǒng)通常非常不方便,而且總是不切實際的。因此,擁有一個穩(wěn)定的非序列建模策略
    發(fā)表于 06-12 08:49

    HarmonyOS實戰(zhàn):自定義時間選擇器

    前言 最近在日常鴻蒙開發(fā)過程中,經(jīng)常會使用一些時間選擇器,鴻蒙官方提供的時間選擇器滿足不了需求,所以自己動手自定義一些經(jīng)常會使用到的時間選擇器,希望能幫到你,建議點贊收藏! 實現(xiàn)效果
    的頭像 發(fā)表于 06-09 15:51 ?649次閱讀
    HarmonyOS實戰(zhàn):自<b class='flag-5'>定義</b><b class='flag-5'>時間</b>選擇器

    時間間隔測量分析儀特點總結(jié)

    時間頻率行業(yè),時間間隔測量是不可缺少的一部分,選擇一款合適的時間間隔測量儀就會顯得尤為重要,今天我們來分析一下時間間隔
    的頭像 發(fā)表于 05-08 11:29 ?532次閱讀
    <b class='flag-5'>時間</b>間隔測量<b class='flag-5'>分析</b>儀特點總結(jié)

    用于LEGIC Advant UID/序列號的NFC讀卡器,為什么無法讀取這些卡的UID/序列號?

    我目前正在開發(fā)一個小展示柜,其中 LEGIC Advant 卡 (CTC) 的 UID/序列號應由 NFC 閱讀器讀取。在當前的設(shè)置中,我有一個使用 MFRC522 芯片的 ESP32。不幸
    發(fā)表于 04-02 08:07