題:
為什麼時間序列必須是固定的?
alex
2011-12-13 03:11:55 UTC
view on stackexchange narkive permalink

我知道平穩的時間序列是一個平均值和方差隨時間恆定的序列。有人可以解釋一下為什麼我們必須確保我們的數據集固定後才能在其上運行不同的ARIMA或ARM模型嗎?這是否也適用於自相關和/或時間不是因素的正態回歸模型?

什麼是ARM模型?你是說ARMA嗎?
平穩性不僅需要恆定的均值和方差。平穩性弱要求協方差函數$ cov(X_t,X_ {t + h})$不依賴於$ t $。
您不需要平穩性來運行AR $ I $ MA模型,因為如果$ I()$順序為$> 0 $,則它顯然是非平穩的。平穩性是ARMA的假設。
訂單註釋+1,儘管嚴格來說,只有$ I $的訂單位於$ \ {0,1,2,... \} $中。對於任意訂單,有[ARFIMA](http://en.wikipedia.org/wiki/Autoregressive_fractionally_integrated_moving_average)
@Glen_b ARIMA模型可以用於任何非平穩系列嗎?還是有一些特定的非固定性案例適用ARIMA cana?
十 答案:
mpiktas
2011-12-13 16:34:59 UTC
view on stackexchange narkive permalink

平穩性是一種依賴結構。

假設我們有一個數據$ X_1,...,X_n $。最基本的假設是$ X_i $是獨立的,即我們有一個樣本。獨立性是一個很好的屬性,因為使用它可以得出很多有用的結果。問題是有時(或經常取決於視圖)此屬性不成立。

現在獨立性是一個獨特的屬性,兩個隨機變量只能以一種方式獨立,但是它們可以以多種方式依賴。因此平穩性是對依賴結構進行建模的一種方法。事實證明,對於獨立隨機變量(大數定律,中心極限定理僅舉幾例)成立的很多不錯的結果對於平穩隨機變量(我們應該嚴格地說是序列)成立。當然,事實證明,很多數據可以被認為是平穩的,因此平穩性的概念對於建模非獨立數據非常重要。進行建模。這就是ARMA模型出現的地方。事實證明,借助 Wold分解定理,任何靜態數據都可以用靜態ARMA模型來近似。因此,這就是ARMA模型非常受歡迎的原因,這就是為什麼我們需要確保該系列是固定的才能使用這些模型。

現在,同樣的故事與獨立和依賴一樣。平穩性是唯一定義的,即數據是固定的還是不固定的,因此只有固定數據的方法,而有許多方法是固定的。再次證明,經過某些轉換後,許多數據變得固定不變。 ARIMA模型是非平穩性的一種模型。

在回歸上下文中,平穩性很重要,因為如果數據是平穩的,則適用於獨立數據的結果相同。

我建議您將響應的這一部分放在其中(“這是ARMA模型的用武之地。事實證明,借助Wold分解定理,任何靜態數據都可以用靜態ARMA模型來近似。因此這就是ARMA模型非常有用的原因。流行,這就是為什麼我們需要確保系列固定不變才能使用這些模型。”)以粗體顯示,因為這主要是在回答問題。
我認為人們對平穩性要求感到困惑。我認為您可以具有非平穩的時間序列* instances *,但是如果您在多個實例之間進行訓練,您仍然可以潛在地了解問題。它需要比“時間序列平穩好非平穩壞”更深入。 人們還需要區分功能和學習目標(無論是什麼類別的標籤)。我們需要*清除*聲明。
Charlie
2012-11-15 21:48:55 UTC
view on stackexchange narkive permalink

當我們對一個時間序列進行統計分析時,我們通常需要多少數量?我們想知道

  • 它的期望值,
  • 它的方差,和
  • 對於一組$而言,$ s $間隔的值之間的相關性s $值。

我們如何計算這些東西?在多個時間段內使用平均值。

只有在這些時間段內的期望值相同時,多個時間段的平均值才有意義。如果這些總體參數可以變化,那麼通過對整個時間取平均值可以真正估算出什麼?

(弱)平穩性要求這些總體數量在時間上必須相同,從而使樣本平均值成為合理的方法估計它們。

此外,平穩過程避免了虛假回歸的問題。

Jeffrey Girard
2016-09-29 00:20:57 UTC
view on stackexchange narkive permalink

要在其他一些不錯但更詳細的答案中添加高級答案,平穩性很重要,因為在沒有該模型的情況下,描述數據的模型在不同時間點的準確性會有所不同。因此,樣本統計信息(例如均值,方差和相關性)必須具有平穩性,才能在所有感興趣的時間點準確描述數據。

查看下面的時間序列圖,您可以(希望)看到任何給定時間段的均值和方差如何才能很好地表示整個平穩時間序列,而相對差的工作則可以表示整個非平穩時間序列時間序列。例如,非平穩時間序列的均值遠低於$ 600<t<800 $,並且其方差在此範圍內遠高於$ 200<t<400 $的範圍。

enter image description here

Matthew Gunn
2017-05-08 19:20:46 UTC
view on stackexchange narkive permalink

統計學習的基本思想是,您可以通過重複實驗來學習。例如,我們可以繼續翻轉圖釘以了解圖釘落在頭上的可能性。

在時間序列上下文中,我們觀察到隨機過程的一次運行,而不是隨機過程的重複運行。我們觀察到1個長期實驗,而不是多個獨立實驗。

我們需要平穩性和遍歷性,以便觀察隨機過程的長期運行類似於觀察隨機過程的許多獨立運行。

一些(不精確的)定義

$ \ Omega $ span>作為示例空間。隨機過程 $ \ {Y_t \} $ span>是兩個時間 $ t \ in \ {1,2, 3,\ ldots \} $ span>和結果 $ \ omega \ in \ Omega $ span>。

  • 在任何時候 $ t $ span>, $ Y_t $ span>都是隨機變量(即 $ \ Omega $ span>到某些空間,例如實數空間)。
  • 對於任何結果 $ \ omega $ span>系列 $ Y(\ omega)$ span>是一個時間系列實數: $ \ {Y_1(\ omega),Y_2(\ omega),Y_3(\ omega),\ ldots \} $ span>

時間序列中的一個基本問題

在統計101中,我們學習了一系列獨立且分佈均勻的變量 $ X_1 $ span>, $ X_2 $ span>, $ X_3 $ span>等...我們觀察到多個相同的實驗 $ i = 1,\ ldots ,n $ span>,其中隨機選擇 $ \ omega_i \ in \ Omega $ span>,這樣我們就可以了解隨機變量 $ X $ span>。根據大數法則,我們有 $ \ frac {1} {n} \ sum_ {i = 1} ^ n X_i $ span>幾乎可以肯定地收斂到 $ \ operatorname {E} [X] $ span>。

A時間序列設置的根本區別在於,我們隨時間觀察多個觀察值 $ t $ span>,而不是 $ \ Omega $ span> .

在一般情況下,隨機過程的樣本均值 $ \ frac {1} {T} \ sum_ {t = 1} ^ T Y_t $ span>可能完全不收斂!

要在時間內進行多次觀測以完成與從樣本空間多次繪製相似的任務,我們需要平穩性遍歷性

如果存在無條件均值 $ \ operatorname {E} [Y] $ span>,並且滿足遍歷定理的條件,則時間序列樣本均值 $ \ frac {1} {T} \ sum_ {t = 1} ^ T Y_t $ span>將收斂到無條件均值 $ \ operatorname {E} [Y] $ span>。

示例1:平穩性失敗

$ \ {Y_t \} $ span>成為退化過程 $ Y_t = t $ span>。我們可以看到 $ \ {Y_t \} $ span>不是平穩的(聯合分佈不是隨時間變化的)。

$ S_t = \ frac {1} {t} \ sum_ {i = 1} ^ t Y_i $ span>為時間序列樣本均值,它是顯然, $ S_t $ span>不會收斂到任何東西,因為 $ t \ rightarrow \ infty $ span>: $ S_1 = 1,S_2 = \ frac {3} {2},S_3 = 2,\ ldots,S_t = \ frac {t + 1} {2} $ span>。 $ Y_t $ span>的時間不變均值不存在: $ S_t $ span>不受限制為 $ t \ rightarrow \ infty $ span>。

示例:遍歷失敗

$ X $ span>是一次硬幣翻轉的結果。讓 $ Y_t = X $ span>表示所有 $ t $ span>,也就是 $ \ {Y_t \} =(0,0,0,0,0,0,0,\ ldots)$ span>或 $ \ {Y_t \ } =(1,1,1,1,1,1,1,\ ldots $ span>。

即使 $ \ operatorname {E} [Y_t] = \ frac {1} {2} $ span>,時間序列樣本均值 $ S_t = \ frac {1} {t} \ sum_ {i = 1} ^ t Y_i $ span>不會給出 $ Y_t $ span>。

Aksakal
2016-09-29 01:47:45 UTC
view on stackexchange narkive permalink

首先,ARIMA(p,1,q)過程不是固定的。這些就是所謂的綜合系列,例如$ x_t = x_ {t-1} + e_t $是ARIMA(0,1,0)或I(1)進程,也是隨機遍歷或單位根。因此,不,您不需要全部固定。

但是,我們經常會尋找平穩性。為什麼?

考慮預測問題。您如何預測?如果明天一切不一樣,那麼就無法預測,因為一切都會不一樣。因此,預測的關鍵是找到明天將相同的東西,並將其延續到明天。 某物可以是任何東西。我給你舉幾個例子。

在上面的I(1)模型中,我們經常假設(或希望)今天和明天的錯誤分佈相同:$ e_t \ sim \ mathcal {N}(0,\ sigma ^ 2)$。因此,在這種情況下,我們要說明天的分佈仍將是正態的,並且其均值和方差仍將是相同的0和$ \ sigma ^ 2 $。這還沒有使序列平穩,但是我們在過程中發現了不變部分。接下來,如果您看一下第一個差異:$ \ Delta x_t \ equiv x_t-x_ {t-1} = e_t $-這隻貓是靜止的。但是,請理解,目標並不是真正找到平穩序列$ \ Delta x_t $,而是找到不變的東西,即誤差的分佈。發生這種情況的原因是,按照定義,平穩序列中將存在不變部分,例如無條件均值和方差。

另一個例子,說真實的序列是:$ x_t = \ alpha t + e_t $。說,我們對錯誤的全部了解是它們的均值為零:$ E [e_t] = 0 $。現在,我們可以再次預測!我們所需要的只是估計增長率$ \ alpha $,這就是不變的和誤差的平均值。每當發現不變量時,您都可以進行預測。

對於預測,我們絕對需要在序列中找到常數(時間不變)分量,否則無法通過定義進行預測。平穩性只是不變性的一種特殊情況。

Robert
2012-11-15 19:10:19 UTC
view on stackexchange narkive permalink

由於ARIMA大多數情況下都在自我回歸,因此它使用了一種自我誘導的多元回歸,這種回歸可能不受趨勢或季節性的強烈影響。這種多元回歸技術基於以前的時間序列值,尤其是最近一段時間內的時間序列值,並允許我們在多個過去的值之間提取一個非常有趣的“相互關係”,以解釋未來的價值。

IrishStat
2011-12-13 04:41:58 UTC
view on stackexchange narkive permalink

時間序列是關於分析序列值依賴於先前值的方式。正如SRKX所建議的那樣,可以對一個非平穩序列進行差異化或趨勢化或均值化,但這不是不必要的!)來創建一個平穩序列。 ARMA分析需要平穩性。如果$(X_ {t + 1},\ ldots,X_ {t + k})$的分佈與每個$ t $的$(X_1,\ ldots,X_k)$的分佈相同,則$ X $是嚴格平穩的和$ k $。來自Wiki:平穩過程(或嚴格(完全)平穩過程或強(完全)平穩過程)是隨機過程,其聯合概率分佈在時間或空間上變化時不會改變。因此,諸如均值和方差之類的參數(如果存在)也不會隨時間或位置變化。另外,正如Cardinal正確指出的那樣,自相關函數必須隨時間不變(這意味著協方差函數隨時間恆定),並轉換為ARMA模型的參數在所有時間間隔內都是不變/恆定的。

ARMA模型的平穩性思想與可逆性思想緊密相關。

考慮一個格式為$ y(t)= 1.1 \,y(t-1)$的模型。該模型具有爆炸性,因為多項式$(1-1.1 B)$的根在單位圓內,因此違反了要求。在單位圓內具有根的模型意味著“較舊的數據”比“較新的數據”更重要,這當然是沒有道理的。

有點疑問:當您說“如果前兩個時刻隨時間不變,$ X $是二階平穩的”,您的意思還不清楚。通常,當我想到二階平穩性時,除了均值的不變性外,我還認為自相關函數隨時間不變。當然,這比您所陳述的(天真?)解釋的條件(強得多)強。
在您最近的編輯中似乎沒有提到二階平穩。那是故意的嗎? (我最初的評論是針對二階平穩性而不是嚴格平穩性。)
:cardinal我想我覺得您的評論很重要,並且可以使您更清楚地了解所假定的內容。如果您認為“二階平穩”的想法更加清晰,請幫助我以一種簡單易懂的英語來闡明我的觀點。
Rama Thamman
2018-01-19 12:06:43 UTC
view on stackexchange narkive permalink

ARMA和ARIMA的建立是假設序列是固定的。如果序列不是,那麼預測將是不正確的。

僅當序列平穩時,樣本統計信息(均值,方差,協方差)才可用作將來行為的描述符。例如,如果序列隨時間持續增長,則樣本均值和方差將隨樣本的大小而增加,並且它們始終會低估未來期間的均值和方差。在嘗試推斷適合非平穩數據的回歸模型時,請務必謹慎。

Curiosity
2015-10-28 00:58:18 UTC
view on stackexchange narkive permalink

在我看來,隨機過程是由三個必須隨時間變化的統計屬性控制的過程,它們是均值方差和自相關函數。儘管前兩個並不能說明過程的演變。時間,因此應該考慮第三種屬性,即自相關函數,該屬性可以告訴人們依賴性隨時間的推移如何衰減(滯後)。

這使它成為一個隨機過程並且變得靜止不清,因此從一個基本錯誤開始。您的答案對已發布的內容有何幫助?
saravanan saminathan
2018-08-21 19:33:20 UTC
view on stackexchange narkive permalink

要解決任何問題,我們需要使用靜力學在數學上對方程建模。

  1. 要求解此類方程,它必須獨立且平穩(不動)
  2. 只有在固定數據中,我們才能獲得洞察力並進行多用途的數學運算(均值,方差等)
  3. 在非平穩狀態下,很難獲取數據
  4. ol>

    在轉換過程中,我們將獲得趨勢和季節性

您的答案都沒有道理。問題的前提是錯誤的。從理論上和觀察上,許多時間序列都可以認為是不穩定的。例如,也有許多方法可以解決這個問題!2.系列,包括正弦波之類的周期性成分。
@MichaelChernick在微分和季節性差分中,我們將非平穩序列轉換為平穩序列。我接受你的觀點,許多時間序列是非平穩的,但是要從數學上解決它,我們需要將其轉換為平穩的


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...