當我們說我們有一個飽和模型時是什麼意思?
當我們說我們有一個飽和模型時是什麼意思?
飽和模型是其中估計參數與數據點一樣多的模型。根據定義,這將導致完美的擬合,但在統計上卻沒有多大用處,因為您沒有剩餘數據來估算方差。
例如,如果您有6個數據點並擬合了第5個對數據進行多項式排序,您將得到一個飽和模型(獨立變量的5個冪中的每個冪都有一個參數,常數項則有1個參數)。
飽和模型是一個參數化過高的模型,以至於它基本上只是在插值數據。在某些情況下,例如圖像壓縮和重建,這不一定是一件壞事,但是,如果您要構建預測模型,那就很麻煩了。
總之,飽和模型會導致噪聲比實際數據更容易導致高方差預測變量。
作為一個思想實驗,假設您有一個飽和模型,數據中有噪聲,然後想像擬合該模型幾百次,每次都以不同的方式實現噪聲,然後預測新的點。每次擬合和預測時,您可能都會得到截然不同的結果(在這方面,多項式模型尤其糟糕);
通過對比,一個不飽和的模型(如果構造合理)即使在不同的噪聲實現下,其擬合也會更加一致。 ,預測變量的方差也會減少。
正如其他人之前所說,這意味著您擁有盡可能多的參數並擁有數據點。因此,沒有合適性測試的好處。但這並不意味著“按定義”該模型可以完全適合任何數據點。我可以通過使用一些無法預測特定數據點的飽和模型的個人經驗告訴您。這是非常罕見的,但有可能。
另一個重要的問題是飽和並不意味著無用。例如,在人類認知的數學模型中,模型參數與具有理論背景的特定認知過程相關聯。如果模型是飽和的,則可以通過僅應影響特定參數的操作進行有針對性的實驗來測試其適當性。如果理論預測與參數估計中觀察到的差異(或缺乏)相匹配,則可以說該模型有效。
一個例子:想像一個模型,它具有兩組參數,一組用於認知處理,另一組用於運動反應。現在想像一下,您有兩個條件的實驗,一個條件是參與者的反應能力受到削弱(他們只能用一隻手而不是兩隻手),而在另一種條件下則沒有任何損害。如果模型有效,則兩種情況下參數估計值的差異僅應針對電動機響應參數發生。
此外,請注意,即使一個模型不飽和,也可能仍然無法識別。 ,這意味著參數值的不同組合會產生相同的結果,這會損害任何模型擬合。
如果您想在一般情況下找到有關這些問題的更多信息,則可以查看以下論文:
p>Bamber,D.,& van Santen,JPH(1985)。一個模型可以有多少個參數並且仍然可以測試?數學心理學雜誌,29,443-473。
Bamber,D.,& van Santen,J.P.H。(2000)。如何評估模型的可測試性和可識別性。數學心理學雜誌,44,20-40。
歡呼
當且僅當它具有與數據點相同的參數(觀測)時,模型才飽和。或換句話說,在非飽和模型中,自由度大於零。
這基本上意味著該模型無用,因為它沒有比原始數據更簡潔地描述數據(並且簡約地描述數據通常是使用模型的想法。此外,飽和模型可以(但不一定)提供(無用的)完美擬合,因為它們只是對數據進行插值或迭代。
以均值作為某些數據的模型。如果您只有一個數據點(例如5),則使用平均值(即5;請注意,平均值是僅一個數據點的飽和模型)根本沒有幫助。但是,如果您已經有兩個數據點(例如5和7),則使用平均值(即6)作為模型可以為您提供比原始數據更簡潔的描述。
如果需要為擬似然模型計算AIC,它也很有用。色散的估計應來自飽和模型。您將用AIC計算中飽和模型的估計色散除以適合的LL。
在SEM(或路徑分析)的上下文中,飽和模型或剛剛確定的模型是其中自由參數的數量完全等於方差和唯一協方差的數量的模型。例如,以下模型是飽和模型,因為存在3 * 4/2數據點(方差和唯一協方差),還有6個要估計的自由參數:
在回歸分析中,我認為術語“飽和模型”的常用用法如下。飽和模型的自變量與coviarates的唯一 levels (組合)一樣多。當然,只有分類協變量才有可能。因此,如果您有兩個虛擬變量X1和X2,並且包含的自變量是X1,X2和X1 * X2,則回歸飽和。
這是有利的,因為當模型飽和時,給定X1和X2的Y的條件期望函數在參數上必然是線性的(在X1,X2,X1 * X2中是線性的)。重要的是,該模型通常沒有“估計的參數與數據點一樣多”,也通常沒有“完美擬合”。
這裡有一個來源,還有很多其他來源:“我們何時期望CEF呈線性?兩種情況。一種是數據(結果和協變量)是多元正態的,另一種是線性的。回歸是saturated。飽和回歸模型是其中每個協變量的每個唯一組合都有一個參數的模型。在這種情況下,由於CEF是虛擬類別的線性函數,因此該回歸非常適合CEF。” 教授布萊克韋爾的講義,第2頁。