什麼是殘留標準誤差？

題:

什麼是殘留標準誤差？

ustroetz

2013-05-01 01:54:12 UTC

view on stackexchange narkive permalink

在R中運行多元回歸模型時，輸出之一是在95,161自由度上的殘留標準誤差0.0589。我知道95161自由度是由樣本中的觀察數與模型中的變量數之差得出的。殘留標準誤差是多少？

這個問題及其答案可能會有所幫助：[我們為什麼說殘留標準誤差？]（http://stats.stackexchange.com/questions/144433/why-do-we-say-residual-standard-error）

一個簡單的問題：“殘留標準偏差”是否與“殘留標準偏差”相同？Gelman和Hill（p.41，2007）似乎可以互換使用。

三答案:

Waldir Leoncio

2015-10-13 20:12:25 UTC

view on stackexchange narkive permalink

假設我們有以下ANOVA表（改編自R的 example（aov）命令）：

  Df Sum Sq平均Sq F值Pr（>F）Model 1 37.0 37.00 0.483 0.525殘差4 306.3 76.57

如果將任何變化源（模型或殘差）的平方和除以其各自的自由度，則會得到均方。特別是對於殘差：

$$ \ frac {306.3} {4} = 76.575 \ approx 76.57 $$

因此，76.57是殘差的均方值，即（在應用模型後）殘留變量在響應變量上的變化。

您詢問的殘留標準誤差無非是均方誤差。在我的示例中，殘差標準誤差等於$ \ sqrt {76.57} $，或大約8.75。 R會將此信息輸出為“在4個自由度上為8.75”。

我贊成@AdamO的答案，因為作為一個最直接使用回歸的人，這個答案對我來說是最直接的。但是，我很欣賞這個答案，因為它說明了方差分析與線性回歸之間的符號/概念/方法上的關係。

AdamO

2013-05-01 02:57:13 UTC

view on stackexchange narkive permalink

如果您要使用相同的$ X $值無限次重複研究（並且線性模型為真），則擬合的回歸模型將使用參數生成點估計預測，這是觀察到的響應的手段。。這些預測值與用於擬合模型的預測值之間的差稱為“殘差”，當複制數據收集過程時，它們具有具有0均值的隨機變量的屬性。

然後將觀察到的殘差用於隨後估計這些值的可變性並估計參數的採樣分佈。當殘差標準誤差正好為0時，模型將完美擬合數據（可能是由於過度擬合）。如果不能證明殘餘標準誤差與無條件響應的變異性有顯著差異，則幾乎沒有證據表明線性模型具有預測能力。

這可能已經回答過了。查看此問題是否提供您需要的答案。 [R的lm（）輸出的解釋] [1] [1]：http://stats.stackexchange.com/questions/5135/interpretation-of-rs-lm-output

little_monster

2016-07-27 05:51:00 UTC

view on stackexchange narkive permalink

通常，您將具有如下回歸模型：$$ Y = \ beta_ {0} + \ beta_ {1} X + \ epsilon $$其中$ \ epsilon $是獨立於$ X $的誤差項。

如果已知$ \ beta_ {0} $和$ \ beta_ {1} $，由於$ \ epsilon $，我們仍然不能使用X完美地預測Y。因此，我們使用RSE作為$ \ epsilon $的標準偏差的判斷值。

在“統計學習簡介”中對RSE的解釋非常清楚。

這應該是公認的答案。RSE只是對\ε的標準偏差（即殘差）的估計。也稱為殘差標準偏差（RSD），可以定義為$ RSE = \ sqrt {\ frac {RSS} {（n-2）}} $（例如，請參見ISL第66頁）。

對於閱讀ISL的epub的任何人，您都可以通過ctrl -f“殘餘標準錯誤”找到“第66頁”。（Epub文件沒有真實的頁碼）。

ⓘ

該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到，我們感謝它分發的cc by-sa 3.0許可。