在R中運行多元回歸模型時,輸出之一是在95,161自由度上的殘留標準誤差0.0589。我知道95161自由度是由樣本中的觀察數與模型中的變量數之差得出的。殘留標準誤差是多少?
在R中運行多元回歸模型時,輸出之一是在95,161自由度上的殘留標準誤差0.0589。我知道95161自由度是由樣本中的觀察數與模型中的變量數之差得出的。殘留標準誤差是多少?
假設我們有以下ANOVA表(改編自R的 example(aov)
命令):
Df Sum Sq平均Sq F值Pr(>F)Model 1 37.0 37.00 0.483 0.525殘差4 306.3 76.57
如果將任何變化源(模型或殘差)的平方和除以其各自的自由度,則會得到均方。特別是對於殘差:
$$ \ frac {306.3} {4} = 76.575 \ approx 76.57 $$
因此,76.57是殘差的均方值,即(在應用模型後)殘留變量在響應變量上的變化。
您詢問的殘留標準誤差無非是均方誤差。在我的示例中,殘差標準誤差等於$ \ sqrt {76.57} $,或大約8.75。 R會將此信息輸出為“在4個自由度上為8.75”。
如果您要使用相同的$ X $值無限次重複研究(並且線性模型為真),則擬合的回歸模型將使用參數生成點估計預測,這是觀察到的響應的手段。 。這些預測值與用於擬合模型的預測值之間的差稱為“殘差”,當複制數據收集過程時,它們具有具有0均值的隨機變量的屬性。
然後將觀察到的殘差用於隨後估計這些值的可變性並估計參數的採樣分佈。當殘差標準誤差正好為0時,模型將完美擬合數據(可能是由於過度擬合)。如果不能證明殘餘標準誤差與無條件響應的變異性有顯著差異,則幾乎沒有證據表明線性模型具有預測能力。
通常,您將具有如下回歸模型:$$ Y = \ beta_ {0} + \ beta_ {1} X + \ epsilon $$其中$ \ epsilon $是獨立於$ X $的誤差項。
如果已知$ \ beta_ {0} $和$ \ beta_ {1} $,由於$ \ epsilon $,我們仍然不能使用X完美地預測Y。因此,我們使用RSE作為$ \ epsilon $的標準偏差的判斷值。
在“統計學習簡介”中對RSE的解釋非常清楚。