我想知道方差和標準偏差之間的區別是什麼。
如果您計算兩個值,很顯然您是從方差中得出標準偏差,但是從觀察到的分佈來看這意味著什麼呢?
此外,為什麼您真的需要標準差?
我想知道方差和標準偏差之間的區別是什麼。
如果您計算兩個值,很顯然您是從方差中得出標準偏差,但是從觀察到的分佈來看這意味著什麼呢?
此外,為什麼您真的需要標準差?
標準差是方差的平方根。
標準差以與均值相同的單位表示,而方差以平方單位表示,但用於查看分佈,只要您清楚自己在使用什麼,就可以使用。例如,均值= 10且sd = 3的正態分佈與均值= 10且方差= 9的正態分佈完全相同。
您不需要兩者。它們各自具有不同的目的。 SD通常用於描述數據的變異性,而方差通常在數學上更為有用。例如,不相關分佈的總和(隨機變量)也具有方差,即這些分佈的方差之和。 SD並非如此。另一方面,SD可以方便地以原始變量為單位表示。
如果John說“無關分佈”時指的是獨立隨機變量,那麼他的回答是正確的。但是,要回答您的問題,可以添加幾個點:
平均值和方差是確定正態分佈的兩個參數。
Chebyshev不等式限制了觀察到的隨機變量在均值的標準差內的概率。
標準差用於歸一化統計測試的統計信息(例如,當真實的標準差未知時,已知的標準偏差用於將平均值不同於$ 0 $的$ z $測試的樣本均值歸一化,或者將樣本標準差用於歸一化樣本均值,
對於正態分佈,68%的分佈百分比在標準偏差的1美元以內。 $ 25.4標準偏差內的$ 95.4 \%$和$ 3 $標準偏差內的$ 99 \%$以上。
誤差幅度表示為標準偏差的倍數。估計。
方差和偏差是隨機數量中不確定性的量度。估計的均方誤差等於方差+偏差的平方。
數據集的方差衡量數據相對於均值的數學離散度。但是,儘管該值在理論上是正確的,但由於用於計算它的值是平方的,因此很難在現實世界中應用。標準差是方差的平方根,它的值與原始值的單位相同,這使得操作更容易且更容易結合正態曲線的概念來解釋。
就分佈而言,它們是等效的(但顯然是不可互換的),但要注意,就估計而言,它們不是:方差估計的平方根不是標準的(無偏)估計偏差。兩者僅對於中等數量的樣本(並取決於估計量)彼此接近。對於小樣本量,您需要了解分佈的參數形式以在兩者之間進行轉換,這可能會變得有點圓。
在計算方差時,我們對偏差進行平方,這意味著如果給定的數據(觀測值)以米為單位,則將變為米平方,希望這不是關於偏差的正確表示。因此,我們再次平方根(SD)就是SD。