在進行了Shapiro-Wilk正態性檢驗後,我已對此進行了繪製。測試表明,總體上可能呈正態分佈。但是,如何在該圖上看到這種“行為”?
更新
簡單的數據直方圖:
UPDATE
Shapiro-Wilk測試表明:
在進行了Shapiro-Wilk正態性檢驗後,我已對此進行了繪製。測試表明,總體上可能呈正態分佈。但是,如何在該圖上看到這種“行為”?
更新
簡單的數據直方圖:
UPDATE
Shapiro-Wilk測試表明:
如果數據呈正態分佈,則QQ正態圖中的點位於對角直線上。您可以使用命令 qqline(x)
將這條線添加到QQ圖中,其中 x
是值的向量。
正常值和非正態分佈:
正態分佈
set.seed(42)x <-rnorm(100)
帶有以下行的QQ正態圖:
qqnorm(x); qqline(x)
與直線的偏差很小。這表示正態分佈。
直方圖:
hist(x)
非正態(Gamma)分佈
y <- rgamma(100,1)
QQ正態圖:
qqnorm(y); qqline(y)
這些點顯然不同於直線。
直方圖證實了非正態性。分佈不是鍾形,而是正偏(即,大多數數據點在下半部分)。正態分佈的直方圖顯示了分佈中心的最高頻率。
hist(y)
“ 該測試表明總體可能呈正態分佈。”
否;
假設檢驗不能告訴您空值的可能性。實際上,您可以打賭該null為false。
Q-Q圖不能很好地表明非正態(該圖相當筆直);
直方圖按原樣顯示可能也沒有太多;不過,左尾也許比您預期的短一些,但這確實無關緊要。它也暗示左尾巴稍短。 但請參見此處
您的數據所來自的總體分佈將不完全正常。但是,Q-Q圖顯示正態性可能是一個相當不錯的近似值。
如果樣本量不太小,可能缺少對Shapiro-Wilk的拒絕也可能是相同的。
更新:您所做的編輯將包括實際的Shapiro- Wilk p值很重要,因為實際上這表明您會拒絕典型有效水平的零值。該測試表明您的數據不是正態分佈的,並且圖所示的輕微偏斜可能是測試所拾取的。對於可能假設變量本身俱有正態性的典型過程(一個樣本t檢驗是我想到的),在看起來相當大的樣本量的情況下,這種輕微的非正態性幾乎不會產生任何後果。所有-擬合優度檢驗的問題之一是,它們在不重要的時候(當樣本量足夠大以檢測到一些適度的非正態性時)更可能拒絕。同樣,在最重要的時候(樣本量較小時),他們更有可能無法拒絕。
一些用於檢查R中的正態假設的有效性的工具
庫(片刻)庫(北測試)庫(e1071)set.seed(777)x <- rnorm(250 ,10,1)#偏斜度和峰度,它們應該在(0,3)偏斜度(x)峰度(x)#附近Shapiro-Wilks testshapiro.test(x)#Kolmogorov-Smirnov testks.test(x,“ pnorm” ,mean(x),sqrt(var(x)))#Anderson-Darling testad.test(x)#qq-plot:您應該觀察到直線的良好擬合qqnorm(x)qqline(x)#p-plot :您應該觀察到直線的良好擬合probplot(x,qdist = qnorm)#擬合法線密度f.den <- function(t)dnorm(t,mean(x),sqrt(var(x)))曲線(f .den,xlim = c(6,14))hist(x,prob = T,add = T)
雖然直觀地檢查您的直覺是否與某些測試的結果相匹配是一個好主意,但您不能期望每次都容易。如果試圖檢測希格斯玻色子的人們只相信他們的結果,只要他們可以通過視覺對其進行評估,那麼他們將需要非常敏銳的眼睛。統計數據傾向於收集到最小的差異,即使用肉眼幾乎無法辨別它們。
這就是說:為了正常起見,您的QQ圖應該顯示一條直線:我會說確實不。尾巴上有明顯的彎曲,甚至在中間附近也有一些騷動。從視覺上看,我仍然可能願意說(取決於檢查正常性的目標),這些數據是“合理地”正常的。
但是請注意:對於大多數要檢查正常性的目的,您只需要方法的正態性而不是觀測值的正態性,因此中心極限定理可能足以拯救您。另外:雖然正常性通常是您需要“正式”檢查的一種假設,但事實證明,許多測試對於不滿足這種假設並不敏感。
我喜歡R庫 car
中的版本,因為它不僅提供了集中趨勢,而且還提供了置信區間。它提供視覺指導,以幫助確認數據的行為是否與假設分佈一致。 ,信封= .99)
一些鏈接: