題:
如何可視化方差分析的作用?
Tal Galili
2010-12-09 03:45:46 UTC
view on stackexchange narkive permalink

可以通過什麼方式直觀地解釋什麼是方差分析?

任何引用,鏈接(R包?)都將受到歡迎。

克里斯托弗·馬格努森(Kristoffer Magnusson)在他的博客“心理學家在統計編程中的努力”中提供了一個使用D3.js進行單向方差可視化的絕佳示例,網址為http://rpsychologist.com/d3-one-way-anova/#comment-1891
我發現方差分析是一個很好的可視化工具。 它不像以前的答案那樣精確,但是您可以交互式地進行可視化處理。發現它很有趣:http://students.brown.edu/seeing-theory/regression/index.html#third
九 答案:
chl
2010-12-09 04:24:18 UTC
view on stackexchange narkive permalink

我個人喜歡通過介紹線性回歸和ANOVA來展示線性回歸和ANOVA,線性模型足以劃分總方差:我們在結果中存在某種方差,可以用感興趣的因素來解釋,加上無法解釋的部分(稱為“殘差”)。我通常使用以下圖示(灰色線表示總可變性,黑色線表示組或個體特定可變性):

alt text

我也喜歡 heplots R包,來自Michael Friendly和John Fox,但另請參見多元線性模型中的視覺假設檢驗:R的heplots包

解釋ANOVA實際含義的標準方法Christensen在複雜問題的平面答案中確實很好地解釋了這一點,特別是在線性模型框架中,但是其中很少有插圖。 Saville和Wood的統計方法:幾何方法有一些示例,但主要涉及回歸。在主要關注DoE的蒙哥馬利的實驗設計和分析中,有一些我喜歡的插圖,但請參見下文

alt text

(這些是我的:-)

但是我想,如果您想了解平方和,誤差等如何轉化為向量空間,就必須在線性模型上尋找教科書,如所示維基百科。 Davidson和MacKinnon撰寫的計量經濟學的估計和推論似乎有很好的插圖(第一章實際上涵蓋了OLS幾何),但我只瀏覽了法語翻譯(在此處提供) 。 線性回歸的幾何也有一些很好的例證。

編輯

嗯,我只記得Robert Pruzek的這篇文章,單向方差分析的新圖形

編輯2

現在, granova軟件包(由@ gd047提及並與上述論文相關聯)具有已移植到ggplot,請參見 granovaGG,並在下面帶有單向方差分析的說明。

enter image description here

第一個插圖是使用R製作的嗎?
@gd047是的。如果需要,應該在某處放置醜陋的源代碼。第二個是在Metapost中完成的。
@gd047好吧,像往常一樣,它總是在我們無法找到舊代碼的情況下找到(儘管我盡了最大努力使用grep / find),所以我重寫了一個快速(仍然很醜陋)的[R腳本](https:// gist。 github.com/736212)。我還舉了一個[MP代碼](https://gist.github.com/736216)的示例。
不幸的是,[線性回歸的幾何形狀](http://www.ceseephd.net/wp-content/uploads/2011/12/Projection1.pdf)鏈接似乎已腐爛。
EDi
2010-12-11 19:19:30 UTC
view on stackexchange narkive permalink

這樣的事情怎麼樣?alt text

跟隨克勞利(2005)。統計。使用R:Wiley進行介紹。

(+1)我想起了`plot.design()`(但您使用的是增強版本:-)
這是最好的。
Tal Galili
2010-12-11 01:15:08 UTC
view on stackexchange narkive permalink

謝謝您迄今為止的出色回答。雖然它們很有啟發性,但我覺得在我目前正在教授的課程中使用它們(好吧,TA'ing)對我的學生來說太過分了。 (我幫助醫學高等專業的學生開設了《生物統計學》課程)

因此,我最終創建了兩個圖像(兩個都是基於模擬的),我認為這是解釋方差分析的有用示例。

我很樂意閱讀對它們進行改進的評論或建議。

第一張圖片顯示了模擬的30個數據點,分為3個圖(顯示了MST = Var與創建MSB和MSW的數據分開:

  • 左圖顯示了每組數據的散點圖。
  • 中間的圖顯示了
  • 右圖顯示了我們將用於MSW的數據的樣子。

alt text

第二張圖顯示了4個圖,每個圖代表各組的方差和期望值的不同組合,而

  • 第一行圖是針對低方差的,而第二行行用於高(高)方差。
  • 圖的第一列用於等式l組之間的期望值,而第二列顯示具有(非常)不同期望值的組。

alt text

(+1)我始終認為,在進行ANOVA教學時,外賣消息是:(1)我們有一個F比率,該比率反映了由我們感興趣的因素所引起的方差的相對重要性。總方差(或MSB / MSW,其中MSW = MST-MSB),(2)組均值之間的差異是方差,(3)我們明確測試$ H_0:〜\ mu_1 = \ mu_2 = \ ldots = \ mu_k $ * vs. * $ H_1:〜\ exists \ i,j〜|〜\ mu_i \ neq \ mu_j $($ H_1 \ equiv \ neg〜H_0 $)。如果您能夠將這些想法傳達到圖形顯示中(在這裡似乎就是這種情況),那麼我認為您已經完成了。
嗨,謝謝,謝謝您的積極反饋(以及您之前的詳細回答)!我認為從準備該課程的材料中學到的一些最大的按摩方法是:1)如何描述原始數據的轉換,以便獲得MSB和MSW方差度量。 2)MSB / MSW的測試統計量如何實際上是單側(而非雙面)測試,其中H0是MSB <= MSW。最後,我只是想指出SSW = SST-SSB是正確的(但我看不到MSW = MST-MSB的真實情況)。
是的,對不起,我很快就寫了。我的意思是:考慮模型$ y_ {ij} = \ mu + \ alpha_i + \ varepsilon_ {ij} $或$ y_ {ij} = \ mu_i + \ varepsilon_ {ij} $,並以圖形方式突出顯示以下分解:$ y_ { ij} = \ bar {y_i} + \ varepsilon_ {ij} = \ bar {y} +(\ bar {y} _i- \ bar {y})+(y_ {ij}-\ bar {y} _i)$ ,那就是obs。表示為與總體平均值+組平均值+組平均值周圍波動之間的偏差。然後,我們有$(y_ {ij}-\ bar {y})=(\ bar {y} _i- \ bar {y})+(y_ {ij}-\ bar {y} _i)$或總變化=組間差異+組內差異(基本上是您的第一張照片)。
George Dontas
2010-12-11 23:33:57 UTC
view on stackexchange narkive permalink

由於我們在本文中收集了某些類型的漂亮圖形,因此,這是我最近發現的另一種圖形,可以幫助您了解ANOVA的工作原理以及F統計量的生成方式。圖形是使用R中的 granova包創建的。alt text

(+1)我給了Robert Pruzek的文章一個鏈接,但我不知道它在R中可用。
Dimitry L
2010-12-09 08:19:57 UTC
view on stackexchange narkive permalink

在ggplot上查看Hadley Wickham的演示文稿( pdf mirror)。從本文檔的第23-40頁開始,他描述了一種有趣的可視化方差分析方法。 p p>

*鏈接來自: http://had.co.nz/ggplot2/

user1108
2012-01-01 07:03:06 UTC
view on stackexchange narkive permalink

很好的問題。您知道,我一直在努力將自己的頭纏在方差分析上很長時間。我總是發現自己回到了“在中間而在內部”的直覺,並且我一直試圖想像在我的腦海中會是什麼樣子。我很高興這個問題浮出水面,上面的答案使我驚訝。

無論如何,很長一段時間(甚至幾年)我都想在一個地方收集幾個地塊,從多個不同的方向我可以看到同時發生的事情:1)人口有多遠,2)數據有多遠是,3)之間的 與內部的有多大; 4)中央非中央 > F分佈比較嗎?

在一個真正的偉大世界中,我什至可以玩滑塊來查看樣本量如何改變事物。

所以我一直在使用 RStudio中的 manipulate 命令,這真是太好了!這是其中的一個圖,實際上是一個快照:

visualizeANOVA

如果您有RStudio,則可以獲取製作上述圖的代碼(滑塊和全部)! 在Github上

玩了一段時間之後,我驚訝於F統計量如何區分這些組,即使樣本量較小也是如此。當我查看人群時,它們之間的距離確實不遠(在我看來),但是,“內部”條與“中間”條始終相形見war。我想每天都學點東西。

David
2012-01-02 05:33:47 UTC
view on stackexchange narkive permalink

為了說明單向方差分析發生了什麼,我有時使用了“統計學實踐概論”作者提供的小程序,該程序可以讓學生在方差之內和之間進行遊戲,觀察其對方差的影響。 F統計量。 此處是鏈接(小程序是頁面上的最後一個)。屏幕截圖示例:

enter image description here

用戶控制頂部滑塊,從而改變三組數據的垂直範圍。底部的紅點沿著p值的曲線移動,同時更新下面顯示的F統計信息。

russellpierce
2010-12-11 20:43:17 UTC
view on stackexchange narkive permalink

看來這艘船已經開了答案,但是我認為,如果這是一門入門課程,那麼這裡提供的大多數展示品對於入門學生還是太難了……至少沒有介紹性的顯示就很難掌握,該介紹性的顯示提供了分區差異的非常簡化的解釋。向他們展示SST總數如何隨主題數量的增加而增加。然後將其顯示為多個主題膨脹後(可能在每個組中多次添加),然後說明SST = SSB + SSW(儘管我更喜歡從一開始就稱其為SSE,因為在進行IMO內部主題測試時可以避免混淆)。然後向他們展示方差分區的直觀表示,例如一個大正方形的顏色編碼,使您可以看到SST是如何由SSB和SSW製成的。然後,類似於Tals或EDi的圖可能會有用,但是我同意EDi的觀點,出於教學目的,比例表應該是SS而不是MS。

Martin Van der Linden
2014-02-21 00:59:37 UTC
view on stackexchange narkive permalink

以下是ANOVA在$ Y $和$ X $之間的擬合程度不同的情況下的一些表示形式。

enter image description here

enter image description here

enter image description here



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 2.0許可。
Loading...