我個人喜歡通過介紹線性回歸和ANOVA來展示線性回歸和ANOVA,線性模型足以劃分總方差:我們在結果中存在某種方差,可以用感興趣的因素來解釋,加上無法解釋的部分(稱為“殘差”)。我通常使用以下圖示(灰色線表示總可變性,黑色線表示組或個體特定可變性):
我也喜歡 heplots R包,來自Michael Friendly和John Fox,但另請參見多元線性模型中的視覺假設檢驗:R的heplots包。
解釋ANOVA實際含義的標準方法Christensen在複雜問題的平面答案中確實很好地解釋了這一點,特別是在線性模型框架中,但是其中很少有插圖。 Saville和Wood的統計方法:幾何方法有一些示例,但主要涉及回歸。在主要關注DoE的蒙哥馬利的實驗設計和分析中,有一些我喜歡的插圖,但請參見下文
(這些是我的:-)
但是我想,如果您想了解平方和,誤差等如何轉化為向量空間,就必須在線性模型上尋找教科書,如所示維基百科。 Davidson和MacKinnon撰寫的計量經濟學的估計和推論似乎有很好的插圖(第一章實際上涵蓋了OLS幾何),但我只瀏覽了法語翻譯(在此處提供) 。 線性回歸的幾何也有一些很好的例證。
編輯:
嗯,我只記得Robert Pruzek的這篇文章,單向方差分析的新圖形 。
編輯2
現在, granova軟件包(由@ gd047提及並與上述論文相關聯)具有已移植到ggplot,請參見 granovaGG,並在下面帶有單向方差分析的說明。
謝謝您迄今為止的出色回答。雖然它們很有啟發性,但我覺得在我目前正在教授的課程中使用它們(好吧,TA'ing)對我的學生來說太過分了。 (我幫助醫學高等專業的學生開設了《生物統計學》課程)
因此,我最終創建了兩個圖像(兩個都是基於模擬的),我認為這是解釋方差分析的有用示例。
我很樂意閱讀對它們進行改進的評論或建議。
第一張圖片顯示了模擬的30個數據點,分為3個圖(顯示了MST = Var與創建MSB和MSW的數據分開:
第二張圖顯示了4個圖,每個圖代表各組的方差和期望值的不同組合,而
由於我們在本文中收集了某些類型的漂亮圖形,因此,這是我最近發現的另一種圖形,可以幫助您了解ANOVA的工作原理以及F統計量的生成方式。圖形是使用R中的 granova包創建的。
在ggplot上查看Hadley Wickham的演示文稿( pdf, mirror)。從本文檔的第23-40頁開始,他描述了一種有趣的可視化方差分析方法。 p p>
*鏈接來自: http://had.co.nz/ggplot2/
很好的問題。您知道,我一直在努力將自己的頭纏在方差分析上很長時間。我總是發現自己回到了“在中間而在內部”的直覺,並且我一直試圖想像在我的腦海中會是什麼樣子。我很高興這個問題浮出水面,上面的答案使我驚訝。
無論如何,很長一段時間(甚至幾年)我都想在一個地方收集幾個地塊,從多個不同的方向我可以看到同時發生的事情:1)人口有多遠,2)數據有多遠是,3)之間的 與內部的有多大; 4)中央與非中央 > F分佈比較嗎?
在一個真正的偉大世界中,我什至可以玩滑塊來查看樣本量如何改變事物。
所以我一直在使用 RStudio中的 manipulate
命令,這真是太好了!這是其中的一個圖,實際上是一個快照:
如果您有RStudio,則可以獲取製作上述圖的代碼(滑塊和全部)! 在Github上。
玩了一段時間之後,我驚訝於F統計量如何區分這些組,即使樣本量較小也是如此。當我查看人群時,它們之間的距離確實不遠(在我看來),但是,“內部”條與“中間”條始終相形見war。我想每天都學點東西。
為了說明單向方差分析發生了什麼,我有時使用了“統計學實踐概論”作者提供的小程序,該程序可以讓學生在方差之內和之間進行遊戲,觀察其對方差的影響。 F統計量。 此處是鏈接(小程序是頁面上的最後一個)。屏幕截圖示例:
用戶控制頂部滑塊,從而改變三組數據的垂直範圍。底部的紅點沿著p值的曲線移動,同時更新下面顯示的F統計信息。
看來這艘船已經開了答案,但是我認為,如果這是一門入門課程,那麼這裡提供的大多數展示品對於入門學生還是太難了……至少沒有介紹性的顯示就很難掌握,該介紹性的顯示提供了分區差異的非常簡化的解釋。向他們展示SST總數如何隨主題數量的增加而增加。然後將其顯示為多個主題膨脹後(可能在每個組中多次添加),然後說明SST = SSB + SSW(儘管我更喜歡從一開始就稱其為SSE,因為在進行IMO內部主題測試時可以避免混淆)。然後向他們展示方差分區的直觀表示,例如一個大正方形的顏色編碼,使您可以看到SST是如何由SSB和SSW製成的。然後,類似於Tals或EDi的圖可能會有用,但是我同意EDi的觀點,出於教學目的,比例表應該是SS而不是MS。