如何可視化方差分析的作用？

題:

如何可視化方差分析的作用？

Tal Galili

2010-12-09 03:45:46 UTC

view on stackexchange narkive permalink

可以通過什麼方式直觀地解釋什麼是方差分析？

任何引用，鏈接（R包？）都將受到歡迎。

克里斯托弗·馬格努森（Kristoffer Magnusson）在他的博客“心理學家在統計編程中的努力”中提供了一個使用D3.js進行單向方差可視化的絕佳示例，網址為http://rpsychologist.com/d3-one-way-anova/#comment-1891

我發現方差分析是一個很好的可視化工具。它不像以前的答案那樣精確，但是您可以交互式地進行可視化處理。發現它很有趣：http://students.brown.edu/seeing-theory/regression/index.html#third

九答案:

chl

2010-12-09 04:24:18 UTC

view on stackexchange narkive permalink

我個人喜歡通過介紹線性回歸和ANOVA來展示線性回歸和ANOVA，線性模型足以劃分總方差：我們在結果中存在某種方差，可以用感興趣的因素來解釋，加上無法解釋的部分（稱為“殘差”）。我通常使用以下圖示（灰色線表示總可變性，黑色線表示組或個體特定可變性）：

alt text

我也喜歡 heplots R包，來自Michael Friendly和John Fox，但另請參見多元線性模型中的視覺假設檢驗：R的heplots包。

解釋ANOVA實際含義的標準方法Christensen在複雜問題的平面答案中確實很好地解釋了這一點，特別是在線性模型框架中，但是其中很少有插圖。 Saville和Wood的統計方法：幾何方法有一些示例，但主要涉及回歸。在主要關注DoE的蒙哥馬利的實驗設計和分析中，有一些我喜歡的插圖，但請參見下文

alt text

（這些是我的：-）

但是我想，如果您想了解平方和，誤差等如何轉化為向量空間，就必須在線性模型上尋找教科書，如所示維基百科。 Davidson和MacKinnon撰寫的計量經濟學的估計和推論似乎有很好的插圖（第一章實際上涵蓋了OLS幾何），但我只瀏覽了法語翻譯（在此處提供）。線性回歸的幾何也有一些很好的例證。

編輯：

嗯，我只記得Robert Pruzek的這篇文章，單向方差分析的新圖形。

編輯2

現在， granova軟件包（由@ gd047提及並與上述論文相關聯）具有已移植到ggplot，請參見 granovaGG，並在下面帶有單向方差分析的說明。

enter image description here

第一個插圖是使用R製作的嗎？

@gd047是的。如果需要，應該在某處放置醜陋的源代碼。第二個是在Metapost中完成的。

@gd047好吧，像往常一樣，它總是在我們無法找到舊代碼的情況下找到（儘管我盡了最大努力使用grep / find），所以我重寫了一個快速（仍然很醜陋）的[R腳本]（https：// gist。 github.com/736212）。我還舉了一個[MP代碼]（https://gist.github.com/736216）的示例。

不幸的是，[線性回歸的幾何形狀]（http://www.ceseephd.net/wp-content/uploads/2011/12/Projection1.pdf）鏈接似乎已腐爛。

EDi

2010-12-11 19:19:30 UTC

view on stackexchange narkive permalink

這樣的事情怎麼樣？ alt text

跟隨克勞利（2005）。統計。使用R：Wiley進行介紹。

（+1）我想起了`plot.design（）`（但您使用的是增強版本:-)

這是最好的。

Tal Galili

2010-12-11 01:15:08 UTC

view on stackexchange narkive permalink

謝謝您迄今為止的出色回答。雖然它們很有啟發性，但我覺得在我目前正在教授的課程中使用它們（好吧，TA'ing）對我的學生來說太過分了。（我幫助醫學高等專業的學生開設了《生物統計學》課程）

因此，我最終創建了兩個圖像（兩個都是基於模擬的），我認為這是解釋方差分析的有用示例。

我很樂意閱讀對它們進行改進的評論或建議。

第一張圖片顯示了模擬的30個數據點，分為3個圖（顯示了MST = Var與創建MSB和MSW的數據分開：

左圖顯示了每組數據的散點圖。
中間的圖顯示了
右圖顯示了我們將用於MSW的數據的樣子。

alt text

第二張圖顯示了4個圖，每個圖代表各組的方差和期望值的不同組合，而

第一行圖是針對低方差的，而第二行行用於高（高）方差。
圖的第一列用於等式l組之間的期望值，而第二列顯示具有（非常）不同期望值的組。

alt text

（+1）我始終認為，在進行ANOVA教學時，外賣消息是：（1）我們有一個F比率，該比率反映了由我們感興趣的因素所引起的方差的相對重要性。總方差（或MSB / MSW，其中MSW = MST-MSB），（2）組均值之間的差異是方差，（3）我們明確測試$ H_0：〜\ mu_1 = \ mu_2 = \ ldots = \ mu_k $ * vs. * $ H_1：〜\ exists \ i，j〜|〜\ mu_i \ neq \ mu_j $（$ H_1 \ equiv \ neg〜H_0 $）。如果您能夠將這些想法傳達到圖形顯示中（在這裡似乎就是這種情況），那麼我認為您已經完成了。

嗨，謝謝，謝謝您的積極反饋（以及您之前的詳細回答）！我認為從準備該課程的材料中學到的一些最大的按摩方法是：1）如何描述原始數據的轉換，以便獲得MSB和MSW方差度量。 2）MSB / MSW的測試統計量如何實際上是單側（而非雙面）測試，其中H0是MSB <= MSW。最後，我只是想指出SSW = SST-SSB是正確的（但我看不到MSW = MST-MSB的真實情況）。

是的，對不起，我很快就寫了。我的意思是：考慮模型$ y_ {ij} = \ mu + \ alpha_i + \ varepsilon_ {ij} $或$ y_ {ij} = \ mu_i + \ varepsilon_ {ij} $，並以圖形方式突出顯示以下分解：$ y_ { ij} = \ bar {y_i} + \ varepsilon_ {ij} = \ bar {y} +（\ bar {y} _i- \ bar {y}）+（y_ {ij}-\ bar {y} _i）$ ，那就是obs。表示為與總體平均值+組平均值+組平均值周圍波動之間的偏差。然後，我們有$（y_ {ij}-\ bar {y}）=（\ bar {y} _i- \ bar {y}）+（y_ {ij}-\ bar {y} _i）$或總變化=組間差異+組內差異（基本上是您的第一張照片）。

George Dontas

2010-12-11 23:33:57 UTC

view on stackexchange narkive permalink

由於我們在本文中收集了某些類型的漂亮圖形，因此，這是我最近發現的另一種圖形，可以幫助您了解ANOVA的工作原理以及F統計量的生成方式。圖形是使用R中的 granova包創建的。 alt text

（+1）我給了Robert Pruzek的文章一個鏈接，但我不知道它在R中可用。

Dimitry L

2010-12-09 08:19:57 UTC

view on stackexchange narkive permalink

在ggplot上查看Hadley Wickham的演示文稿（ pdf， mirror）。從本文檔的第23-40頁開始，他描述了一種有趣的可視化方差分析方法。 p p>

*鏈接來自： http://had.co.nz/ggplot2/

user1108

2012-01-01 07:03:06 UTC

view on stackexchange narkive permalink

很好的問題。您知道，我一直在努力將自己的頭纏在方差分析上很長時間。我總是發現自己回到了“在中間而在內部”的直覺，並且我一直試圖想像在我的腦海中會是什麼樣子。我很高興這個問題浮出水面，上面的答案使我驚訝。

無論如何，很長一段時間（甚至幾年）我都想在一個地方收集幾個地塊，從多個不同的方向我可以看到同時發生的事情：1）人口有多遠，2）數據有多遠是，3）之間的與內部的有多大； 4）中央與非中央 > F分佈比較嗎？

在一個真正的偉大世界中，我什至可以玩滑塊來查看樣本量如何改變事物。

所以我一直在使用 RStudio中的 manipulate 命令，這真是太好了！這是其中的一個圖，實際上是一個快照：

visualizeANOVA

如果您有RStudio，則可以獲取製作上述圖的代碼（滑塊和全部）！在Github上。

玩了一段時間之後，我驚訝於F統計量如何區分這些組，即使樣本量較小也是如此。當我查看人群時，它們之間的距離確實不遠（在我看來），但是，“內部”條與“中間”條始終相形見war。我想每天都學點東西。

David

2012-01-02 05:33:47 UTC

view on stackexchange narkive permalink

為了說明單向方差分析發生了什麼，我有時使用了“統計學實踐概論”作者提供的小程序，該程序可以讓學生在方差之內和之間進行遊戲，觀察其對方差的影響。 F統計量。此處是鏈接（小程序是頁面上的最後一個）。屏幕截圖示例：

enter image description here

用戶控制頂部滑塊，從而改變三組數據的垂直範圍。底部的紅點沿著p值的曲線移動，同時更新下面顯示的F統計信息。

russellpierce

2010-12-11 20:43:17 UTC

view on stackexchange narkive permalink

看來這艘船已經開了答案，但是我認為，如果這是一門入門課程，那麼這裡提供的大多數展示品對於入門學生還是太難了……至少沒有介紹性的顯示就很難掌握，該介紹性的顯示提供了分區差異的非常簡化的解釋。向他們展示SST總數如何隨主題數量的增加而增加。然後將其顯示為多個主題膨脹後（可能在每個組中多次添加），然後說明SST = SSB + SSW（儘管我更喜歡從一開始就稱其為SSE，因為在進行IMO內部主題測試時可以避免混淆）。然後向他們展示方差分區的直觀表示，例如一個大正方形的顏色編碼，使您可以看到SST是如何由SSB和SSW製成的。然後，類似於Tals或EDi的圖可能會有用，但是我同意EDi的觀點，出於教學目的，比例表應該是SS而不是MS。

Martin Van der Linden

2014-02-21 00:59:37 UTC

view on stackexchange narkive permalink

以下是ANOVA在$ Y $和$ X $之間的擬合程度不同的情況下的一些表示形式。

enter image description here

ⓘ

該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到，我們感謝它分發的cc by-sa 2.0許可。

关于 - 法律