題:
教學示例:相關並不意味著因果關係
csgillespie
2010-07-20 00:31:47 UTC
view on stackexchange narkive permalink

有一句老話:“關聯不等於因果關係”。在教書時,我傾向於使用以下標準示例來說明這一點:

  1. 丹麥的鸛數量和出生率;
  2. 美國的牧師數量和酗酒;
  3. 在20世紀初,人們注​​意到“收音機的數量”和“瘋人院的人數”之間有很強的相關性,
  4. 和我最喜歡的是: 海盜會導致全球變暖
  5. ol>

    但是,我沒有這些示例的參考,雖然很有趣,但它們顯然是錯誤的。

    有人還有其他好的例子嗎?

HTTP://辛苦程度.com/552/
海盜/全球變暖圖表顯然是由陰謀論者捏造的-任何人都可以看到他們故意在不相等的時間間隔內繪製均勻的間隔,以​​避免由於海盜幾乎被全部消滅而顯示出近期溫度的急劇上升。上升會使朗姆酒蒸發並且海盜無法在這些條件下生存。;-)
並且:http://xkcd.com/111/(xkcd:Firefox和Witchcraft-連接?)
WTF在該海盜圖上的x軸向上?
或您在[Google Correlate](http://www.google.com/trends/correlate)中放入的幾乎所有內容都可以使用。
經濟學家正在盡力分析因果關係。如果您可以確定重要問題的因果關係,則可以在頂級期刊上發表論文。
翻閱Freakonomics中的一些很好的例子。他們的參考書目充斥著參考文獻。
我在網站上看到列出相關數據的網站,我在Google上搜索並發現了[this](http://www.fastcodesign.com/3030529/infographic-of-the-day/hilarious-graphs-prove-that-correlation-isnt-因果關係),可能會有所幫助。
那是一張關於海盜的漂亮照片。它幾乎是數據透視表之類的東西。我應該使一些財務報告看起來像那樣。
28 答案:
Paul
2010-07-20 00:45:20 UTC
view on stackexchange narkive permalink

解釋“原因”是一種非對稱關係(X導致Y與Y導致X不同)而“與...相關”是一種對稱關係可能很有用。

例如,無家可歸的人口與犯罪率可能是相關的,因為在同一地點這兩者往往較高或較低。同樣可以說,無家可歸人口與犯罪率相關,或者犯罪率與無家可歸人口相關。說犯罪導致無家可歸,或無家可歸的人口導致犯罪是不同的說法。並且相關性並不意味著兩者都是正確的。例如,根本原因可能是第三個變量,例如吸毒或失業。

統計數學不善於找出根本原因,這需要其他形式的判斷。

判斷是一個好詞,因為我們所能觀察到的只是相關性。實驗和/或聰明的統計數據所能做的就是讓我們排除一些可能造成影響的替代解釋。
關於對稱/非對稱關係的很好的評論。也可能有人聲稱,全球變暖導致海盜行為增加。
Peter Flom
2011-11-08 17:34:11 UTC
view on stackexchange narkive permalink

我的最愛:

1)消防員越發火,造成的傷害就越大。

2)受輔導的孩子的成績會比受到輔導的孩子差。

並且(這是我的頭等)

3)成年。

(@xmjx去年提供了第一個示例。)我喜歡占星術示例。
你能用星象符號解釋樣本嗎?
沒關係,我明白了。這與年初出生的孩子和年底出生的孩子之間的年齡差異有關。真好
Neil McGuigan
2010-07-20 00:54:03 UTC
view on stackexchange narkive permalink
  1. 有時相關性就足夠了。例如,在汽車保險中,男性駕駛員與更多事故相關,因此保險公司向他們收取更多費用。您實際上無法測試是否有因果關係。您無法通過實驗更改駕駛員的性別。谷歌已經使數千億美元不在乎因果關係。

  2. 要找到因果關係,通常需要實驗數據,而不是觀測數據。但是,從經濟學上來說,他們經常在系統上使用觀察到的“衝擊”來檢驗因果關係,例如,如果CEO突然去世並且股價上漲,則可以假設因果關係。

  3. 關聯是因果關係的必要但非充分條件。顯示因果關係需要反事實。

  4. ol>
我喜歡你舉的第一個例子。那肯定會讓學生說話;)
Steve Steinberg在他的博客上有一個有趣的討論,網址為:http://blog.steinberg.org/?p=11,涉及1的一些含義以及在弱AI方面可能導致的問題。
有人可以擴大最後一句話嗎?
簡要說明一下:因果關係不需要相關性(取決於相關性是什麼意思):如果相關性是線性相關性(使用術語時,默認情況下會假設相當多的人擁有少量統計數據),但是因果關係是非線性的。例如,如果$(-1,1)$中的$ X $直接導致$ Y $(它採用$(0,1)$中的值),但是$ Y = \ sqrt {1-X ^ 2} $。如果$ X's $是對稱分佈的,則$ X $和$ Y $即使完全依賴也將不相關。
chrisamiller
2010-07-25 23:02:07 UTC
view on stackexchange narkive permalink

我一直喜歡這個:

lemons vs deaths

來源: http://pubs.acs.org/doi/abs/10.1021/ci700332k

很好,但是我看不到有人試圖得出因果關係的結論。還是墨西哥檸檬卡車司機一旦越過邊界而臭名昭著的危險?
顯然,美國檸檬法規的大量湧現是不可預見的。例如,請參見:http://zh.wikipedia.org/wiki/檸檬法
我的一位同事查看了2000年後這段時間的數據,發現這種關係保持了“樣本外”的良好狀態,這更令人不安。
HTTPS://配不上.同問IMG.com/Media/BBB M YX拿CIA i我1Ed.jpg:large
一個簡單的合理化就是兩者都隨著時間而減少。 2000年後的數據是否支持?
不可預見的,@Thylacoleo?為什麼有人會驚訝於道路上的檸檬減少導致死亡人數減少? ;)
我不明白這裡的一些評論。在我看來,1996年至2000年之間進口的檸檬數量增加了嗎?
Roger
2011-11-08 10:46:44 UTC
view on stackexchange narkive permalink

我有一些我喜歡使用的例子。

  1. 在調查80年代紐約市的犯罪原因時,當他們試圖清理這座城市時,一位學者發現,兩者之間犯下了嚴重的罪行,街頭小販賣出的冰淇淋數量也很大!(原因是什麼?結果是什麼?)顯然,有一個未觀察到的變量導致了兩者。夏季是犯罪率最高,冰淇淋銷售最多的時期。

  2. 手掌的大小與您的壽命長短負相關(真的!)。實際上,女性手掌較小,壽命更長。

  3. [我的最愛]幾年前,我聽說一項研究,發現一個人喝的蘇打水與肥胖的可能性呈正相關。 > strong>(我對自己說-這很有道理,因為這一定是由於人們喝了含糖蘇打水並吸收了所有的空熱量。)幾天后,出現了更多細節。幾乎所有的相關性都是由於飲食軟飲料消費量的增加。 (這使我的理論大吃一驚!)那麼,因果關係是哪一條呢?減肥軟飲料會導致人體重增加,還是體重增加會導致減肥軟飲料的消費量增加? (在得出結論之前是後者,請參見一項研究,其中對大鼠的對照實驗表明,飼餵含人造甜味劑的酸奶的組的體重比飼餵普通酸奶的組的體重更大。)兩個參考文獻:飲料更多的減肥汽水,增加體重?; 與肥胖症有關的飲食蘇打。我認為他們仍在嘗試解決這一問題。

  4. ol>
最後一個要比您介紹的要復雜一些,但是我同意,應該用挑剔的眼光看待蘇打/減肥蘇打與肥胖之間的許多觀察聯繫。從理論上講,假糖/脂肪替代品除了簡單的卡路里攝入外,還具有其他生理作用。參見例如[此大鼠和合成脂肪實驗](http://www.freakonomics.com/2011/06/30/do-synthetic-fat-substitutes-make-you-fat-ask-the-rats-who -ate-pringles /)(摘自Freakonomics博客)。
Harvey Motulsky
2012-12-09 02:35:03 UTC
view on stackexchange narkive permalink

一個國家(根據人口調整)獲得的諾貝爾獎的數量與人均巧克力消費量密切相關。 (新英格蘭醫學雜誌

enter image description here

+1當他們發布此書時,我對NEJM感到非常失望
似乎也很接近瑞典。
巧克力消費量(人均)也與連環殺手的人均數量顯著相關。http://replicatedtypo.com/chocolate-consumption-traffic-accidents-and-serial-killers/5718.html
哈維(Harvey),我認為諾貝爾獎獲得者與連環殺人犯是有道理的:這兩個都是離群值,觀察這兩個詞意味著相對於其他國家而言,這兩個詞作為基礎的任何社會心理因素的分佈都較重。
我問了三個我(大概)認識的諾貝爾獎獲得者,所有三個人都說他們比大多數同事吃得更多。當然,這些答案是在閱讀NEJM論文之後得出的!
可以,我完全傻了嗎?人均巧克力消費量是否是較高的平均收入和較高的平均收入之間的相關性,就意味著受過更好的教育,受過良好教育的國家有更多的諾貝爾獎獲得者嗎? (對不起,我剛找到這個SE,對這個話題真的很菜鳥)
@Jonathan。那是一種理論。您需要繪製人均收入值與諾貝爾獎的關係圖,以了解這種解釋是否有意義。
@MattBagg,它以_“臨時註釋” _的形式發布,顯然不被重視。
-1
@MattBagg Aw,PLOS論文令人難過,提醒我們其中有多少人沒有幽默感。《自然》信是對諾貝爾獎獲得者的巧克力消費量的一項調查,當然他們會引用它。儘管有趣的是存在一種相關性,但是沒有人理智地得出結論,這是一種因果關係。相反,那裡似乎仍然存在某種東西–現在是否是由於某種巧克力成分所致,如果前往諾貝爾獎的人們減少了煩惱並吃了更多的巧克力,如果這是他們的社交背景,或者是巧克力製造商贊助的學校是否適合搶。;)
@MattBagg這篇文章可口可笑。NEJM通過發布它而做得很好,因為有些人不理解這個笑話使它變得更大。
Simon Byrne
2010-08-15 00:50:51 UTC
view on stackexchange narkive permalink

儘管它更多地是多重比較問題的例證,但它也是因果歸因不當的一個很好的例子:

橄欖球(威爾士宗教)及其對天主教的影響:教皇本尼迪克特十六世應該擔心嗎?

”每次威爾士贏得橄欖球大滿貫賽事時,教皇都死了,除了1978年威爾士的情況非常好外,還有兩名教皇去世。 “

Graham Cookson
2010-07-21 22:06:32 UTC
view on stackexchange narkive permalink

這個我想解決的事後ergo propter hoc 問題有兩個方面:(i)反向因果關係和(ii)內生性

“可能”的示例反向因果關係:社會飲酒與收入-根據Bethany L. Peters & Edward Stringham(2006年,飲酒者賺取更多的錢。 《勞動研究》,交易出版商,第27(3)卷,第411-421頁,六月)。還是賺更多錢的人喝更多的酒,要么是因為他們有更多的可支配收入,要么是因為壓力?這是一篇討論各種原因的出色論文,包括測量誤差,響應偏差,因果關係等。

“可能的”內生性示例:Mincer方程通過教育,經驗和經驗來解釋對數收益平方。關於這個話題有很長的文獻。勞動經濟學家想估計教育與收入之間的因果關係,但是教育可能是內生的,因為“能力”可以增加個人所受教育的數量(通過降低獲得教育的成本),並可能導致收入增加,而無論教育水平。一個可能的解決方案可能是工具變量。 Angrist和Pischke的書《幾乎無害計量經濟學》涵蓋了這一點,並與主題進行了非常詳細和清晰的說明。因此,讓我們將電視發送到發展中國家。顯然,兩者都是類似於GDP的內生因素。-鯊魚襲擊和冰淇淋銷售的數量。也許兩者都是溫度的內生因素?

我也想講一個關於瘋子和蜘蛛的可怕笑話。一個瘋子帶著一隻手掌上的蜘蛛在庇護所的走廊裡徘徊。他看了醫生,說:“看醫生,我可以和蜘蛛說話。看著這個。”“蜘蛛,向左走!”蜘蛛適當地向左移動。他繼續說,““蜘蛛,向右走。”醫生回答:“有趣的是,也許我們應該在下一個小組會議上談論這個。”瘋子反駁說,“那不是醫生。注意這一點。”他一個接一個地拉開蜘蛛的每條腿,然後大喊:“蜘蛛,向左走!腿會聾。”

TJM
2012-12-17 03:59:02 UTC
view on stackexchange narkive permalink

我所教過的最好的冰淇淋是溺水的數量,冰淇淋的銷量可能高度相關,但這並不意味著一種會導致另一種。在夏季,天氣好的時候,冰淇淋的溺水和銷售明顯增加。第三變量又稱為好天氣導致它們。

Andre Holzner
2010-08-16 16:00:12 UTC
view on stackexchange narkive permalink

“海盜會導致全球變暖”的概括:選擇隨時間(單調)增加或減少的任意兩個量,您應該會發現一些相關性。

mary anne
2014-02-04 01:21:45 UTC
view on stackexchange narkive permalink

我與學生一起在“代數一”課程中教授相關性與因果關係。我們研究了許多可能的例子。我發現2013年2月數學老師的文章《捆綁嬰兒和危險的冰淇淋:相關難題》非常有用。我喜歡談論“潛伏變量”的想法。這部動畫片還是一個可愛的對話開始者:

enter image description here

我們在動畫片中確定自變量和因變量,並討論這是否是因果關係的一個例子,如果不是,為什麼不。

Zach
2011-11-08 20:43:24 UTC
view on stackexchange narkive permalink

您可以在 Google Correlate上花費幾分鐘,並提出各種虛假的相關性。

雖然此鏈接可以回答問題,但最好在此處包括答案的基本部分,並提供鏈接以供參考。如果鏈接頁面發生更改,僅鏈接的答案可能會無效。
@gung您是認真的嗎?該鏈接指向的是應用程序,而不是描述答案的簡單頁面。如果鏈接頁面無論如何更改,答案將變得無效,因為該工具將不可用(當前形式)。
James Scott-Brown
2010-08-14 22:59:21 UTC
view on stackexchange narkive permalink

標準引文指出西德的新生嬰兒數量與鸛繁殖對之間的相關性是 性教育的新參數,自然332,495(4月7日, 1988); doi:10.1038 / 332495a0

AdamV
2010-07-22 21:32:58 UTC
view on stackexchange narkive permalink

我(很久以前)讀到一個有趣的例子,關於出生率(或生育率,如果您願意的話,則是生育率)下降的情況,特別是在美國,從1960年代初開始,因為核武器試驗是完全沒有的。創歷史新高(1961年,有史以來最大的核彈在蘇聯進行了試驗)。直到20世紀末,大多數國家終於停止這樣做為止,費率一直在劃定界限。

我現在找不到結合這些數字的參考文獻,但是Wikipedia上的文章中有關於的數字。

當然,從出生初期就“巧合”避孕藥的引入和合法化來看出生率的相關性可能更有意義。 1960年代。 (首先僅在某些州,然後是所有州,僅針對已婚婦女,然後是某些州,針對未婚女子,然後是全面州),但是即使那樣,也只能是原因之一;平等,經濟變化和其他因素的許多其他方面也起著重要作用。

有趣的示例,因為乍一看,它看起來像可能的因果關係,這與許多最簡單的示例不同。
我喜歡的是,您可以引起很多討論,即“影響”是實際上影響生育力(從醫學上來講是一種受孕的能力)還是社會影響力(“我不想讓孩子陷入這種不良狀況)。世界”)。如果沒有其他人提出來,則將重磅炸彈丟下藥丸。然後指出,即使這僅僅是一個可能的因素,並討論其他一些因素。
Dikran Marsupial
2010-08-16 20:29:25 UTC
view on stackexchange narkive permalink

關聯本身不能從不 b>建立因果關係。 戴維·休ume(David Hume)(1771-1776)相當有效地指出,我們不能僅憑經驗手段就無法獲得一定的因果關係知識。康德試圖解決這個問題,康德的維基百科頁面似乎很好地總結了這一點:

康德認為自己在經驗主義者和理性主義者之間做出了妥協。經驗主義者認為,知識是通過經驗本身獲得的,但理性主義者則認為,這種知識容易受到笛卡爾主義的質疑,而理性本身就為我們提供了知識。康德認為,使用理性而不將其運用到經驗中只會導致幻覺,而經驗將是純粹主觀的,而不會首先被純粹地歸入純粹的理性。知道因果關係只是通過觀察相關性而存在,但是康德建議我們也許可以利用我們的理由來區分確實暗示因果關係的相關性與不存在因果關係的相關性。只要康德只是根據合理性而不是某些知識來寫作,我認為休would不會不同意。

簡而言之,相關性提供了暗示因果關係的間接證據,但是證據在很大程度上取決於所涉及的特定情況,我們永遠不能絕對確定。預測干預效果的能力是獲得信心的一種方法(我們無法證明任何事情,但是我們可以通過觀察證據來證明這一點,因此我們至少嘗試過捏造因果關係的理論)。擁有一個簡單的模型可以解釋為什麼我們應該觀察到相關性,同時還可以解釋其他形式的證據,這是我們按照康德的建議運用推理的另一種方式。

告誡者:我完全有可能誤解了這種哲學,但是仍然存在這樣一種情況,即關聯永遠無法提供因果聯繫的證據。

對於它的價值,在當前的術語中,我認為應該將康德理解為斷言,例如在第二個類比中,無論您觀察到什麼相關,都有*一些*因果圖生成它們。據我所知,他沒有確定結構的特定方法,但確實假定它必須完全連接(因為“每個事件都有原因”)。從這個意義上說,他是當代的:因果推論需要混合因果假設,例如通過圖表表示,並觀察數據的規律性。通常,您既無法避免第一部分,也無法從數據中引出第一部分
+1解釋清楚!也許我也是貝葉斯主義者,但我對我們對任何因果關係沒有“一定的了解”的想法並不感到困擾。
user603
2010-09-10 15:48:34 UTC
view on stackexchange narkive permalink

當$ x_t $時; $ y_t $是固定的時間序列,因此$ y_t $和$ x_ {t-1} $之間的相關性意味著$ x_ {t-1} $對$ y_t $的因果關係。由於某些原因,這裡未提及。

確實。請參閱http://en.wikipedia.org/wiki/Granger_causality。
Roman Luštrik
2010-08-14 22:42:41 UTC
view on stackexchange narkive permalink

斯洛文尼亞鄉村男性的精子數量與熊的數量(也在斯洛文尼亞)呈負相關。有些人覺得這很令人擔憂。我將嘗試並進行研究。

nico
2010-08-15 20:33:31 UTC
view on stackexchange narkive permalink

我最近去過一次會議,一位發言者提供了一個非常有趣的示例(儘管重點是要說明其他事情):

  • 美國人和英國人很多脂肪食物。在美國和英國,心血管疾病的發病率很高。

  • 法國人吃很多脂肪食物,但心血管疾病的發病率較低。

  • p>
  • 美國人和英國人喝很多酒。在美國和英國,心血管疾病的發病率很高。

  • 意大利人喝大量的酒精,但又有較低的心血管疾病發生率。 / p>

結論?隨便吃點東西。如果您會說英語,則心髒病發作的機率更高!

這也是生態學謬論的一個很好的例子(即從群體水平的數據推斷出個人水平)。
Harvey Motulsky
2012-12-15 22:02:28 UTC
view on stackexchange narkive permalink

enter image description here

該動畫片rom XKCD也發佈在CrossValidated的其他地方。

xyz
2014-10-27 20:24:39 UTC
view on stackexchange narkive permalink

http://tylervigen.com/

這顯示了很多與因果關係均不相關的關聯-或您是否知道因果關係是什麼蒸汽,熱蒸氣和熱物體與美國小姐年齡與謀殺案的相關性

??

user61177
2014-11-21 08:17:48 UTC
view on stackexchange narkive permalink

我使用的另一個相關示例是,在美國,吃有機食品的人數大量增加,而在美國被診斷出患有自閉症的兒童人數卻有所增加。網上有一個模仿圖-autism organic food parody graph >

Christian
2010-07-23 03:33:38 UTC
view on stackexchange narkive permalink

教授“關聯並不意味著因果關係”並不能真正幫助任何人,因為歸根結底,所有演繹論點都部分基於關聯。的東西。

目標應該是建設性的:始終考慮可能產生相同數據的初始假設的替代方案。

這沒有回答問題:也許應該將其理解為評論。
Shrey
2010-07-27 01:49:33 UTC
view on stackexchange narkive permalink

好,我的教授在介紹性概率類別中使用了這些:

1)鞋子的尺碼與閱讀能力相關

2)鯊魚的襲擊與冰淇淋的銷售相關。

xmjx
2010-09-10 12:40:27 UTC
view on stackexchange narkive permalink

發射更多的消防車,造成的損失更大。

以此為例的唯一問題是存在明顯的反向因果關係。
Robert Jones
2013-08-20 18:56:32 UTC
view on stackexchange narkive permalink

我認為,更好的範式可能是因果關係,它要求與可信的,最好是經過驗證的機制相關聯。我認為在這種情況下應盡量少用“隱含”一詞,因為它有多種含義,包括建議。

Emil Friedman
2014-02-19 04:12:36 UTC
view on stackexchange narkive permalink

鸛的例子在Box的第一版(1978年)的第8頁上,Hunter & Hunter的書名為“ Statistics for Experimenters ...”(Wiley)。我不知道它是否在第二版中。他們將城市標識為奧爾登堡,時間段為1930-1936。

他們引用了 Ornithologische Monatsberichte 44 ,第2號,Jahrgang(1936年),柏林和 48 ,第1號。 Jahrgang,1940年,柏林,以及 Statistiches Jahrbuch Deutscher Gemeinden ,27-33,1932-1938年,耶拿古斯塔夫·費舍爾。

ThiS
2012-12-14 21:27:00 UTC
view on stackexchange narkive permalink

我在一篇文章中看到一個有趣的故事。

孟加拉國的黃油生產與S&P 500在十年內的關聯度最高。

http://www.forbes.com/sites/davidleinweber/2012/07/24/stupid-data-miner-tricks-quants-fooling-themselves-the-economic-indicator-in-your-pants/

??該圖顯示了標普隨時間的變化。標題談論黃油和奶酪的生產,在圖中看不到。 ???
HTTP://女兒的son wall street.type pad.com/沒有_weblog/files/data mine June_2000.PDF
好,現在知道了該圖顯示了多元回歸模型的預測,表明包含三個傻變量可以很好地使模型預測SP500隨時間的變化。這是在多元回歸中過度擬合的一個很好的例子,並間接表明相關性(或幻想模型的擬合優度提高)並不表示因果關係。
Mark C.
2019-07-22 07:50:22 UTC
view on stackexchange narkive permalink

這是一個完美的選擇。不幸的是,它可以用作很好的教學點,因為《華盛頓郵報》的工作人員和疾病控制與預防中心都沒有顯示出任何暗示,認為該文章應該是《洋蔥》中的諷刺作品。

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term = .9dd329c2e837

請總結該鏈接後面所說的內容,不僅是您認為它是錯誤的。
抱歉。但是我認為這是不言自明的。
該鏈接可以很好地用作對源的引用,但是您不應假定每個人都可以真正閱讀它(或者一定不要麻煩)。請記住:此類鏈接非常容易受到鏈接腐爛的影響,並且並非所有報紙都服務於所有地理區域(例如,有些美國報紙認為不值得遵守EU GDPR會因此而阻礙讀者閱讀EU IP地址)。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 2.0許可。
Loading...