有一句老話:“關聯不等於因果關係”。在教書時,我傾向於使用以下標準示例來說明這一點:
- 丹麥的鸛數量和出生率;
- 美國的牧師數量和酗酒;
- 在20世紀初,人們注意到“收音機的數量”和“瘋人院的人數”之間有很強的相關性,
- 和我最喜歡的是: 海盜會導致全球變暖。 ol>
但是,我沒有這些示例的參考,雖然很有趣,但它們顯然是錯誤的。
有人還有其他好的例子嗎?
有一句老話:“關聯不等於因果關係”。在教書時,我傾向於使用以下標準示例來說明這一點:
但是,我沒有這些示例的參考,雖然很有趣,但它們顯然是錯誤的。
有人還有其他好的例子嗎?
解釋“原因”是一種非對稱關係(X導致Y與Y導致X不同)而“與...相關”是一種對稱關係可能很有用。
例如,無家可歸的人口與犯罪率可能是相關的,因為在同一地點這兩者往往較高或較低。同樣可以說,無家可歸人口與犯罪率相關,或者犯罪率與無家可歸人口相關。說犯罪導致無家可歸,或無家可歸的人口導致犯罪是不同的說法。並且相關性並不意味著兩者都是正確的。例如,根本原因可能是第三個變量,例如吸毒或失業。
統計數學不善於找出根本原因,這需要其他形式的判斷。
我的最愛:
1)消防員越發火,造成的傷害就越大。
2)受輔導的孩子的成績會比受到輔導的孩子差。
並且(這是我的頭等)
3)成年。
有時相關性就足夠了。例如,在汽車保險中,男性駕駛員與更多事故相關,因此保險公司向他們收取更多費用。您實際上無法測試是否有因果關係。您無法通過實驗更改駕駛員的性別。谷歌已經使數千億美元不在乎因果關係。
要找到因果關係,通常需要實驗數據,而不是觀測數據。但是,從經濟學上來說,他們經常在系統上使用觀察到的“衝擊”來檢驗因果關係,例如,如果CEO突然去世並且股價上漲,則可以假設因果關係。
關聯是因果關係的必要但非充分條件。顯示因果關係需要反事實。
我有一些我喜歡使用的例子。
在調查80年代紐約市的犯罪原因時,當他們試圖清理這座城市時,一位學者發現,兩者之間犯下了嚴重的罪行,街頭小販賣出的冰淇淋數量也很大!(原因是什麼?結果是什麼?)顯然,有一個未觀察到的變量導致了兩者。夏季是犯罪率最高,冰淇淋銷售最多的時期。
手掌的大小與您的壽命長短負相關(真的!)。實際上,女性手掌較小,壽命更長。
[我的最愛]幾年前,我聽說一項研究,發現一個人喝的蘇打水與肥胖的可能性呈正相關。 > strong>(我對自己說-這很有道理,因為這一定是由於人們喝了含糖蘇打水並吸收了所有的空熱量。)幾天后,出現了更多細節。幾乎所有的相關性都是由於飲食軟飲料消費量的增加。 (這使我的理論大吃一驚!)那麼,因果關係是哪一條呢?減肥軟飲料會導致人體重增加,還是體重增加會導致減肥軟飲料的消費量增加? (在得出結論之前是後者,請參見一項研究,其中對大鼠的對照實驗表明,飼餵含人造甜味劑的酸奶的組的體重比飼餵普通酸奶的組的體重更大。)兩個參考文獻:飲料更多的減肥汽水,增加體重?; 與肥胖症有關的飲食蘇打。我認為他們仍在嘗試解決這一問題。
儘管它更多地是多重比較問題的例證,但它也是因果歸因不當的一個很好的例子:
橄欖球(威爾士宗教)及其對天主教的影響:教皇本尼迪克特十六世應該擔心嗎?
”每次威爾士贏得橄欖球大滿貫賽事時,教皇都死了,除了1978年威爾士的情況非常好外,還有兩名教皇去世。 “
這個我想解決的事後ergo propter hoc 問題有兩個方面:(i)反向因果關係和(ii)內生性
“可能”的示例反向因果關係:社會飲酒與收入-根據Bethany L. Peters & Edward Stringham(2006年,飲酒者賺取更多的錢。 《勞動研究》,交易出版商,第27(3)卷,第411-421頁,六月)。還是賺更多錢的人喝更多的酒,要么是因為他們有更多的可支配收入,要么是因為壓力?這是一篇討論各種原因的出色論文,包括測量誤差,響應偏差,因果關係等。
“可能的”內生性示例:Mincer方程通過教育,經驗和經驗來解釋對數收益平方。關於這個話題有很長的文獻。勞動經濟學家想估計教育與收入之間的因果關係,但是教育可能是內生的,因為“能力”可以增加個人所受教育的數量(通過降低獲得教育的成本),並可能導致收入增加,而無論教育水平。一個可能的解決方案可能是工具變量。 Angrist和Pischke的書《幾乎無害計量經濟學》涵蓋了這一點,並與主題進行了非常詳細和清晰的說明。因此,讓我們將電視發送到發展中國家。顯然,兩者都是類似於GDP的內生因素。-鯊魚襲擊和冰淇淋銷售的數量。也許兩者都是溫度的內生因素?
我也想講一個關於瘋子和蜘蛛的可怕笑話。一個瘋子帶著一隻手掌上的蜘蛛在庇護所的走廊裡徘徊。他看了醫生,說:“看醫生,我可以和蜘蛛說話。看著這個。”“蜘蛛,向左走!”蜘蛛適當地向左移動。他繼續說,““蜘蛛,向右走。”醫生回答:“有趣的是,也許我們應該在下一個小組會議上談論這個。”瘋子反駁說,“那不是醫生。注意這一點。”他一個接一個地拉開蜘蛛的每條腿,然後大喊:“蜘蛛,向左走!腿會聾。”
我所教過的最好的冰淇淋是溺水的數量,冰淇淋的銷量可能高度相關,但這並不意味著一種會導致另一種。在夏季,天氣好的時候,冰淇淋的溺水和銷售明顯增加。第三變量又稱為好天氣導致它們。
“海盜會導致全球變暖”的概括:選擇隨時間(單調)增加或減少的任意兩個量,您應該會發現一些相關性。
我與學生一起在“代數一”課程中教授相關性與因果關係。我們研究了許多可能的例子。我發現2013年2月數學老師的文章《捆綁嬰兒和危險的冰淇淋:相關難題》非常有用。我喜歡談論“潛伏變量”的想法。這部動畫片還是一個可愛的對話開始者:
我們在動畫片中確定自變量和因變量,並討論這是否是因果關係的一個例子,如果不是,為什麼不。
您可以在 Google Correlate上花費幾分鐘,並提出各種虛假的相關性。
標準引文指出西德的新生嬰兒數量與鸛繁殖對之間的相關性是 性教育的新參數,自然332,495(4月7日, 1988); doi:10.1038 / 332495a0
我(很久以前)讀到一個有趣的例子,關於出生率(或生育率,如果您願意的話,則是生育率)下降的情況,特別是在美國,從1960年代初開始,因為核武器試驗是完全沒有的。創歷史新高(1961年,有史以來最大的核彈在蘇聯進行了試驗)。直到20世紀末,大多數國家終於停止這樣做為止,費率一直在劃定界限。
我現在找不到結合這些數字的參考文獻,但是Wikipedia上的文章中有關於的數字。
當然,從出生初期就“巧合”避孕藥的引入和合法化來看出生率的相關性可能更有意義。 1960年代。 (首先僅在某些州,然後是所有州,僅針對已婚婦女,然後是某些州,針對未婚女子,然後是全面州),但是即使那樣,也只能是原因之一;平等,經濟變化和其他因素的許多其他方面也起著重要作用。
關聯本身不能從不 b>建立因果關係。 戴維·休ume(David Hume)(1771-1776)相當有效地指出,我們不能僅憑經驗手段就無法獲得一定的因果關係知識。康德試圖解決這個問題,康德的維基百科頁面似乎很好地總結了這一點:
康德認為自己在經驗主義者和理性主義者之間做出了妥協。經驗主義者認為,知識是通過經驗本身獲得的,但理性主義者則認為,這種知識容易受到笛卡爾主義的質疑,而理性本身就為我們提供了知識。康德認為,使用理性而不將其運用到經驗中只會導致幻覺,而經驗將是純粹主觀的,而不會首先被純粹地歸入純粹的理性。知道因果關係只是通過觀察相關性而存在,但是康德建議我們也許可以利用我們的理由來區分確實暗示因果關係的相關性與不存在因果關係的相關性。只要康德只是根據合理性而不是某些知識來寫作,我認為休would不會不同意。簡而言之,相關性提供了暗示因果關係的間接證據,但是證據在很大程度上取決於所涉及的特定情況,我們永遠不能絕對確定。預測干預效果的能力是獲得信心的一種方法(我們無法證明任何事情,但是我們可以通過觀察證據來證明這一點,因此我們至少嘗試過捏造因果關係的理論)。擁有一個簡單的模型可以解釋為什麼我們應該觀察到相關性,同時還可以解釋其他形式的證據,這是我們按照康德的建議運用推理的另一種方式。
告誡者:我完全有可能誤解了這種哲學,但是仍然存在這樣一種情況,即關聯永遠無法提供因果聯繫的證據。
當$ x_t $時; $ y_t $是固定的時間序列,因此$ y_t $和$ x_ {t-1} $之間的相關性意味著$ x_ {t-1} $對$ y_t $的因果關係。由於某些原因,這裡未提及。
斯洛文尼亞鄉村男性的精子數量與熊的數量(也在斯洛文尼亞)呈負相關。有些人覺得這很令人擔憂。我將嘗試並進行研究。
我最近去過一次會議,一位發言者提供了一個非常有趣的示例(儘管重點是要說明其他事情):
美國人和英國人很多脂肪食物。在美國和英國,心血管疾病的發病率很高。
法國人吃很多脂肪食物,但心血管疾病的發病率較低。
美國人和英國人喝很多酒。在美國和英國,心血管疾病的發病率很高。
意大利人喝大量的酒精,但又有較低的心血管疾病發生率。 / p>
結論?隨便吃點東西。如果您會說英語,則心髒病發作的機率更高!
這顯示了很多與因果關係均不相關的關聯-或您是否知道因果關係是什麼蒸汽,熱蒸氣和熱物體與美國小姐年齡與謀殺案的相關性
??
我使用的另一個相關示例是,在美國,吃有機食品的人數大量增加,而在美國被診斷出患有自閉症的兒童人數卻有所增加。網上有一個模仿圖- >
教授“關聯並不意味著因果關係”並不能真正幫助任何人,因為歸根結底,所有演繹論點都部分基於關聯。的東西。
目標應該是建設性的:始終考慮可能產生相同數據的初始假設的替代方案。
發射更多的消防車,造成的損失更大。
我認為,更好的範式可能是因果關係,它要求與可信的,最好是經過驗證的機制相關聯。我認為在這種情況下應盡量少用“隱含”一詞,因為它有多種含義,包括建議。
鸛的例子在Box的第一版(1978年)的第8頁上,Hunter & Hunter的書名為“ Statistics for Experimenters ...”(Wiley)。我不知道它是否在第二版中。他們將城市標識為奧爾登堡,時間段為1930-1936。
他們引用了 Ornithologische Monatsberichte , 44 ,第2號,Jahrgang(1936年),柏林和 48 ,第1號。 Jahrgang,1940年,柏林,以及 Statistiches Jahrbuch Deutscher Gemeinden ,27-33,1932-1938年,耶拿古斯塔夫·費舍爾。
這是一個完美的選擇。不幸的是,它可以用作很好的教學點,因為《華盛頓郵報》的工作人員和疾病控制與預防中心都沒有顯示出任何暗示,認為該文章應該是《洋蔥》中的諷刺作品。