題:
沒有相關性意味著沒有因果關係嗎?
user2088176
2016-07-03 19:54:04 UTC
view on stackexchange narkive permalink

我知道相關性並不意味著因果關係,但是不存在相關性就意味著沒有因果關係嗎?

引用安德魯·蓋爾曼(Andrew Gelman)的話,“關聯甚至不暗示關聯。”
否。A可能是B的原因,但僅對其產生非線性影響。
“相關性與因果關係相關。(不是很大。)”
@Djohnson和Adrian。再次,尋找逆。就像在科學中一樣,您永遠無法證明理論正確,只有它是錯誤的。
請查看[本頁](http://stats.stackexchange.com/q/26300/28500)中的反義詞。如果因果關係並不意味著相關,那麼沒有關聯就並不意味著沒有因果關係。
有趣的問題,也很好的答案! 我只想補充一點,對於因果關係,沒有關聯有時比因果關係更強。 例如,如果吸煙和癌症不相關,那麼可能存在一些未知因素(如果吸煙者作為一個整體,更頻繁地進行其他一些事情可以*降低*癌症的風險),從而彌補吸煙與癌症之間的因果關係。但這是不可能的,因為這些因果關係必須完美地歸零,否則仍然存在一定的相關性(正或負)。
@DJohnson就像...零感。
@zenadix告訴Gelman ...當你在這裡的時候,看看Anscombe的四重奏
@EdM: *如果因果關係並不意味著相關,那麼沒有關聯就並不意味著沒有因果關係。*但這並不相關。OP接受關聯不暗示因果關係的假設。您寫的評論好像是OP接受了因果關係並不暗示相關的假設。
@BenCrowell我鏈接到一個頁面,該頁面表明因果關係並不意味著關聯,沒有假設OP否則接受了這一事實。一旦事實被記錄下來,那麼本頁上的問題也必須得到回答。
儘管這是一個很好的開始,可以標記出相關並不表示因果關係,然後再討論細節,但我一直在想為什麼要選擇相關性?我將其歸結為共鳴,這對老師(對我而言)也很有吸引力,即學生可以通過努力記住一個口號並將其用於思考中。但事實是,統計數字中並沒有太多的因果關係。否則,該警告通常出現在相關章節或相關演講中,但它無處不在。
在哲學上,關聯並不意味著因果關係的觀點是有爭議的。
我認為卡爾·皮爾森(Karl Pearson)在《科學語法》中的話(用他不會使用的話)是,不暗示因果關係是一個特徵,而不是一個錯誤:它只是在沒有隱含假設或形而上學的情況下量化正在發生的事情。大多數當代作家似乎已從該位置旋轉了180度。
@NickCox在您的挑釁性評論(“統計數據中沒有太多暗示因果關係”)之後,您是否已經詳細闡述並發表了這種想法?有興趣閱讀更全面的討論。
@DJohnson感謝您的關注,但是我不會忘記在任何地方都說更多。我很難想像我可以在該領域的智慧之珠上有所進步。大約42年前,Richard Lewontin撰寫了一篇有關方差分析和原因分析的具有鮮明特色的文章,我想這值得回訪。
六 答案:
conjugateprior
2016-07-03 21:37:32 UTC
view on stackexchange narkive permalink

沒有相關性是否意味著沒有因果關係?

否。任何受控制的系統都是一個反例。

沒有因果關係的控制顯然是不可能的,但是成功的控制意味著-大致而言-一定數量保持恆定,這意味著它不會與任何事物相關,包括

因此,在這種情況下,從缺乏相關性中排除無因果關係將是一個錯誤。

這是一個一些典型例子/ a>。

一種直觀的思考方式
+1,有趣。但是,這似乎暗示著在沒有任何類型的關聯的情況下可能存在因果關係。那不是真的如果某個事件引起另一事件,則將存在“某種”相關,您提到的_constant_將採用非線性相關的形式
+1 * Bra * vo!當我在側欄中看到問題標題時,我全是“這需要從系統角度回答。”你釘了
如果從沒有相關性的情況下消除了因果關係,那麼剩下的功能是否會成為標記“因果關係”的候選對象?
不確定我是否了解@ttnphns's問題,但我認為答案是:如果您扣緊制動線(或鬆開油門踏板),那麼山丘確實將開始顯示出它們對汽車速度的因果影響。
Aksakal
2016-07-03 20:27:12 UTC
view on stackexchange narkive permalink

不。主要是因為通過 correlation 表示線性相關。兩個變量可以非線性相關,並且可能沒有線性相關。構造這樣的示例很容易,但是我將為您提供一個更接近於您(更窄)問題的示例。

讓我們看一下隨機變量$ x $和非隨機函數$ f(x)= x ^ 2 $,我們用它創建一個隨機變量$ y = f(x)$。後者顯然是由前一個變量引起的,而不僅僅是相關的。讓我們繪製一個散點圖:

enter image description here

很好,清除非線性相關圖片,但在這種情況下,它也是直接因果關係。但是,線性相關係數不顯著,即儘管存在明顯的非線性相關甚至因果關係,但沒有線性相關:

  >> x = randn(100,1) ; >> y = x。^ 2; >> scatter(x,y)>> [rho,pval] = corr(x,y)rho = 0.0140pval = 0.8904  

對於任何對稱分佈,例如統一的$ U [-1,1] $,我們都會得到相同的結果。

不重要並不意味著無效假設的真實性。在您的示例中,重要的是總體相關係數為0。
為什麼您認為OP表示線性相關?
@immibis,,因為因果關係必須導致某種非線性相關。
為什麼相關性為零?協方差是$ E [X ^ 3]-E [X ^ 2] E [X] $,通常對於隨機變量$ X $,然後是$ E [X ^ 3] \ neq E [X ^ 2] E[X] $ ..雖然適用於$ X $標準正常
-1
@Aksakal,您能否回答[我的問題](https://stats.stackexchange.com/questions/459639/is-there-any-problem-if-i-want-to-correlate-acceleration-with-calorie-不論?我大約14小時前問過這個問題。但是,仍然沒有收到答案。
Kodiologist
2016-07-03 20:13:35 UTC
view on stackexchange narkive permalink

。特別是,隨機變量可以是相關的,但不相關。

這裡是一個例子。假設我有一台機器,它接受一個輸入$ x∈[-1,1] $並產生一個隨機數$ Y $,它以相等的概率等於$ x $或$ -x $。顯然$ x $會導致$ Y $。現在,讓$ X $是均勻分佈在$ [-1,1] $上的隨機變量,然後選擇$ x = X $的$ Y $,得出$(X,Y)$的聯合分佈。$ X $和$ Y $是從屬的,因為

$$ P(X <-\ tfrac {1} {2})P(| Y | < \ tfrac {1} {2})=\ tfrac {1} {4} \ cdot \ tfrac {1} {2} = \ tfrac {1} {8}≠0 = P(X <-\ tfrac {1} {2},\; | Y | <\ tfrac {1} {2})。$$

但是,$ X $和$ Y $的相關性為0,因為

$$ \ operatorname {Corr}(X,Y)= \ frac {\ operatorname {Cov}(X,Y)} {σ_Xσ_Y} = \ frac {E [XY]-E [X] E [Y]} {σ_Xσ_Y} = \ frac {0-0\ cdot0} {σ_Xσ_Y} = 0。$$

實際上,我認為這是一個不好的例子。X不會導致Y。模型PresenceOfX缺少二進制變量是相關性為1的實際原因。您證明的實際上是X的值不會影響Y。
對於您如何感覺到$ x $的選擇不會導致$ Y $的問題,我確實感到茫然。也許您應該指定“原因”的含義。
@user2088176這是一個快速證明,選擇$ x $會導致$ Y $。讓我們使用因果關係的反事實模型,其中$ x $是指向$ Y $的一組可能分佈的索引。如果$ x = \ frac {1} {2} $,則$ Y $是等價的$ \ frac {1} {2} $或$-\ frac {1} {2} $。如果$ x = \ frac {3} {4} $,則$ Y $是等價的$ \ frac {3} {4} $或$-\ frac {3} {4} $。由於以$ x $的值區分的反事實意味著$ Y $的分佈不同,因此$ x $的選擇會導致$ Y $。
實際上,您再次證明X並非原因。X的絕對值是引起混淆的變量。
如果將$ x $限制為$ [0,1] $,則此示例可能會更簡單(並且仍然有效)。
簡單和標準的示例呢:$ X \ sim \ mathcal N(0,1)$和$ X ^ 2 $。它們是不相關的,但是分佈$ \ chi ^ 2(1)$的$ X ^ 2 $完全取決於$ X $。
Szabolcs
2016-07-04 16:19:15 UTC
view on stackexchange narkive permalink

也許從計算角度來看會有所幫助。

舉一個具體的例子,舉一個偽隨機數生成器。

您設置的種子和種子之間是否存在因果關係生成器的$ k ^ \ text {th} $輸出?

是否存在可測量的相關性?

Li Zhi
2016-07-03 23:04:22 UTC
view on stackexchange narkive permalink

對該問題的更好回答是,關聯是一種統計,數學和/或物理關係,而因果關係是一種形而上的關係。如果沒有(大)假設集將形而上學與物理學聯繫起來,就無法從邏輯(從不相關)到因果關係。 (一個例子是,兩個人可能同意成為“一個理性的觀察者”在很大程度上是武斷的,可能是模棱兩可的)。如果A付給B錢去做C從而導致D,那麼D的原因是什麼?根本沒有合理的理由選擇C或B或A(或A的任何前兆事件)。控制理論涉及系統處於受控狀態的系統。在控制下獲得因變量的一種方法是減少該變量對自變量對統計噪聲的(受控)變化的可能範圍的響應。例如,我們知道氣壓與健康相關(只需嘗試吸真空),但是如果我們將氣壓控制在1 +/- 0.001 atm,那麼任何氣壓變化都會影響健康嗎?

您所追求的區分是“在樣本中觀察到的”(相關性)與依存關係的依賴性,無論該樣本是否在樣本中被觀察到(物理性)。在這種解釋中,形而上學沒有任何作用(儘管有些是基於物理假設)。彈簧是否達到彈性極限。或在一個更普通的示例中:方糖可溶-一個明顯的因果概念,大致意味著,如果您將其滴入茶中,它將溶解。但是,這種因果性質完全是由於其*物理*結構。即使我們從沒想過要溶解任何方糖,方糖也是可溶的。
當然,您是對的,如果沒有因果關係的假設,就不會從中得出因果關係的結論。但是,實際上並沒有非常形而上學的東西!
在因果關係的反事實理論上(例如Pearl或Woodward)的設計恰恰是為了理解“如果A付出B去做C導致D,D是什麼原因?選擇C或B或A根本沒有合理的理由”。這些理論擱淺的唯一過時的觀念和無益的觀念是,我們總能對存在某種原因的想法保持理智。當然沒有。
ctwardy
2016-07-06 17:42:00 UTC
view on stackexchange narkive permalink

,與之前的答復相反。我將把這個問題視為非技術性的問題,尤其是“相關性”的定義。也許我使用的範圍太廣了,但是請參閱第二點。我希望在這裡討論其他答案將被認為是適當的,因為它們闡明了問題的不同部分。我正在利用Pearl的因果關係方法,尤其是在我與Kevin Korb的一些論文中對它的看法。伍德沃德可能擁有最清晰的非技術性資料。

  • @conjugateprior說“任何受控系統都是反例”。是的,更強有力的說法是,在您的實驗中觀察到的不相關性不表示因果關係。我將假設這個問題更為籠統。當然,一個實驗可能無法控制掩蓋原因,或者無法適當控制常見效果,並且隱藏了相關性。但是,如果$ x $導致$ y $,則會有一個 可以揭示這種關係的受控實驗。幾乎所有因果關係的定義或解釋都將其視為產生差異的差異。因此,沒有因果關係(沒有某種關聯)。如果在因果貝葉斯網絡中存在直接鏈接$ x \ rightarrow y $,這並不意味著$ x $總是與$ y $有所不同,而只是有 some 個實驗可以解決所有問題

  • @aksakal有一個很好的例子說明了為什麼 linear 因果關係不夠充分。 y>同意,但我想廣泛而又非技術性。如果$ y = x ^ 2 $,告訴客戶$ y $與$ x $不相關是不完整的。因此,我將廣泛地使用相關性來表示$ x $的差異與$ y $的差異可靠相關。您可以根據需要選擇非線性或非參數。閾值效果很好($ x $與$ y $有所不同,但僅在有限範圍內,或僅通過大於或小於特定值(如數字電路中的電壓)來實現。

  • @Kodiologist創建了一個示例,其中$ y = \ mathrm {Unif}({x,-x})$,因此$ | y | = | x | $,但沒有線性相關。但是顯然存在可發現的關係,因此在廣義上是相關的。

  • @Szabolcs使用隨機數生成器來顯示構造為看起來不相關的輸出流。像$ \ pi $的數字一樣,流似乎是隨機的,但是確定性的。我同意,如果僅提供數據,您不太可能找到這種關係,但是它就在那裡。

  • @Li Zhi指出,從邏輯上講,您不能從關聯變為因果關係。是的,沒有原因,沒有原因。但是問題開始於因果關係:這是否意味著關聯?在氣壓示例中,我們具有閾值效應。在一定範圍內,氣壓與健康無關。確實對健康沒有因果關係。但是它確實有一定範圍。這樣就足夠了。但最好注意範圍,其中存在和不存在影響。如果$ A \ rightarrow B \ rightarrow C \ rightarrow D $,則整個鏈上都存在相關性,因為存在因果關係。反復觀察(或實驗)可以發現$ A $不會直接 引起$ D $,但是存在相關性是因為存在因果關係。

我不知道@ user2088176的想法,但是我認為如果我們很籠統地回答這個問題,那麼答案是肯定的。至少我認為這是因果發現文獻和因果關係的干預論者所要求的答案。原因是差異,差異。在某些實驗中,這種差異將顯示為持久關聯。

我希望像您一樣從更簡單的角度和非技術的角度來解決這個問題。“原因”是什麼意思?據推測,這涉及到某些事物的變化,從而導致其他事物的變化。沒有某種相關性,我就無法理解因果關係。
@Behacad我認為對比是某種相關性(您可以觀察到的事情)和某種相關性(可能永遠不會觸發)之間的對比。有未觸發的依賴性,但沒有未觀察到的相關性。這就是因果關係對其定義具有反事實元素的原因,而相關性則沒有。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...