我知道相關性並不意味著因果關係,但是不存在相關性就意味著沒有因果關係嗎?
我知道相關性並不意味著因果關係,但是不存在相關性就意味著沒有因果關係嗎?
沒有相關性是否意味著沒有因果關係?
否。任何受控制的系統都是一個反例。
沒有因果關係的控制顯然是不可能的,但是成功的控制意味著-大致而言-一定數量保持恆定,這意味著它不會與任何事物相關,包括
因此,在這種情況下,從缺乏相關性中排除無因果關係將是一個錯誤。
這是一個一些典型例子/ a>。
不。主要是因為通過 correlation 表示線性相關。兩個變量可以非線性相關,並且可能沒有線性相關。構造這樣的示例很容易,但是我將為您提供一個更接近於您(更窄)問題的示例。
讓我們看一下隨機變量$ x $和非隨機函數$ f(x)= x ^ 2 $,我們用它創建一個隨機變量$ y = f(x)$。後者顯然是由前一個變量引起的,而不僅僅是相關的。讓我們繪製一個散點圖:
很好,清除非線性相關圖片,但在這種情況下,它也是直接因果關係。但是,線性相關係數不顯著,即儘管存在明顯的非線性相關甚至因果關係,但沒有線性相關:
>> x = randn(100,1) ; >> y = x。^ 2; >> scatter(x,y)>> [rho,pval] = corr(x,y)rho = 0.0140pval = 0.8904
對於任何對稱分佈,例如統一的$ U [-1,1] $,我們都會得到相同的結果。
否。特別是,隨機變量可以是相關的,但不相關。
這裡是一個例子。假設我有一台機器,它接受一個輸入$ x∈[-1,1] $並產生一個隨機數$ Y $,它以相等的概率等於$ x $或$ -x $。顯然$ x $會導致$ Y $。現在,讓$ X $是均勻分佈在$ [-1,1] $上的隨機變量,然後選擇$ x = X $的$ Y $,得出$(X,Y)$的聯合分佈。$ X $和$ Y $是從屬的,因為
$$ P(X <-\ tfrac {1} {2})P(| Y | < \ tfrac {1} {2})=\ tfrac {1} {4} \ cdot \ tfrac {1} {2} = \ tfrac {1} {8}≠0 = P(X <-\ tfrac {1} {2},\; | Y | <\ tfrac {1} {2})。$$
但是,$ X $和$ Y $的相關性為0,因為
$$ \ operatorname {Corr}(X,Y)= \ frac {\ operatorname {Cov}(X,Y)} {σ_Xσ_Y} = \ frac {E [XY]-E [X] E [Y]} {σ_Xσ_Y} = \ frac {0-0\ cdot0} {σ_Xσ_Y} = 0。$$
也許從計算角度來看會有所幫助。
舉一個具體的例子,舉一個偽隨機數生成器。
您設置的種子和種子之間是否存在因果關係生成器的$ k ^ \ text {th} $輸出?
是否存在可測量的相關性?
對該問題的更好回答是,關聯是一種統計,數學和/或物理關係,而因果關係是一種形而上的關係。如果沒有(大)假設集將形而上學與物理學聯繫起來,就無法從邏輯(從不相關)到因果關係。 (一個例子是,兩個人可能同意成為“一個理性的觀察者”在很大程度上是武斷的,可能是模棱兩可的)。如果A付給B錢去做C從而導致D,那麼D的原因是什麼?根本沒有合理的理由選擇C或B或A(或A的任何前兆事件)。控制理論涉及系統處於受控狀態的系統。在控制下獲得因變量的一種方法是減少該變量對自變量對統計噪聲的(受控)變化的可能範圍的響應。例如,我們知道氣壓與健康相關(只需嘗試吸真空),但是如果我們將氣壓控制在1 +/- 0.001 atm,那麼任何氣壓變化都會影響健康嗎?
是,與之前的答復相反。我將把這個問題視為非技術性的問題,尤其是“相關性”的定義。也許我使用的範圍太廣了,但是請參閱第二點。我希望在這裡討論其他答案將被認為是適當的,因為它們闡明了問題的不同部分。我正在利用Pearl的因果關係方法,尤其是在我與Kevin Korb的一些論文中對它的看法。伍德沃德可能擁有最清晰的非技術性資料。
@conjugateprior說“任何受控系統都是反例”。是的,更強有力的說法是,在您的實驗中觀察到的不相關性不表示因果關係。我將假設這個問題更為籠統。當然,一個實驗可能無法控制掩蓋原因,或者無法適當控制常見效果,並且隱藏了相關性。但是,如果$ x $導致$ y $,則會有一個 可以揭示這種關係的受控實驗。幾乎所有因果關係的定義或解釋都將其視為產生差異的差異。因此,沒有因果關係(沒有某種關聯)。如果在因果貝葉斯網絡中存在直接鏈接$ x \ rightarrow y $,這並不意味著$ x $總是與$ y $有所不同,而只是有 some 個實驗可以解決所有問題
@aksakal有一個很好的例子說明了為什麼 linear 因果關係不夠充分。 y>同意,但我想廣泛而又非技術性。如果$ y = x ^ 2 $,告訴客戶$ y $與$ x $不相關是不完整的。因此,我將廣泛地使用相關性來表示$ x $的差異與$ y $的差異可靠相關。您可以根據需要選擇非線性或非參數。閾值效果很好($ x $與$ y $有所不同,但僅在有限範圍內,或僅通過大於或小於特定值(如數字電路中的電壓)來實現。
@Kodiologist創建了一個示例,其中$ y = \ mathrm {Unif}({x,-x})$,因此$ | y | = | x | $,但沒有線性相關。但是顯然存在可發現的關係,因此在廣義上是相關的。
@Szabolcs使用隨機數生成器來顯示構造為看起來不相關的輸出流。像$ \ pi $的數字一樣,流似乎是隨機的,但是確定性的。我同意,如果僅提供數據,您不太可能找到這種關係,但是它就在那裡。
@Li Zhi指出,從邏輯上講,您不能從關聯變為因果關係。是的,沒有原因,沒有原因。但是問題開始於因果關係:這是否意味著關聯?在氣壓示例中,我們具有閾值效應。在一定範圍內,氣壓與健康無關。確實對健康沒有因果關係。但是它確實有一定範圍。這樣就足夠了。但最好注意範圍,其中存在和不存在影響。如果$ A \ rightarrow B \ rightarrow C \ rightarrow D $,則整個鏈上都存在相關性,因為存在因果關係。反復觀察(或實驗)可以發現$ A $不會直接 引起$ D $,但是存在相關性是因為存在因果關係。
我不知道@ user2088176的想法,但是我認為如果我們很籠統地回答這個問題,那麼答案是肯定的。至少我認為這是因果發現文獻和因果關係的干預論者所要求的答案。原因是差異,差異。在某些實驗中,這種差異將顯示為持久關聯。