題:
如果A和B與C相關,為什麼A和B不一定相關?
Sympa
2010-12-26 01:24:46 UTC
view on stackexchange narkive permalink

我憑經驗知道情況就是如此。我剛剛開發了遇到這個難題的模型。我也懷疑這不一定是是/否答案。我的意思是,如果A和B都與C相關,那麼這可能對A和B之間的相關性有一些暗示。但是,這種暗示可能很弱。這可能只是一個指示方向,僅此而已。

這是我的意思。。。假設A和B與C的相關性均為0.5。鑑於此,A和B之間的相關性很可能為1.0。我認為也可能是0.5甚至更低。但是,我認為這不太可能是負面的。你同意嗎?

此外,如果您正在考慮使用標準的Pearson相關係數或Spearman(秩)相關係數,是否有暗示?我最近的經驗觀察與Spearman相關係數有關。

例如,取$ A = X $,$ B = Y $和$ C = X + Y $。我們可以使$ X $和$ Y $獨立,但是$ A $和$ B $都與$ C $相關(肯定是Pearson)。
謝謝,這實際上是一個很好的評論。簡短,但它抓住了其原因的本質。
八 答案:
Basil
2010-12-28 08:45:46 UTC
view on stackexchange narkive permalink

我現在正在進行年度釣魚之旅。我每天釣魚的時間與我釣到的魚的數量之間存在相關性。我使用的誘餌的大小與釣到的魚的數量之間也存在相關性。誘餌的大小與一天中的時間沒有關聯。

羅勒,我喜歡它! +1為簡單的英語說明。
最好。回答。在stats.stackexchange上。曾經
這描述了相關性較低的情況,但是沒有說明相關性較高的情況。如果與一天中的時間有80%的相關性,並且與誘餌的大小有80%的相關性,我可以保證您白天使用的誘餌更大!
@user35581不,您不能-您遺漏了所有要點。 每小時他可以用小誘餌釣魚一次,而用大誘餌釣魚一次。他仍然可以在一天中的某些時段捕獲更多的魚(相關性為80%),並且在誘餌較大的情況下可以捕獲更多的魚(相關性為80%),並且他使用的誘餌大小與一天中的時間之間的相關性為0。如果他在一天的非高峰時間更頻繁地使用較大的誘餌來彌補一天中的糟糕時間,甚至可能是負相關。因此,您實際上對一天中的時間與誘餌大小之間的相關性一無所知。
@rysqui抱歉,我的評論措辭不佳,但是我要說明的是:當要素和目標之間的相關性很高時,那麼您的要素也必須具有相關性。因此,如果您在一天中的時間和捕撈量之間具有完美的關聯,並且在誘餌的大小和捕撈量之間具有完美的相關性,那麼您還必須在誘餌的大小與一天中的時間之間具有完美的相關性,因此,“您白天使用更大的誘餌”。請記住,這是一個極端的情況!
@rysqui正在腳:如果$ A $和$ C $具有$ \ rho = 0.8 $的相關性,並且$ B $和$ C $具有$ \ rho = 0.8 $的相關性,則$ A $和$ B $具有至少$ 2 \ rho ^ 2-1 = 0.28 $的相關性。您的示例可以與$ \ rho \ le \ frac1 {\ sqrt2} $一起使用,因此可能類似於$ 70 \%,70 \%,0.0 \%$
whuber
2010-12-26 05:54:38 UTC
view on stackexchange narkive permalink

由於相關性是多元分佈的數學性質,因此無論這些分佈的統計來源如何,都可以通過計算純粹地獲得一些見識。

對於 Pearson相關性,請考慮多元變量:$ X $,$ Y $,$ Z $。這些方法很有用,因為任何非負定矩陣實際上都是某些多正態分佈的協方差矩陣,從而解決了存在性問題。如果我們堅持在對角線上有$ 1 $的矩陣,則協方差矩陣的非對角線條目將是它們的相關性。將$ X $和$ Y $的相關性寫為$ \ rho $,將$ Y $和$ Z $的相關性寫為$ \ tau $,將$ X $和$ Z $的相關性寫為$ \ sigma $,我們計算出

  • $ 1 + 2 \ rho \ sigma \ tau-\ left(\ rho ^ 2 + \ sigma ^ 2 + \ tau ^ 2 \ right)\ ge 0 $ (因為這是相關矩陣的行列式,並且不能為負)。

  • 當$ \ sigma = 0 $時,這意味著$ \ rho ^ 2 + \ tau ^ 2 \ le 1 $。換句話說,當$ \ rho $和$ \ tau $的幅度都很大時,$ X $和$ Z $ 必須具有非零相關性。

  • 如果$ \ rho ^ 2 = \ tau ^ 2 = 1/2 $,則$ \ sigma $的任何非負值(當然在$ 0 $和$ 1 $之間)都是可能的。

  • 當$ \ rho ^ 2 + \ tau ^ 2 \ lt 1 $時,$ \ sigma $的負值是允許的。例如,當$ \ rho = \ tau = 1/2 $時,$ \ sigma $可以在$ -1 / 2 $到$ 1 $之間。

這些考慮暗示著在相互關係上確實存在一些約束。約束條件(僅取決於相關矩陣的非負定性,而不取決於變量的實際分佈)可以根據關於單變量分佈的假設來加強。例如,很容易看到(並證明)當$ X $和$ Y $的分佈不在同一位置範圍的族中時,它們的相關性必須嚴格地 小於$ 1 $在尺寸方面。 (證明:$ \ pm 1 $的相關性意味著$ X $和$ Y $是線性相關的)

Spearman等級相關性而言,考慮三個三變量觀測值$(X,Y,Z)$中的$(1,1,2)$,$(2,3,1)$和$(3,2,3)$。他們的相互排名相關性是$ 1/2 $,$ 1/2 $和$ -1 / 2 $。因此,甚至$ Y $和$ Z $的秩相關的符號也可以與$ X $和$ Y $以及$ X $和$ Z $的相關符號相反。

ub,什麼是“多態變量”?
HTTP://恩.Wikipedia.org/wiki/multivariate_normal_distribution
與往常一樣,最徹底的解釋是應有的“最佳答案”複選標記。
@Gaetan Lion您非常友善。我很喜歡閱讀*全部*這個問題的答案(並把它們全部標記出來)。
David Epstein
2010-12-26 13:26:29 UTC
view on stackexchange narkive permalink

Correlation是兩個向量之間的角度的餘弦值。在描述的情況下,(A,B,C)是三倍的觀測值,進行了n次,每個觀測值都是實數。 A和B之間的相關性是在n維歐式空間中測得的$ V_A = A-E(A)$和$ V_B = B-E(B)$之間的角度的餘弦值。因此,我們的情況簡化為在n維空間中考慮3個向量$ V_A $,$ V_B $和$ V_C $。我們有3對向量,因此有3個角度。如果其中兩個角度較小(相關性較高),則第三個角度也將較小。但是說“相關”並不是一個很大的限制:它意味著角度在0到$ \ pi / 2 $之間。通常,這完全不限制第三角度。換句話說,從$ V_A $和$ V_B $之間的任何小於$ \ pi $的角度開始(除-1以外的任何相關性)。讓$ V_C $將$ V_A $和$ V_B $之間的角度二等分。然後C將與A和B相關。

就多維矢量之間的角度而言,+ 1相關性對我來說很直觀。
為將來的讀者參考,我在以下線程中對此幾何答案(帶圖片!)進行了擴展:http://www.talkstats.com/showthread.php/49357-geometric-argument-for-constraints-on-r_xz給定r_xy和r_yz
Felix S
2012-02-09 19:27:24 UTC
view on stackexchange narkive permalink

作為胡布爾的答案的補充:給出的公式

$ 1 + 2 \ rho \ sigma \ tau-\ left(\ rho ^ 2 + \ sigma ^ 2 + \ tau ^ 2 \右)\ ge 0 $。

可以轉化為以下不等式(Olkin,1981):

$ \ sigma \ tau-\ sqrt {(1- \ sigma ^ 2)(1- \ tau ^ 2 )} \ le \ rho \ le \ sigma \ tau + \ sqrt {(1- \ sigma ^ 2)(1- \ tau ^ 2)} $

圖形表示 $ \ rho $的上限和下限>>

enter image description here


Olkin,I.(1981)。乘積矩相關矩陣的範圍限制。心理療法,46,469-472。 doi:10.1007 / BF02293804

誰能告訴我這些例子中是否有些是具有特定邊際分佈的多元分佈,從而限制了組件之間可能的相關性範圍?這意味著相關性不能從-1到1的完整範圍。我記得Frechet是至少一個在1950年代發展了這一點的人。今天,當我搜索文獻時,我認為它們現在被稱為Frechet copulas。
nico
2010-12-26 01:30:53 UTC
view on stackexchange narkive permalink

我將把統計證明留給那些比我更合適的人……但是直覺上說事件A產生了一個過程X,該過程X有助於事件C的產生。然後,A與C相關聯(通過X )。另一方面,B會生成Y,Y也會使C成形。因此,A與C相關,B與C相關,但A和B不相關。

@Nice。我認為您的意思是在最後一句的最後一部分中“ A和** B **不相關”。
是的,Nico進行了suncoolsu校正……這是一個很好的解釋。您正在部分描述路徑分析。
是的,對不起,我把信件弄混了;)
Peter Flom
2010-12-26 04:17:12 UTC
view on stackexchange narkive permalink

我認為最好問一下“為什麼它們應該相互關聯?”或者,也許是“為什麼應該具有任何特定的相關性?”

以下R代碼顯示了x1和x2都與Y相關但彼此具有0相關性的情況

  x1 <- rnorm(100)x2 <- rnorm(100)y <- 3 * x1 + 2 * x2 + rnorm(100,0,.3)cor(x1,y)cor(x2,y)cor (x1,x2) 

可以通過將.3減少到.1或其他任何值來增強與Y的相關性

不幸的是,我不是R用戶。因此,以上代碼對我的意義比對您的意義小。
此代碼中的@Gaetan Lion:,$ x_1 $和$ x_2 $是獨立的根法線,並且$ y = 3x_1 + 2x_2 $加上標準差為0.3的正態噪聲項。顯然,$ y $與獨立的$ x_1 $和$ x_2 $正相關。
S. Piérard
2016-10-02 19:38:58 UTC
view on stackexchange narkive permalink

對於那些想要一些直覺的人來說,相關可以看作是某個角度的餘弦。因此,考慮3D中的三個向量,假設A,B和C,每個向量對應一個變量。問題是當已知A與B之間的角度以及B與C之間的角度時,確定A與C之間可能的角度範圍。為此,您無需安裝任何軟件即可使用在線工具。只需轉到 http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.php

頁面
Abhishek Anand
2017-04-04 23:11:46 UTC
view on stackexchange narkive permalink

讓我們舉一個例子:

  A = {x1,x2,x3,x4,x5,x6,x7,x8,x9}

B = {x1,x2,x3,0,0,0,0,0,0}

C = {0,0,0,x4,x5,x6,0,0,0}
 

對於某些x,A和B將具有顯著的相關性,類似地,A和C也將具有顯著的相關性,但B和C的相關性將不顯著。

因此,如果A和B相關,而A和C相關,那麼B和C也相關,就不一定是真的。

注意:為了深入理解,請考慮大數據的示例。

這些主張通常是不正確的。$ B $和$ C $可以*緊密關聯*,具體取決於$ x1 $到$ x6 $的值。$ A $是否與$ B $或$ C $相關,同樣取決於$ x1 $到$ x9 $的值。為了“深入理解”,請考慮進行計算!
我對Abhishek Anand的回答感到滿意,因為最終所有事物在某種程度上都與其他事物相關。而且,我喜歡他根據統計意義對它進行基準測試的方式。使用該框架後,很明顯,如果A和B與C在統計上顯著相關,則A或B不一定在統計上顯著相關(使用我原始問題的實際框架)。我認為排氣孔圖可以很好地從視覺上解釋該概念。
-1
很好-但是您似乎對這些向量之間的相關性有誤解。您對這些向量的相關係數所做的*陳述中*沒有*通常是正確的。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 2.0許可。
Loading...