題:
為什麼柯西分佈沒有平均值?
Flying pig
2012-09-10 20:28:40 UTC
view on stackexchange narkive permalink

根據分佈密度函數,我們可以確定柯西分佈的平均值(= 0),如下圖所示。但是為什麼我們說柯西分佈沒有平均值呢?

enter image description here

我推薦參考Cabeza G.,U. A ..(2013)。柯西分佈的均值。在有關柯西分佈均值的博客[數學支持](http://apoyoenmatematicas.blogspot.com/2012/12/4-la-media-de-la-distribucion-de-cauchy.html)中。
我在這裡的答案:http://stats.stackexchange.com/questions/94402/what-is-the-difference-between-finite-and-infinite-variance/100161#100161
十 答案:
Douglas Zare
2012-09-10 21:20:24 UTC
view on stackexchange narkive permalink

您可以機械地檢查不存在期望值,但這在物理上應該直觀,至少要接受惠更斯原理大數法則 。對於柯西分佈,大數定律的結論是失敗的,因此它沒有平均值。如果平均$ n $個獨立的柯西隨機變量,則結果不會收斂為$ 0 $,因為$ n \到\ infty $的概率為$ 1 $。它保持相同大小的柯西分佈。這在光學中很重要。

柯西分佈是來自點光源的線上的歸一化光強。惠更斯原理說,您可以通過假設光源和目標之間的任何線重新發射光來確定強度。因此,可以通過假設光線首先擊中距離$ 1 $米的線並以任何前向角度重新發射,來確定距離$ 2 $米的線的光強度。距離為$ n $米的直線上的光的強度可以表示為距離$ 1 $米的直線上光的分佈的$ n $倍卷積。也就是說,$ n $個獨立柯西分佈的總和是一個按比例縮放$ n $的柯西分佈。

如果柯西分佈具有均值,那麼根據大數定律,n美元折疊卷積除以n美元的第25美元百分位數必須收斂到0美元。相反,它保持不變。如果在$ 1 $米,$ 2 $米等的(透明)線上標記$ 25 $百分位數,則這些點將以$ 45 $度形成一條直線。它們不會向$ 0 $彎曲。

這特別告訴您有關柯西分佈的信息,但是您應該了解積分檢驗,因為還有其他分佈,這些均無平均值,並且沒有清晰的物理解釋。 。

+1現在*那裡*是一個有啟發性的答案:-)(對不起)。順便說一句,該原理是為克里斯蒂安·惠更斯而不是惠更斯命名的。惠更斯是第一個認識到Pascal在1650年代發表的概率論新進展的人(根據他與費馬特的來信):正是惠更斯對這些觀點的解釋(1657年),包括期望的觀點,最初是關於數學的概率論。為雅各布·伯努利(* Ars Conjectandi *,1713)開創性的(後遺)論文奠定基礎。
振幅是傳播的,而不是強度。
這是一個很好的答案,但我發現結尾令人困惑:“ ...在25度的直線上標記第25個百分位,直角為45度。它們不向0彎曲。”該語句本身是正確的(由於惠更斯-菲涅耳原理),但這在“除以$ n $”之前。當在2米處以2分,在3米處以3分,...時,透明線是垂直的(垂直於捕獲光的屏幕)。45度分位數線屬於Cauchy的總和,對論點(尚未)沒有幫助。
Dilip Sarwate
2012-09-10 21:24:44 UTC
view on stackexchange narkive permalink

響應@whuber對Michael Chernicks答案的評論而添加了答案(並完全重寫以消除whuber指出的錯誤。)

柯西期望值的積分值之所以說隨機變量是不確定的,是因為該值可以被“製造”為任何喜歡的東西。積分$$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$(以黎曼積分的意義解釋)為通常稱為不正確積分,其值必須計算為極限值:$$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx = \ lim_ {T_1 \ to- \ infty} \ lim_ {T_2 \ to + \ infty} \ int_ {T_1} ^ {T_2} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$ or $$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx = \ lim_ {T_2 \ to + \ infty} \ lim_ {T_1 \ to- \ infty} \ int_ {T_1} ^ {T_2} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$和或當然,兩個評估都應給出相同的有限值。如果不是,則說積分是不確定的。這立即表明了為什麼將柯西隨機變量的主題定義為未定義:內部極限的極限值發散。

柯西主值作為單個極限獲得:$$ \ lim_ {T \ to \ infty } \ int _ {-T} ^ {T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$,而不是上述雙限制。期望積分的主值很容易看出是$ 0 $,因為該限制對所有$ T $具有值$ 0 $。但這不能說Cauchyrandom變量的均值為$ 0 $。也就是說,將平均值定義為通常意義上的積分值,而不是主值意義上的積分。

對於$ \ alpha > 0 $,請考慮積分$$ \ begin {align} \ int _ {-T} ^ {\ alpha T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx& = \ int _ {-T} ^ {T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx + \ int_ {T} ^ {\ alpha T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx \\ & = 0 + \ left。\ frac {\ ln(1 + x ^ 2)} {2 \ pi} \ right | _T ^ {\ alpha T} \\ & = \ frac {1} {2 \ pi} \ ln \左(\ frac {1+ \ alpha ^ 2T ^ 2} {1 + T ^ 2} \ right)\\ & = \ frac {1} {2 \ pi} \ ln \ left(\ frac {\ alpha ^ 2 + T ^ {-2}} {1 + T ^ {-2}} \ right)\ end {align} $$接近$ \ displaystyle \ frac {\ ln(\ alpha)} {\ pi} $的極限值,作為$ T \ to \ infty $。當$ \ alpha = 1 $時,我們得到本金值$ 0 $以上討論。因此,我們不能為表達式
$$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$賦予明確的含義沒有說明如何處理兩個無窮大,而忽略這一點會導致各種複雜性和錯誤的結果,因為當主要價值的牛奶偽裝成價值的奶油時,事情並不總是看起來那樣。這就是為什麼Cauchyrandom變量的均值被稱為未定義,而不是整數的主值$ 0 $的原因。從Lebesgue積分的意義上定義了值積分,那麼問題就更簡單了。 $ \ int g $僅在$ \ int | g | $是有限的時才存在,因此對於Cauchy隨機變量$ X $來說$ E [X] $是未定義的,因為$ E [| X |] $不是有限的。

中間積分的評估是錯誤的:它是零,而不是對數。問題實際上在於評估無限積分中隱含的兩個極限。
@whuber感謝您指出錯誤。我已經完全重寫了我的答案,您的評論不再適用。
我不明白為什麼不存在該比率的期望。如果$ X $和$ Y $的正態分佈均值不為零,則$ Z = \ frac {X} {Y} $的均值由$ \ int \ int \ int \ frac {x} {y}給出p \ left(x,y \ right)dx dy $,我缺少什麼?
-1
我是說這也是兩個正態分佈R.V.因此,我可以理解非收斂積分的數學原理,但是卻不理解為什麼我的主張不成立。
@Drazick檢查您的積分是否存在。通常,如果$ X $的密度在$ 0 $附近是連續的,則E [X ^ {-1}] $不存在。
[用戶“ kjetil b halvorsen的回答”](https://stats.stackexchange.com/a/36142/131145)中陳述了不採用該原則值的充分理由,(許多)中未提及評論邁克爾·切爾尼克(Michael Chernick)的另一個答案。他的措辭令人困惑。
您的段落留給Cauchy一點空間,意味著不正確的積分
Xi'an
2012-10-22 00:45:30 UTC
view on stackexchange narkive permalink

雖然以上答案是對為什麼柯西分佈沒有期望的有效解釋,但我發現兩個獨立的正態$ \ mathcal {N}(0,1)$變量的比率$ X_1 / X_2 $是柯西的事實就像在照亮一樣:確實,我們有$$ \ mathbb {E} \ left [\ frac {| X_1 |} {| X_2 |} \ right] = \ mathbb {E} \ left [| X_1 | \ right] \ times \ mathbb {E} \ left [\ frac {1} {| X_2 |} \ right] $$,第二個期望是$ + \ infty $。

當我知道$ \ frac {X_1} {X_2} $是標準柯西時,$ \ left | \ frac {X_1} {X_2} \ right | $是“折疊的”柯西隨機變量嗎?如何找到$ \ left | \ frac {X_1} {X_2} \ right | $的分佈?
是的,這是柯西變量的絕對值,因此,其密度$ f(x)+ f(-x)$超過正實數。
如果折疊正態分佈,那麼$ \ mathbb {E} 1 / | X_2 | $不是無限嗎?
它是無限的。
Michael R. Chernick
2012-09-10 20:36:17 UTC
view on stackexchange narkive permalink

柯西(Cauchy)沒有平均值,因為您選擇的點(0)不是平均值。這是一個中位數和一個 mode 。絕對連續分佈的均值定義為$ \ int xf(x)dx $,其中$ f $是密度函數,積分取自$ f $的域(從$-\ infty $到$ \對於柯西(Cauchy),則為infty $。對於柯西密度,該積分根本不是有限的(從$-\ infty $到$ 0 $的一半是$-\ infty $,而從$ 0 $到$ \ infty $的一半是$ \ infty $)。

您能否解釋為什麼整數$ \ int _ {-\ infty} ^ {\ infty} x f(x)\,dx $像您所聲稱的那樣“簡單無限”?大多數人會說積分是_undefined_,因為它的形式為$ \ infty-\ infty $。
沒錯,@Dilip。而且,積分具有定義明確的[主值](http://en.wikipedia.org/wiki/Cauchy_principal_value):它等於零。 :-)
好吧,沒有定義是更好的術語。這兩個半部都是無限的,不能相加。
@whuber我很清楚積分有一個定義明確的主值(通常也稱為_Cauchy_主值),並且該主值等於零。我只希望邁克爾解釋為什麼他聲稱積分的價值為$ \ infty $(這也不是本金)。
@DilipSarwate您的觀點很好,我修改了答案。讓我們不要忘記OP對均值的定義有誤解的事實。關鍵是定義平均值的積分不會收斂到任何有限值,例如0。
我不是在批評您,@Dilip:我是在擴大您的觀察範圍。非常有趣的是,零主值的存在可能會誘使我們將柯西分佈的均值(或任何RV的均值)定義為積分的主值。這更深入地探討了這個問題的性質,通過聲明積分是無限的還是不確定的來掩蓋這個問題的性質:即,*為什麼主值不起作用*?為什麼用它作為平均值是不合法的?
@whuber同樣有趣的是,如果在-a和+ a處將a> 0的整數截斷,則得到0。因此,將極限作為對稱積分的∞給出0。問為什麼不是0的另一個原因均值。
是的,Michael完全正確:您實際上已經描述瞭如何獲得本金。
哦,我不確定我是在說同樣的話。感謝@whuber。
-1
那,@cardinal,是一個很好的答案!我不只是說說而已,因為問題本身就問“為什麼我們說Cauchy分佈毫無意義?”斷言期望是不確定的可能會滿足不確定性,但是可能存在積分的合理替代定義(並產生直觀上正確的答案!)的可能性會給人們帶來麻煩。您的答案接近我的想法,但仍不完整。我認為一個令人滿意的答案將確定重要的統計理論定理,當我們使用條件收斂積分進行工作時,這些定理將失敗。
@whuber:我很難將您提到的最後一點設置為600個字符! ;-)我本人首先遇到了這個Cauchy示例,當時該示例僅具有演算微積分的背景知識,我記得在相當長的一段時間內一直對此感到困惑。不幸的是,因為手頭上只有一個浮躁而又不令人滿意的解釋真是太令人惱火了,所以我可以同情OP。
-1
-1
@whuber也許包括統計數據太強了,但是在概率論中,(至少一種形式)大數定律表示,具有有限均值$ \ mu $的iid隨機變量的樣本均值收斂到概率為$ 1的i \ mu $ $。眾所周知,道格拉斯·扎爾(Douglas Zare)在接受的答案中指出,標準柯西樣本的樣本均值具有標準柯西分佈。因此,如果根據主體值將標準柯西隨機變量的均值定義為$ 0 $,則必須重寫SLLN。詹森的不平等還要求期望是有限的。
@whuber(續),但也許這些結果在統計實踐中並不重要。
當然,@Dilip Sarwate:在統計實踐中很重要!
-1
@whuber積分的主值確實以Feller的WLLN形式起作用:如果$ xP(| X |> x)\至0 $,則$ \ frac {S_n} nE(X; | X |
-1
@Kjetil謝謝。我懷疑您和我可能對統計模型的使用存在不同意見,但是儘管我不能不同意您的觀點:即在採用任何對行為敏感的模型時我們都必須謹慎那是不切實際的尾巴。順便說一句,我本來喜歡您的回答,並且已經對其進行了投票:-)。
David Epstein
2012-09-12 02:17:00 UTC
view on stackexchange narkive permalink

柯西分佈最好被認為是單位圓上的均勻分佈,因此如果取平均值是有意義的。假設$ f $是某種“平均函數”。也就是說,假設對於單位圓的每個有限子集$ X $,$ f(X)$是單位圓的一個點。顯然,$ f $必須是“非自然的”。更確切地說,$ f $不能相對於旋轉相等。要獲得更平常但不太顯眼的柯西分佈,請將單位圓從(0,1)投影到x軸上,然後使用此投影將圓上的均勻分佈轉移到x軸上。

要了解為什麼均值不存在,請將x視為單位圓上的一個函數。在單位圓上找到無數個不連續的弧是很容易的,這樣,如果其中一個弧的長度為d,則該弧上的x> 1 / 4d。因此,每個不相交的弧對平均值的貢獻都超過1/4,並且這些弧的總貢獻是無限的。我們可以再次執行相同的操作,但是x < -1 / 4d,總貢獻減去無窮大。這些間隔可以與圖表一起顯示,但是可以為交叉驗證製作圖表嗎?

歡迎來到@DavidEpstein網站。您可以使用首選軟件製作圖像,然後單擊答案字段上方的小圖片圖標(以啟動嚮導)將其上傳到答案中。但是不幸的是,您需要> = 10 rep來這樣做。我相信你會盡快做到的。在此期間,如果您可以將圖像發佈到Internet上的任何其他位置,並在答案中發布指向該圖像的鏈接,則更高代表的用戶可以獲取該圖像並將其發布。
我不知道柯西被解釋為一個圓圈上的製服,但是這確實是有道理的。拓撲參數表明,在具有平均函數性質的圓上沒有連續函數。
@DavidEpstein我也閱讀了[您在另一篇文章中的回答](https://stats.stackexchange.com/a/233950/131145)。立體投影真的很好。相比之下,您能否評論為什麼半圓同樣有效的徑向投影並不意味著均值定義明確?即,$ U \ sim \ mathrm {Unif} [0,1] $,然後$ X \ equiv \ tan \ left(\ pi(U-\ frac12)\ right)$是標準柯西。在幾何上,這是一個基本事實,即內切角始終是其相應中心角的一半。
實際上,就光源的物理模型而言,半圓形圖片更為合適,因為尚不清楚為什麼惠更斯原理會為您提供立體投影。
Tomas
2012-09-10 20:43:45 UTC
view on stackexchange narkive permalink

某個隨機變量$ X $的均值或期望值是在某些概率測度$ P $:$$ EX = \ int XdP $$

上定義的Lebesgue積分

均值的不存在Cauchy隨機變量僅表示Cauchy rv的積分不存在。這是因為Cauchy分佈的尾巴是重尾(與正態分佈的尾巴相比)。但是,不存在期望值並不禁止Cauchy隨機變量的其他函數存在。

尾部“重”是指尾部在兩個方向上的衰減都不夠快,無法使積分收斂。這個概念與正態分佈(或任何參考分佈)無關。
是的,感謝您的更正。我無意暗示粗尾與正態分佈之間有任何嚴格的聯繫。但是,我認為在視覺上比較正態分佈(帶有輕尾巴)和重尾分佈可以(並非總是)使“重”尾巴的概念更容易掌握。
Paul
2014-02-04 09:05:35 UTC
view on stackexchange narkive permalink

更多是視覺上的解釋。 (對於我們這些數學難題的人。)。使用柯西分佈式隨機數生成器,然後嘗試平均結果值。這是有關此功能的好頁面。 https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable您會發現隨機值的“尖刻性”使它得到隨身攜帶更大而不是更小。因此,它沒有任何意義。

kjetil b halvorsen
2012-09-12 03:35:13 UTC
view on stackexchange narkive permalink

除了增加出色的答案外,我將對為什麼積分的非收斂性與統計實踐相關的問題做出一些評論。正如其他人提到的那樣,如果我們允許主值是“均值”,則slln不再有效!除此之外,請考慮以下事實的含義:在實踐中,所有模型都是近似值。具體而言,柯西分佈是無界隨機變量的模型。實際上,隨機變量是有界的,但界線通常是模糊且不確定的。使用無邊界模型是緩解這種情況的一種方法,它可以避免將不確定的(通常是不自然的)邊界引入模型。但是,這樣做有意義,問題的重要方面不應該受到影響。這意味著,如果我們要引入界限,則不應以重要方式改變模型。但是,當積分不收斂時,就不會發生!在某種程度上,該模型是不穩定的,因為RV的期望將取決於很大程度上任意的界限。 (在應用程序中,不必使邊界對稱!)

因此,最好說積分是發散的,而不是說積分是“無窮大”,最後一個接近於當不存在時暗示一定的值! 此處

DE Harris
2012-09-12 02:20:43 UTC
view on stackexchange narkive permalink

我想有點挑剔。頂部的圖形錯誤。 x軸存在標準偏差,對於柯西分佈不存在。我很挑剔,因為我在工作中的每一天都使用柯西分佈。在實際情況下,混淆可能會導致經驗錯誤。具有1個自由度的學生t分佈是標準的柯西(Cauchy)。它通常會列出重要性所需的各種sigma。這些sigma不是標準偏差,它們可能是錯誤,並且mu是模式。相等大小的錯誤,那麼您將給它們相等的可能錯誤。一個可能的誤差是正態分佈上的.67標準尺寸偏差。在這兩種情況下,它都是半四分位間距。但是,我懷疑您是該主題的學生並且是新手,因此對於視覺上明顯的東西而言,違反直覺的數學解決方案可能並不正確。分佈,都具有相同的模式和相同的可能錯誤。一個平均值為1.27,一個平均值為1.33。平均值為1.27的標準偏差為400,平均值為1.33的標準偏差為5.15。兩者的可能誤差均為0.32,眾數均為1。這意味著對於對稱數據,均值不在中心50%內。對於任何檢驗,僅需一次額外觀察即可將均值和/或方差推至顯著性之外。原因是均值和方差不是參數,樣本均值和样本方差本身就是隨機數。

最簡單的答案是柯西分佈的參數不包含均值,因此均值無方差。

在您過去的教學法中,均值的重要性可能在於它通常是足夠的統計數據。在基於長期頻率的統計數據中,柯西分佈沒有足夠的統計數據。的確,對於在整個實數上都有支持的柯西分佈,樣本中位數是足夠的統計量,但這是因為它是從階數統計繼承而來的。碰巧的是,它足夠了,缺乏一種簡單的思考方式。現在,在貝葉斯統計中,對於柯西分佈的參數有足夠的統計量,如果您使用均勻先驗,則它也是無偏的。我之所以提出這一點,是因為如果您必須每天使用它們,那麼您已經了解了對它們進行估算的所有方法。這是由於以下事實:基於長期頻率的統計信息和貝葉斯統計信息之間的推斷方向相反。

在現實世界中,您可能會遇到沒有有效的訂單統計信息來用作截斷柯西分佈的估計量,因此基於頻率的方法中沒有足夠的統計信息可用於大多數但不是全部現實應用。

我建議在心理上擺脫現實的卑鄙。它是一種工具,例如錘子,用途廣泛,通常可以使用。有時,該工具無法使用。

關於正態和柯西分佈的數學註釋。當按時間序列接收數據時,僅當誤差隨著t趨於無窮大而收斂到零時才發生正態分佈。當按時間序列接收數據時,當誤差發散到無窮大時,將發生柯西分佈。一個是由於收斂級數,另一個是由於發散級數。柯西分佈永遠不會到達極限的特定點,它們在固定點上來回擺動,這樣一來,百分之五十的時間在一側,百分之五十的時間在另一側。沒有中值恢復。

這個回應有些混亂!例如,它說:“現在在貝葉斯統計中,對於柯西分佈的參數有足夠的統計量,如果您使用統一的先驗,那麼它也是無偏的。”這很難理解!首先,Frequentist和Bayesian的充裕度概念非常接近(我相信只能在某些奇怪的無窮大樣本空間中有所區別,因此實線是相同的)。簡單地說,沒有足夠的統計信息用於固定尺寸的Cauchy模型(完整的數據顯然是足夠的)。
Paul
2012-11-10 23:39:00 UTC
view on stackexchange narkive permalink

簡單地說,當您縮小時,曲線下方的區域接近無窮大。如果對有限區域進行採樣,則可以找到該區域的均值。但是,無窮無盡。

根據定義,PDF下的面積等於$ 1 $,因此您必須通過“曲線”來表示其他含義。它是什麼?


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...