您可以機械地檢查不存在期望值,但這在物理上應該直觀,至少要接受惠更斯原理和大數法則 。對於柯西分佈,大數定律的結論是失敗的,因此它沒有平均值。如果平均$ n $個獨立的柯西隨機變量,則結果不會收斂為$ 0 $,因為$ n \到\ infty $的概率為$ 1 $。它保持相同大小的柯西分佈。這在光學中很重要。
柯西分佈是來自點光源的線上的歸一化光強。惠更斯原理說,您可以通過假設光源和目標之間的任何線重新發射光來確定強度。因此,可以通過假設光線首先擊中距離$ 1 $米的線並以任何前向角度重新發射,來確定距離$ 2 $米的線的光強度。距離為$ n $米的直線上的光的強度可以表示為距離$ 1 $米的直線上光的分佈的$ n $倍卷積。也就是說,$ n $個獨立柯西分佈的總和是一個按比例縮放$ n $的柯西分佈。
如果柯西分佈具有均值,那麼根據大數定律,n美元折疊卷積除以n美元的第25美元百分位數必須收斂到0美元。相反,它保持不變。如果在$ 1 $米,$ 2 $米等的(透明)線上標記$ 25 $百分位數,則這些點將以$ 45 $度形成一條直線。它們不會向$ 0 $彎曲。
這特別告訴您有關柯西分佈的信息,但是您應該了解積分檢驗,因為還有其他分佈,這些均無平均值,並且沒有清晰的物理解釋。 。
響應@whuber對Michael Chernicks答案的評論而添加了答案(並完全重寫以消除whuber指出的錯誤。)
柯西期望值的積分值之所以說隨機變量是不確定的,是因為該值可以被“製造”為任何喜歡的東西。積分$$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$(以黎曼積分的意義解釋)為通常稱為不正確積分,其值必須計算為極限值:$$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx = \ lim_ {T_1 \ to- \ infty} \ lim_ {T_2 \ to + \ infty} \ int_ {T_1} ^ {T_2} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$ or $$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx = \ lim_ {T_2 \ to + \ infty} \ lim_ {T_1 \ to- \ infty} \ int_ {T_1} ^ {T_2} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$和或當然,兩個評估都應給出相同的有限值。如果不是,則說積分是不確定的。這立即表明了為什麼將柯西隨機變量的主題定義為未定義:內部極限的極限值發散。
柯西主值作為單個極限獲得:$$ \ lim_ {T \ to \ infty } \ int _ {-T} ^ {T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$,而不是上述雙限制。期望積分的主值很容易看出是$ 0 $,因為該限制對所有$ T $具有值$ 0 $。但這不能說Cauchyrandom變量的均值為$ 0 $。也就是說,將平均值定義為通常意義上的積分值,而不是主值意義上的積分。
對於$ \ alpha > 0 $,請考慮積分$$ \ begin {align} \ int _ {-T} ^ {\ alpha T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx& = \ int _ {-T} ^ {T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx + \ int_ {T} ^ {\ alpha T} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx \\ & = 0 + \ left。\ frac {\ ln(1 + x ^ 2)} {2 \ pi} \ right | _T ^ {\ alpha T} \\ & = \ frac {1} {2 \ pi} \ ln \左(\ frac {1+ \ alpha ^ 2T ^ 2} {1 + T ^ 2} \ right)\\
& = \ frac {1} {2 \ pi} \ ln \ left(\ frac {\ alpha ^ 2 + T ^ {-2}} {1 + T ^ {-2}} \ right)\ end {align} $$接近$ \ displaystyle \ frac {\ ln(\ alpha)} {\ pi} $的極限值,作為$ T \ to \ infty $。當$ \ alpha = 1 $時,我們得到本金值$ 0 $以上討論。因此,我們不能為表達式
$$ \ int _ {-\ infty} ^ {\ infty} \ frac {x} {\ pi(1 + x ^ 2)} \,\ mathrm dx $$賦予明確的含義沒有說明如何處理兩個無窮大,而忽略這一點會導致各種複雜性和錯誤的結果,因為當主要價值的牛奶偽裝成價值的奶油時,事情並不總是看起來那樣。這就是為什麼Cauchyrandom變量的均值被稱為未定義,而不是整數的主值$ 0 $的原因。從Lebesgue積分的意義上定義了值積分,那麼問題就更簡單了。 $ \ int g $僅在$ \ int | g | $是有限的時才存在,因此對於Cauchy隨機變量$ X $來說$ E [X] $是未定義的,因為$ E [| X |] $不是有限的。
雖然以上答案是對為什麼柯西分佈沒有期望的有效解釋,但我發現兩個獨立的正態$ \ mathcal {N}(0,1)$變量的比率$ X_1 / X_2 $是柯西的事實就像在照亮一樣:確實,我們有$$ \ mathbb {E} \ left [\ frac {| X_1 |} {| X_2 |} \ right] = \ mathbb {E} \ left [| X_1 | \ right] \ times \ mathbb {E} \ left [\ frac {1} {| X_2 |} \ right] $$,第二個期望是$ + \ infty $。
柯西(Cauchy)沒有平均值,因為您選擇的點(0)不是平均值。這是一個中位數和一個 mode 。絕對連續分佈的均值定義為$ \ int xf(x)dx $,其中$ f $是密度函數,積分取自$ f $的域(從$-\ infty $到$ \對於柯西(Cauchy),則為infty $。對於柯西密度,該積分根本不是有限的(從$-\ infty $到$ 0 $的一半是$-\ infty $,而從$ 0 $到$ \ infty $的一半是$ \ infty $)。
柯西分佈最好被認為是單位圓上的均勻分佈,因此如果取平均值是有意義的。假設$ f $是某種“平均函數”。也就是說,假設對於單位圓的每個有限子集$ X $,$ f(X)$是單位圓的一個點。顯然,$ f $必須是“非自然的”。更確切地說,$ f $不能相對於旋轉相等。要獲得更平常但不太顯眼的柯西分佈,請將單位圓從(0,1)投影到x軸上,然後使用此投影將圓上的均勻分佈轉移到x軸上。
要了解為什麼均值不存在,請將x視為單位圓上的一個函數。在單位圓上找到無數個不連續的弧是很容易的,這樣,如果其中一個弧的長度為d,則該弧上的x> 1 / 4d。因此,每個不相交的弧對平均值的貢獻都超過1/4,並且這些弧的總貢獻是無限的。我們可以再次執行相同的操作,但是x < -1 / 4d,總貢獻減去無窮大。這些間隔可以與圖表一起顯示,但是可以為交叉驗證製作圖表嗎?
某個隨機變量$ X $的均值或期望值是在某些概率測度$ P $:$$ EX = \ int XdP $$
上定義的Lebesgue積分均值的不存在Cauchy隨機變量僅表示Cauchy rv的積分不存在。這是因為Cauchy分佈的尾巴是重尾(與正態分佈的尾巴相比)。但是,不存在期望值並不禁止Cauchy隨機變量的其他函數存在。
更多是視覺上的解釋。 (對於我們這些數學難題的人。)。使用柯西分佈式隨機數生成器,然後嘗試平均結果值。這是有關此功能的好頁面。 https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable您會發現隨機值的“尖刻性”使它得到隨身攜帶更大而不是更小。因此,它沒有任何意義。
除了增加出色的答案外,我將對為什麼積分的非收斂性與統計實踐相關的問題做出一些評論。正如其他人提到的那樣,如果我們允許主值是“均值”,則slln不再有效!除此之外,請考慮以下事實的含義:在實踐中,所有模型都是近似值。具體而言,柯西分佈是無界隨機變量的模型。實際上,隨機變量是有界的,但界線通常是模糊且不確定的。使用無邊界模型是緩解這種情況的一種方法,它可以避免將不確定的(通常是不自然的)邊界引入模型。但是,這樣做有意義,問題的重要方面不應該受到影響。這意味著,如果我們要引入界限,則不應以重要方式改變模型。但是,當積分不收斂時,就不會發生!在某種程度上,該模型是不穩定的,因為RV的期望將取決於很大程度上任意的界限。 (在應用程序中,不必使邊界對稱!)
因此,最好說積分是發散的,而不是說積分是“無窮大”,最後一個接近於當不存在時暗示一定的值! 此處。
我想有點挑剔。頂部的圖形錯誤。 x軸存在標準偏差,對於柯西分佈不存在。我很挑剔,因為我在工作中的每一天都使用柯西分佈。在實際情況下,混淆可能會導致經驗錯誤。具有1個自由度的學生t分佈是標準的柯西(Cauchy)。它通常會列出重要性所需的各種sigma。這些sigma不是標準偏差,它們可能是錯誤,並且mu是模式。相等大小的錯誤,那麼您將給它們相等的可能錯誤。一個可能的誤差是正態分佈上的.67標準尺寸偏差。在這兩種情況下,它都是半四分位間距。但是,我懷疑您是該主題的學生並且是新手,因此對於視覺上明顯的東西而言,違反直覺的數學解決方案可能並不正確。分佈,都具有相同的模式和相同的可能錯誤。一個平均值為1.27,一個平均值為1.33。平均值為1.27的標準偏差為400,平均值為1.33的標準偏差為5.15。兩者的可能誤差均為0.32,眾數均為1。這意味著對於對稱數據,均值不在中心50%內。對於任何檢驗,僅需一次額外觀察即可將均值和/或方差推至顯著性之外。原因是均值和方差不是參數,樣本均值和样本方差本身就是隨機數。
最簡單的答案是柯西分佈的參數不包含均值,因此均值無方差。
在您過去的教學法中,均值的重要性可能在於它通常是足夠的統計數據。在基於長期頻率的統計數據中,柯西分佈沒有足夠的統計數據。的確,對於在整個實數上都有支持的柯西分佈,樣本中位數是足夠的統計量,但這是因為它是從階數統計繼承而來的。碰巧的是,它足夠了,缺乏一種簡單的思考方式。現在,在貝葉斯統計中,對於柯西分佈的參數有足夠的統計量,如果您使用均勻先驗,則它也是無偏的。我之所以提出這一點,是因為如果您必須每天使用它們,那麼您已經了解了對它們進行估算的所有方法。這是由於以下事實:基於長期頻率的統計信息和貝葉斯統計信息之間的推斷方向相反。
在現實世界中,您可能會遇到沒有有效的訂單統計信息來用作截斷柯西分佈的估計量,因此基於頻率的方法中沒有足夠的統計信息可用於大多數但不是全部現實應用。
我建議在心理上擺脫現實的卑鄙。它是一種工具,例如錘子,用途廣泛,通常可以使用。有時,該工具無法使用。
關於正態和柯西分佈的數學註釋。當按時間序列接收數據時,僅當誤差隨著t趨於無窮大而收斂到零時才發生正態分佈。當按時間序列接收數據時,當誤差發散到無窮大時,將發生柯西分佈。一個是由於收斂級數,另一個是由於發散級數。柯西分佈永遠不會到達極限的特定點,它們在固定點上來回擺動,這樣一來,百分之五十的時間在一側,百分之五十的時間在另一側。沒有中值恢復。
簡單地說,當您縮小時,曲線下方的區域接近無窮大。如果對有限區域進行採樣,則可以找到該區域的均值。但是,無窮無盡。