題:
多項式分佈的正態近似是多少?
ericstalbot
2012-08-18 01:14:25 UTC
view on stackexchange narkive permalink

如果有多種可能的近似值,我正在尋找最基本的近似值。

二 答案:
Stat
2012-08-18 01:20:20 UTC
view on stackexchange narkive permalink

您可以使用多元正態分佈對其進行近似,就像通過二元正態分佈近似二項分佈一樣。檢查15-16-17頁中的分佈理論的元素多項式分佈

讓$ P =(p_1,...,p_k)$是概率的向量。則多元正態分佈的均值向量為$ np =(np_1,np_2,...,np_k)$。協方差矩陣是一個$ k×k的對稱矩陣。對角元素實際上是$ X_i $的方差;即$ np_i(1-p_i)$,$ i = 1,2 ...,k $。第i行第j列的對角線元素為$ \ text {Cov}(X_i,X_j)=-np_ip_j $,其中$ i $不等於$ j $。

我想我的統計水平還不夠,無法把這個答案中的點連接起來。如果我有樣本量n和概率P,如何計算多元正態分佈的均值矢量和協方差矩陣?
查看第二參考。
統計信息,以便該答案可以獨立存在(並且可以防止鏈接腐爛),您介意給出解決方案的摘要嗎?
令P =(p_1,...,p_k)為您的概率向量。那麼多元正態分佈的均值向量為np =(np_1,np_2,...,np_k)。協方差矩陣是k X k對稱矩陣。對角元素實際上是X_i的方差,即np_i(1-p_i),i = 1,2 ...,k。第i行第j列的對角線元素為Cov(X_i,X_j)=-np_ip_j,其中i不等於j。
這需要連續性校正嗎?您將如何應用它?
協方差矩陣不是正定的,而是正半定的,並且不是滿秩的。這使得所得的多正態分佈不確定。這是我面臨的問題。知道如何處理嗎?
@M.Alaggan:此處定義的均值/協方差矩陣有一個小問題:對於具有$ k $變量的多項式分佈,等效的多元正態變量具有$ k-1 $變量。這在簡單的二項式示例中很明顯,該示例由(普通)正態分佈近似。有關更多討論,請參見[分佈理論的要素](https://www.amazon.com/dp/1107630738)的示例12.7。
-1
我想說的是,限制在超平面上的分佈並不是微不足道的,但是結果已經足夠確定,可以在Wikipedia上找到:請參見https://en.wikipedia.org/wiki/Multivariate_normal_distribution#Degenerate_case
stephematician
2020-03-17 09:42:42 UTC
view on stackexchange narkive permalink

此答案中給出的密度是退化的,因此我使用以下公式來計算由正態近似得出的密度:

有一個定理說,給定一個隨機變量 $ X = [X_1,\ ldots,X_m] ^ T \ sim \ text {Multinom}(n,p)$ span>,用於 $ m $ span>維矢量 $ p $ span>和 $ \ sum_i p_i = 1 $ span>和 $ \ sum_i X_i = n $ span>,即;

$$ X \ xrightarrow {d} \ sqrt {n} \,\ text {diag}(u)\,Q \ begin {bmatrix} Z_1 \\ \ vdots \\ Z_ {m-1} \\ 0 \ end {bmatrix} + \ begin {bmatrix} n p_1 \\ \ vdots \\ n p_m \ end {bmatrix}, $$ span>

對於大型 $ n $ span>,已給定;

  • 向量 $ u $ span>與 $ u_i = \ sqrt {p_i} $ span>;
  • 隨機變量 $ Z_i \ sim N(0,1)$ span> for $ i = 1,\ ldots,m -1 $ span>和;
  • 正交矩陣 $ Q $ span>,最後一列為 $ u $ span>。

也就是說,通過重新排列,我們可以為第一個 $ m-1 $ span>維度多元正態分佈 $ X $ span>的container“> $ m-1 $ span>組件(這是唯一有趣的組件,因為 $ X_m $ span>是其他值的總和。

矩陣 $ Q $ span>的合適值為 $ I-2 vv ^ T $ span>,其中 $ v_i =(\ delta_ {im}-u_i)/ \ sqrt {2(1-u_m)} $ span>-即特定的Householder轉換。

如果我們將左側限制為第一行 $ m-1 $ span>行,並限制 $ Q $ span>到其第一行 $ m-1 $ span>行和 $ m-1 $ span>列(表示這些 $ \ hat {X} $ span>和 $ \ hat {Q} $ span>分別)然後: >

$$ \ hat {X} \ xrightarrow {d} \ sqrt {n} \ text {diag}(\ hat {u})\ hat {Q} \ begin {bmatrix} Z_1 \\ \ vdots \\ Z_ {m-1} \ end {bmatrix} + \ begin {bmatrix} n p_1 \\ \ vdots \\ n p_ {m-1} \ end {bmatrix} \ sim \ mathcal {N} \ left(\ mu,n \ Sigma \ right), $$ span>

對於大型 $ n $ span>,其中;

  • $ \ hat {u} $ span>表示 $ m-1 $ span>項class =“ math-container”> $ u $ span>;
  • 平均值是 $ \ mu = [n p_1,\ ldots,n p_ {m-1}] ^ T $ span>,並且;
  • 協方差矩陣 $ n \ Sigma = n AA ^ T $ span>與 $ A = \ text {diag}( \ hat {u})\ hat {Q} $ span>。

最後一個方程的右側是計算中使用的非簡併密度。

按預期的方式,當您插入所有內容時,您將獲得以下協方差矩陣:

$$(n \ Sigma)_ {ij} = n \ sqrt {p_i p_j}(\ delta_ {ij}-\ sqrt {p_i p_j})$$ span>

對於 $ i,j = 1,\ ldots,m-1 $ span>,它與原始答案中的精確協方差矩陣僅限其前 $ m-1 $ span>行和 $ m-1 $ span>列。

這個博客條目是我的出發點。

另一個有用的資源是以下鏈接中提供的鏈接:https://stats.stackexchange.com/questions/2397/asymptotic-distribution-of-multinomial
好的答案(+1)---請注意,您可以使用語法“ [文本描述](超鏈接)`”嵌入鏈接。我已自由編輯此答案以嵌入您的鏈接。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...