如果有多種可能的近似值,我正在尋找最基本的近似值。
如果有多種可能的近似值,我正在尋找最基本的近似值。
您可以使用多元正態分佈對其進行近似,就像通過二元正態分佈近似二項分佈一樣。檢查15-16-17頁中的分佈理論的元素和多項式分佈。
讓$ P =(p_1,...,p_k)$是概率的向量。則多元正態分佈的均值向量為$ np =(np_1,np_2,...,np_k)$。協方差矩陣是一個$ k×k的對稱矩陣。對角元素實際上是$ X_i $的方差;即$ np_i(1-p_i)$,$ i = 1,2 ...,k $。第i行第j列的對角線元素為$ \ text {Cov}(X_i,X_j)=-np_ip_j $,其中$ i $不等於$ j $。
此答案中給出的密度是退化的,因此我使用以下公式來計算由正態近似得出的密度:
有一個定理說,給定一個隨機變量 $ X = [X_1,\ ldots,X_m] ^ T \ sim \ text {Multinom}(n,p)$ span>,用於 $ m $ span>維矢量 $ p $ span>和 $ \ sum_i p_i = 1 $ span>和 $ \ sum_i X_i = n $ span>,即;
$$ X \ xrightarrow {d} \ sqrt {n} \,\ text {diag}(u)\,Q \ begin {bmatrix} Z_1 \\ \ vdots \\ Z_ {m-1} \\ 0 \ end {bmatrix} + \ begin {bmatrix} n p_1 \\ \ vdots \\ n p_m \ end {bmatrix}, $$ span>
對於大型 $ n $ span>,已給定;
也就是說,通過重新排列,我們可以為第一個 $ m-1 $ span>維度多元正態分佈 $ X $ span>的container“> $ m-1 $ span>組件(這是唯一有趣的組件,因為 $ X_m $ span>是其他值的總和。
矩陣 $ Q $ span>的合適值為 $ I-2 vv ^ T $ span>,其中 $ v_i =(\ delta_ {im}-u_i)/ \ sqrt {2(1-u_m)} $ span>-即特定的Householder轉換。
如果我們將左側限制為第一行 $ m-1 $ span>行,並限制 $ Q $ span>到其第一行 $ m-1 $ span>行和 $ m-1 $ span>列(表示這些 $ \ hat {X} $ span>和 $ \ hat {Q} $ span>分別)然後: >
$$
\ hat {X}
\ xrightarrow {d} \ sqrt {n} \ text {diag}(\ hat {u})\ hat {Q}
\ begin {bmatrix}
Z_1 \\ \ vdots \\ Z_ {m-1}
\ end {bmatrix} +
\ begin {bmatrix} n p_1 \\ \ vdots \\ n p_ {m-1} \ end {bmatrix}
\ sim
\ mathcal {N} \ left(\ mu,n \ Sigma \ right),
$$ span> 對於大型 $ n $ span>,其中; 最後一個方程的右側是計算中使用的非簡併密度。 按預期的方式,當您插入所有內容時,您將獲得以下協方差矩陣: $$(n \ Sigma)_ {ij} = n \ sqrt {p_i p_j}(\ delta_ {ij}-\ sqrt {p_i p_j})$$ span> 對於 $ i,j = 1,\ ldots,m-1 $ span>,它與原始答案中的精確協方差矩陣僅限其前 $ m-1 $ span>行和 $ m-1 $ span>列。 這個博客條目是我的出發點。