題:
從1個樣本量中我們可以說總體平均值是什麼?
thedu
2015-06-18 20:21:15 UTC
view on stackexchange narkive permalink

我想知道我們能說什麼(如果有的話),關於人口平均值,當我只有一個測量值y_1 $(樣本大小為1)時,$ \ mu $。顯然,我們希望有更多的度量,但我們無法獲得它們。

在我看來,由於樣本均值$ \ bar {y} $幾乎等於$ y_1 $,然後$ E [\ bar {y}] = E [y_1] = \ mu $。但是,如果樣本大小為1,則樣本方差是不確定的,因此我們對使用$ \ bar {y} $作為$ \ mu $的估計量的信心也是不確定的,對嗎?有沒有辦法完全限制我們對$ \ mu $的估計?

是的,可以在某些假設下構建$ \ mu $的置信區間。如果沒有人發布,我將對其進行跟踪。
有關同一問題的另一個版本,請參見http://stats.stackexchange.com/questions/1807(樣本平均值是可用的,但樣本量不可用,因此,平均值實際上是來自未知樣本的*單個*觀察值發行)和http://stats.stackexchange.com/questions/20300進行相關討論。
最近一篇討論正常情況下這些估計量最優性的文章:http://www.tandfonline.com/doi/full/10.1080/00031305.2017.1360796
五 答案:
soakley
2015-06-18 21:16:17 UTC
view on stackexchange narkive permalink

如果已知總體正常,則由$ x \ pm 9.68 \ left |給出基於單個觀察值$ x $的95%置信區間。 x \ right | $$

Wall,Boen和Tweedie在美國統計學家,2001年5月,第一卷。 55,No.2。 ( pdf

我討厭聽起來很蠢,但是..肯定不是。這取決於單位,並且根本無法正常工作(按我的意思是標量乘法....)
對我來說聽起來並不愚蠢-好問題。我簡短地看了這篇論文,確實,它確實暗示了@soakley所描述的內容。但是,該方法實際上是否為CI提供了“最小覆蓋率”為95%的條件?參見第102,右列。
@Alec僅僅因為一個過程取決於度量單位(也就是說,它不是不變的),並不意味著它會自動無效甚至是錯誤的。這是有效的:閱讀文章並做數學運算。不過,許多人會認為它有點“令人困擾”。更令人驚訝的是,您甚至不必假設基礎分佈是正態分佈:任何單峰分佈都具有相似的結果(但必須將9.68增大到19左右):請參閱我在評論中提供的鏈接題。
該雜誌的下一期有三封給編輯,其中一封提到了Alec Teal關於單位的觀點。Wall的回答是這樣的:“置信區間不是等變的(即,其覆蓋概率取決於$ {{\ left | \ mu \ right |} \ over {\ sigma}} $ ...的比率”)後來她說:“置信區間不是基於關鍵量...”這無疑是一種不尋常的方法和結果!
只是為了節省您的全部工作:[致編輯的信&答复](http://amstat.tandfonline.com/doi/abs/10.1198/000313002753631420)@soakley註釋出現在[* The American Statistician *,卷56號1(2002)](http://amstat.tandfonline.com/toc/utas20/56/1)。
當$ \ sigma \ approx |近似值時,這似乎給出了覆蓋均值的置信區間,概率約為$ 95 \%$。\ mu |\ gt 0 $,但概率更高。如果$ \ mu = 0 $,則顯然概率為$ 100 \%$,因為置信區間始終包含$ 0 $。
Stephan Kolassa
2015-06-18 20:42:08 UTC
view on stackexchange narkive permalink

當然可以。使用貝葉斯(Bayesian)範式。您可能至少對$ \ mu $可能有一個 概念-例如,它在物理上不能為負,或者顯然不能大於100(也許您正在測量您當地的高中足球隊員的身高(英尺)。在此之前放一個先驗,用您的單獨觀察對其進行更新,您將擁有一個美妙的後驗。

(+1)一個觀察結果將被先驗結果淹沒,因此從後驗中得到的結果似乎不會多於您放入先驗結果中。
如果我們將這樣的先驗與可憐的$ x \ pm 9.68 \ left | x \ right | $所隱含的可能性結合起來怎麼辦?
@SimonKuang:的一個概念性問題是,我們只能在觀察到$ x $之後使用$ x \ pm 9.68 | x | $間隔,因此不能輸入* prior *。
@StephanKolassa不,此間隔(以及相關的分佈)構成可能性。我們的先決條件是分開的。
@SimonKuang:是的,您是對的,我的錯。不幸的是,我目前沒有時間做這個,但是如果您這樣做,請發表您發現的內容!
Richard Hardy
2015-06-19 15:14:33 UTC
view on stackexchange narkive permalink

一個小小的模擬練習,以說明@soakley的答案是否有效:

 #設置試驗次數,MM = 10 ^ 6#設置每個試驗的真實平均值mu = rep(0,M)#設置每個試驗的真實標準偏差d = rep(1,M)#將計數器設置為零count = 0for(i in 1:M){#控制隨機數seed(i)#生成一幅具有給定平均值和標準差x = rnorm(n = 1,mean = mu [i],sd = sd [i]的正態隨機變量的平局)#估計總體均值下限置信度下限= x-9.68 * abs(x)#估計總體均值上限置信度上限上限= x + 9.68 * abs(x)#如果真實均值在置信度內時間間隔,將其計數為if((lower<mu [i])&&(mu [i] <upper))count = count + 1}#獲取真實均值在置信區間內的情況下的百分比count_pct = count / M#打印resultprint(count_pct)[1] 1  

在一百萬次隨機試驗中,置信區間包括一百萬次的真實平均值,即始終。如果置信區間為 95%,則不會發生這種情況。

因此該公式似乎不起作用...還是我犯了編碼錯誤?

編輯:使用$時,經驗值相同(\ mu,\ sigma)=(1000,1)$;
然而,對於$(\ mu,\ sigma)=(1000,1000)$,它是$ 0.950097 \約0.95 $-因此非常接近95%置信區間。

代碼很好-但是您確實不需要循環(只需直接``rnorm(M,mean = mu,sd = sd)``然後將其餘部分向量化;這也將更快)。而且,實際上並不需要運行模擬來表明$ x \ pm f | x | $在$ f \ ge 1 $時*總是*捕獲0。
完全同意您的編碼/計算效率!不過,我是故意這樣做的,目的是複制人們的思維方式(而不是計算機最喜歡它的方式)。但是我不太明白你的後一點。是正確的,但是有什麼關係呢?在這裡,$ x $是隨機的,這與捕獲總體均值的置信區間有關,不必為零。
實際上,對於不等於0的$ \ mu $,這很有用(首先提供+1即可提供代碼!)。我的意思是,對於$ \ mu = 0 $,將永遠捕獲0是一個已成定局的結論。
哦,我明白了。在我的模擬中,我確實使用了$ \ mu = 0 $。我應該嘗試其他一些值來評估敏感性。
(@Wolfgang)這不是測試置信區間的方法。該定義不要求$ \ alpha $級別的CI覆蓋*在每種情況下*的平均時間$ 1- \ alpha $:它僅要求(a)在每種情況下*至少*具有如此多的覆蓋率,並且(b)在某些情況下它近似於該覆蓋率。因此,為了使您的方法有效並令人信服,您將不得不搜索大量可能性。嘗試`sim <-function(rho,n.iter = 1e5,sigma = 1,psi = 9.68){ mu <-runif(n.iter,0,sigma)* rho; x <-rnorm(n.iter,mu,sigma); 平均值(p <-abs(x-mu)<= psi * abs(x)) }; sim(1.75)`
我理解您要提出的觀點,但是我強烈不同意“這不是測試置信區間的方法”的說法。在CI的定義/構造中,參數是固定常數。在模擬中,$ \ mu $不斷變化。對於固定的\ mu $,如果該方法確實給出了95%的置信區間,則在95%的情況下,它應該覆蓋$ \ mu $。沒有。同樣,即使使用您的構造,sim(0.1)也會產生非常接近1的覆蓋率(當然,現在我們又越來越接近固定為0的$ \ mu $)。
當然,可以構建一個*至少* 95%覆蓋率的區間。但這從嚴格意義上來說並不是95%的置信區間(因此需要澄清該方法是保守的)。
@Wolfgang檢查引用的紙張使用的定義,它是:$ P(X-\ zeta | X | \ leq \ mu \ leq X + \ zeta | X |)\ geq 1-\ alpha $,即$ \區間中的mu $至少為0.95。
@Tim啊,知道了,謝謝。但是,我不會將其稱為95%CI-或至少強烈強調覆蓋率可能更高,並且在某些情況下,它實際上可能是1。否則,讓我建議另一個95%CI:$(-\infty,+ \ infty)$(不考慮數據);)
@Wolfgang選擇適當的$ \ zeta $值使您可以找到包含$ \ mu $的間隔,且概率至少為0.95。較低的$ \ zeta $會使您對它的信心降低。選擇$ \ zeta = \ infty $提供的配置項將在一定程度上涵蓋$ \ mu $,但也並不能給您太多提示$ \ mu $可以是什麼,而$ \ zeta = 9.68 $為您提供了一些信息極有限的數據,概率為0.95。這說得通。
這不是我目前最熟悉的編程語言,但是...您似乎總是從$ Normal(0,1)$中提取。聲明的CI將始終包括零,因此此模擬僅測試$ 0 $在CI中。“真實”測試還會改變平均值和標準偏差。(也就是說,本文討論了從任意正態分佈中提取的單個樣本。該模擬似乎沒有從任意正態分佈中提取,因此應該小心期待相同的結果。)
您所指的@EricTowers,已廣為接受。但是,我只需要一個反例來說明該公式不能通用。Soakley給出的公式沒有任何警告,也沒有任何條件(正常情況除外),因此我只是表明需要一些公式,否則它可能會失敗。
同樣,$ \ mu $是一個常數。因此,使用$ \ mu = 0 $進行模擬是完全可以的。當然,覆蓋率必須為1。該方法提供的CI至少具有* 95%的覆蓋率,並且該示例顯示(無論是通過模擬還是通過推理)在某些情況下覆蓋率可能高達100%。因此,它不是95%的CI。從這麼少的信息中得出某種推斷仍然是一種非常聰明的方法。
@RichardHardy:在執行指定的實驗時,給定的間隔是95%CI,即來自任意正態分佈的單個樣本。如果您選擇對任意正態分佈空間的某些子集執行不同的實驗,則CI可能會縮小或在相同間隔內的置信度會增加。這絕不會使有關非限制性實驗中CI置信度的主張無效。
@EricTowers,我的想法很簡單。為了反駁一個總的說法,一個反例就足夠了。我提供了這樣一個例子。(同時,為了證明一般性陳述,應檢查所有可能的情況,並且所有情況都應滿足該陳述。)
@RichardHardy:通過採用多個觀察結果,您已經假設“如果已知總體正常,則基於單個觀察結果的置信區間為95%”,這已超出假設範圍。您尚未執行上述實驗。
我已經執行了-一百萬次。每次都完全相同的實驗(相同的總體$ N(\ mu,\ sigma ^ 2)$,相同的樣本大小1,隨機抽樣)。之後,我查看了結果,在這裡,我得到的覆蓋範圍是一百萬中的一百萬。如果我只做一次實驗,我將無法獲得所需的信息。
Stephan Kolassa
2015-09-02 13:24:33 UTC
view on stackexchange narkive permalink

這裡有一篇有關泊松案的新文章,採用了一種很好的教學方法:

安德森。 PerGösta(2015)。使用一個觀測值構造Poisson均值的近似置信區間的一種課堂方法。 美國統計學家,69(3),160-164,DOI: 10.1080 / 00031305.2015.1056830

不幸的是,在收費牆後面
@Tim:就是這樣。再說一次,[ASA會員資格](http://www.amstat.org/membership/index.cfm)並不十分昂貴,您可以訪問* The American Statistician *,* JASA *和許多其他期刊以非常合理的價格,我個人很高興自掏腰包。我真的認為您在這裡物有所值。YMMV,當然。
+1,但Poisson情況與正常情況完全不同,因為方差必須等於均值。泊松結果非常簡單,而正常情況下的$ x \ pm 9.68 | x | $結果是違反直覺和神秘的。
@amoeba:相當正確,但是OP沒有對分發進行任何限制。
這太簡短了,最好將其用作評論。但是,由於它是可接受的答案,因此您可能不希望將其轉換為評論。然後,您能否總結一下本文的要點?
David Edelman
2019-10-16 23:16:39 UTC
view on stackexchange narkive permalink

請參見Edelman,D(1990),“基於樣本量為一個的未知單峰分佈中心的置信區間”,《美國統計學家》,第44卷,第4期。 本文涵蓋了正常和非參數案例。

歡迎來到Stats.SE。您能否編輯您的答案以擴大它的範圍,以便包括您引用的書的要點?這對於原始海報和在此站點中搜索的其他人都將更有幫助。順便說一句,如果您還沒有參加[Tour],請把握機會。另請參見有關[answer],[格式化幫助](https://stats.stackexchange.com/help/formatting)和使用[LaTeX / MathJax](https://math.meta.stackexchange寫下公式的一些技巧.com / q / 5020)。
歡迎來到我們的網站,大衛。非常感謝您作為該文章的作者(我相信在這裡已在多個主題中被引用)做出的貢獻,因此,您可以在此答案中提供的任何觀點或意見將受到歡迎。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...