題:
如果原假設和替代假設都錯了怎麼辦?
Lei Huang
2018-09-06 09:14:53 UTC
view on stackexchange narkive permalink

在假設檢驗中,替代假設不必與原假設相反。例如,對於$ H_0:\ mu = 0 $,$ H_a $被允許為$ \ mu>1 $或$ \ mu = 1 $。我的問題:為什麼允許這樣做?如果實際上$ \ mu = -1 $或$ \ mu = 2 $,在這種情況下,如果應用了例如似然比檢驗,可能會(錯誤)得出$ H_0 $或$ H_0 $被接受的結論。被拒絕,因此$ H_a $被接受?

該提案如何:$ H_a $應該始終與$ H_0 $相反?也就是說,$ H_a:H_0 $不正確。這樣,我們僅在檢驗單個假設$ H_0 $時有效,在p值低於預定義的顯著性水平時將其拒絕,而不必同時檢驗可能都是錯誤的兩個假設。

相關(尤其是已接受的答案):https://stats.stackexchange.com/questions/232665/understanding-formulation-of-hypotheses-in-difference-between-two-sample-means/232669#232669
未定義語句“ $ H_0 $不正確”,直到您描述所有可能的假設的範圍。*
四 答案:
Jack Aidley
2018-09-06 14:30:18 UTC
view on stackexchange narkive permalink

您所確定的是這種假設檢驗方法的基本缺陷之一:即,您正在進行的統計檢驗沒有評估您實際上有興趣評估其真實性的陳述的有效性。

在這種假設檢驗形式中,$ H_a $永遠不會被接受,您只能拒絕$ H_0 $。統計測試的用戶對此普遍存在誤解和誤解。

Alexis
2018-09-06 09:51:38 UTC
view on stackexchange narkive permalink
在原假設下,分佈的樣本空間中的

$ H_ {a} $正好是$ H_ {0} $的補數。因此,單面測試應正確包含$ H_ {0}:\ mu \ ge c $(對於某些數字$ c $),以及$ H_ {a}:\ mu < c $(反之亦然:$ H_ {0}:\ mu \ le c $,以及$ H_ {a}:\ mu > c $),正是出於您提及的原因:如果將單面檢驗中的原假設指定為$ H_ {0}:\ mu = 0 $,則單面備選假設不能表示$ H_ {0} $的補碼。因此,我(和其他人)不同意那些使用您所描述的令人困惑的術語的人。

有關類似問題,請在此處見我的答案。

謝謝。與Neyman–Pearson引理中的$ H_0:\ mu = \ mu_1 $和$ H_a:\ mu = \ mu_2 $一樣呢?
不,您不能進行僅涉及兩點的經典似然比檢驗。但是正如傑克之前所說的那樣,假設檢驗永遠不是一個好主意,除非在非常特殊,狹窄的情況下。貝葉斯主義者會說“讓我證明,未知參數在您指定的任何間隔內”。
@LeiHuang該死!我一直都在拼寫那個!謝謝。我個人不會使用“替代假設”一詞來描述內曼-皮爾遜引理中的兩個假設,因為我給出答案的原因或多或少。在我看來,通過詢問數據可以提供更多證據的參數這兩個值中的哪個值,NPL還使用與Wald型檢驗統計數據不同的邏輯。
@LeiHuang Also:第一個評論中的NPL類型假設與原始問題中的單面假設(並且實際上來自$ H_ {0}:\ mu = \ mu_ {1},H_ {a}:\ mu \ ne \ mu_ {1} $)。
bluepole
2018-09-06 21:25:39 UTC
view on stackexchange narkive permalink

這通過零假設重要性檢驗(NHST)指出了常規統計中的少數嚴重問題之一。在這種情況下,更有意義的方法是完全放棄NHST,而採用貝葉斯框架。如果您有一些先驗信息,只需通過先驗分佈將其合併到模型中即可。不幸的是,大多數統計消費者都太過灌輸,迷戀和根深蒂固。在此處

查看更多討論。
Stilez
2018-09-07 01:56:16 UTC
view on stackexchange narkive permalink

正確地說,我們實際上並沒有檢驗替代假設是否成立。通常以這種方式進行描述,但是就基本統計數據而言,這是不正確的。

我們實際上測試是否存在足夠的證據來接受某些“新” /“新” /“非默認”假設H。我們通過

  1. 考慮到我們所知道的(適當時採用貝葉斯風格);
  2. 選擇我們認為適用於我們正在探查的數據和假設的測試,並且
  3. 規定要視為“重要”的點。
  4. ol>

    的顯著性水平

    最後一項,即“顯著性水平”,常常引起混亂。我們實際上所說的是,“如果假設是錯誤的,那麼我們的結果有多例外?”因此,假設我們將顯著性水平設置為0.1%(P = 0.001),那麼我們所說的是:

    “如果我們的假設是錯誤的,那麼我們純屬偶然,只能得到千分之一的結果。這不太可能使我們得出假設是正確的。”

    因此,您可以在自己喜歡的地方“畫線”-對於某些研究,例如粒子物理學,您需要兩個單獨的(獨立的)實驗兩者,其顯著性水平為百萬分之一,在得出假設之前可能是正確的。對於操縱骰子遊戲,三分之一的水平可能足以說服您不要玩該遊戲:)

    但是無論哪種方式,預先選擇級別都是至關重要的,否則,您可能只是在使用“您喜歡的任何級別”做出自我服務的聲明。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 4.0許可。
Loading...