題:
用簡單的英語進行貝葉斯和常識推理
Daniel Vassallo
2010-07-20 00:25:39 UTC
view on stackexchange narkive permalink

您將如何用簡單的英語描述將貝葉斯與常識推理區分開的特徵?

也許你們中的一些好人也可以對有關在[philosophy.stackexchange.com](http://philosophy.stackexchange.com/questions/8275/interpret-bayesian-作為概率概率)。
[這個問題](https://stats.stackexchange.com/questions/21439/estimating-probability-of-success-given-a-reference-population)關於在擁有兩個數據集時得出有關單個碗選手的推論-其他玩家的結果以及新玩家的結果是一個很好的自發例子,說明了我的答案試圖用純英語解決的差異。
十五 答案:
user28
2010-07-20 00:42:28 UTC
view on stackexchange narkive permalink

這是我向奶奶解釋的基本區別:

我將手機放到家裡的某個地方了。我可以使用儀器基座上的電話定位器來定位電話,當我按下電話定位器時,電話會開始發出嗶嗶聲。

問題:應該在我家的哪個區域搜索?

頻率推理

我能聽到電話的嗶嗶聲。我還有一個心理模型,可以幫助我識別聲音的發出區域。因此,在聽到嗶嗶聲後,我推斷出我必須搜索的位置才能找到手機。

貝葉斯推理

我可以聽到手機嗶嗶聲。現在,除了可以幫助我識別聲音來源區域的思維模型之外,我還知道過去錯放手機的位置。因此,我會結合使用嗶嗶聲和以前關於我以前放錯位置手機的位置的先前信息,來推斷出我必須搜索以定位手機的區域。

我喜歡這個比喻。如果存在一個已定義的問題(基於數據集),在該問題中使用慣常推理得出答案,而使用貝葉斯推理得出答案(最好使用R腳本來處理這兩種推理),那麼我會發現這非常有用。我問得太多了嗎?
我能想到的最簡單的事情是拋硬幣n次並估計正面的概率(用p表示)。假設我們觀察到k個頭。那麼獲得k個頭的概率為:P(n個試驗中的k個頭)=(n,k)p ^ k(1-p)^(nk)頻繁推斷將使上述最大化,從而得出p = k的估計值/ n。貝葉斯會說:嘿,我知道p〜Beta(1,1)(這等效於假設p在[0,1]上是均勻的)。因此,更新後的推論將是:p〜Beta(1 + k,1 + n-k),因此p的貝葉斯估計將是p = 1 + k /(2 + n)我不知道R,對不起。
應該指出的是,從常客的觀點來看,沒有理由不能將先驗知識*併入*模型。從這個意義上講,常客視圖更簡單,您只有一個模型和一些數據。無需將先驗信息與模型分開。
@user28作為對您的評論的評論,如果$ n = 3 $,那麼在看到$ k = 0 $ heads(分別為$ k = 3)的結果時,常客將估計$ p = 0 $(分別為$ p = 1 $)。 $元),即硬幣是雙向的還是雙向的。貝葉斯估計$ 1/5 $和$ 4/5 $確實考慮到它是偏少的硬幣的可能性。
@Farrel-最近的問題位於http://stats.stackexchange.com/questions/21439/estimating-probability-of-success-given-a-reference-population/21466#21466,我的回答分為兩個部分(無意間)一個很好的簡單例子。將示例數據集和顯示兩種方法的R腳本組合在一起非常容易。
@user28-當您說“我不知道R”時,用字母“ R”指的是什麼?
@BYS2稱為R的編程語言。
我最近發布了一個關於貝葉斯示例的問題,該問題與此示例相似,但以有趣的方式略有不同。一名漁民在海上迷路了,海岸警衛隊用一個模型搜索他,然後在進行搜索時更新該模型……因此,他們將模型基於洋流/風的預測結果與“先驗信息”相結合他們已經搜索了。http://stats.stackexchange.com/q/119952/25734
這個例子很好,但是應該從頭開始。假設您沒有數據(“沒有嗶聲”),您可以進行概率推斷嗎?是的,您可以這樣做,因為貝葉斯表示,因為您已經了解了通常將手機留在哪裡(很有可能)-但是不,如果您是常客,則不能,因為只有數據是隨機的。-在這裡(我發現),人們看到了貝葉斯推理的“美”和一致性,因為沒有新數據的概率推理是自然的,貝葉斯很好地整合了新數據(蜂鳴聲)應如何影響推理。
正如常客在2010年已經評論過的那樣,您沒有理由不能將先驗知識納入模型。這是在優先推理中明確使用先驗知識的示例:在慣常測試中使用先驗知識。無花果。 https://doi.org/10.6084/m9.figshare.4819597.v3 另請參見下面其他答案中的替代定義。
應該提到的是,選擇哪種模型取決於應用程序。如果需要嚴格的精度而又不關心副作用,則應使用貝葉斯模型。如果您要在基於推理的操作上保持“公平”的分配,那麼常客模型可能是必要的。例如,確實可以考慮種族來確定某人的罪行,這可能會提高概率猜測的準確性,而且還會為不同種族帶來更大的假陰性和假陽性。所採取措施的影響將影響分配。
Dikran Marsupial
2010-08-12 19:53:36 UTC
view on stackexchange narkive permalink

舌頭緊緊貼在臉上:

貝葉斯定義“概率”的方式與大多數非統計學家完全相同,即表示命題或情況的合理性。如果您問他一個問題,他會給您直接答案,並分配概率來描述特定情況下可能的結果的可行性(並陳述其先前的假設)。

常客是相信概率代表的人事件發生的長期頻率;如果需要,他將發明一個虛擬的種群,從中可以將您的特定情況視為隨機樣本,以便他可以有意義地談論長期運行的頻率。如果您問他關於特定情況的問題,他將不會直接給出答案,而是要對這一(可能是虛構的)人口做出說明。許多非經常性統計學家會很容易將答案弄糊塗,並將其解釋為關於特定情況的貝葉斯概率。得出基本上相同的結果,差異主要是哲學問題,實際上是“課程的馬”問題。

您可能已經猜到了,我是貝葉斯專家和工程師。 ; o)

作為非專家,我認為整個辯論的關鍵是人們實際上像貝葉斯主義者那樣推理。您必須經過培訓才能像常客一樣思考,即使這樣,也容易滑脫,可以像貝葉斯那樣推理或陳述您的推理。 “該值有95%的機會在此置信區間內。”說夠了。
關鍵還在於考慮將20世紀的統計數據稱為“經典”什麼樣的遊說,而拉普拉斯和高斯在19世紀開始使用的統計數據卻沒有...
也許我從事頻繁事務工作的時間太長了,但是我不確定貝葉斯觀點是否總是直觀的。例如,假設我對感興趣的真實世界參數感興趣,例如人口的平均身高。如果我告訴您“在我可靠的區間中有95%的機率是感興趣的參數”,然後再問一個問題:“如果我們為不同的參數創建了100個這樣的區間,那麼我們期望它們包含的比例是多少參數的實際值?”,答案是“不是” 95的事實一定會使某些人感到困惑。
@CliffAB但是您為什麼要問第二個問題?關鍵是它們是不同的問題,因此具有不同的答案也就不足為奇了。貝葉斯算法可以回答這兩個問題,但答案可能有所不同(在我看來,這是合理的)。頻繁出現的人只能回答一個問題(由於概率的限制性定義),因此(隱式)對兩個問題都使用相同的答案,這就是導致問題的原因。可信區間不是置信區間,但是貝葉斯可以同時構造可信區間和可信區間。
我的評論是回應韋恩的;人們在貝葉斯語境中“自然地”思考的想法,因為它更容易解釋可信區間。我的觀點是,儘管構建一個合理的區間(即,少說一個湯)的正確解釋較為簡單,但我認為非統計學家對*真正*的含義感到困惑。
@CliffAB,啊,我有點明白,但是,如果您這麼認為是因為您從事頻繁工作太久了,那說明您對概率的思考方式不是您的自然選擇,而是您已經學習並習慣的一種方式。我不同意這一結論,通常對置信區間的誤解恰恰是將其解釋為可信區間,即可能在給定置信度下包含真實值的區間。同樣,p值謬誤源於以貝葉斯方式解釋常客測驗。
我的觀點還在於,我認為只有統計學家(Frequentist或Bayesian)才會認為“如果X在100次中發生1次,X發生的可能性為1/100”和“概率是不確定性的量度”的陳述是不相容的陳述。因此,很難說一種解釋比另一種解釋更“自然”。我認為大多數人不會自然地認為有區別。
實際上,您不必花很多時間就可以找到一個鐵桿(最硬的核心?)貝葉斯[偶然地說一個頻率主義的觀點可以更容易地理解“隨機”的含義。](http://www.bayesianphilosophy。com / trick-for-make-sense-of-statistics /)
@CliffAB這兩個語句在貝葉斯定義內不是不兼容的(沿運行頻率是表示存在長期運行頻率的不確定信念程度的一種合理方法),但是它們屬於常客制,這更使我認為貝葉斯框架更自然。請注意,我是個“課程馬”的人,所以用貝葉斯術語更容易用常識性的術語解釋一些事情。
Graham Cookson
2010-07-21 20:50:43 UTC
view on stackexchange narkive permalink

非常粗略地說,我會這樣說:

頻密主義者:抽樣是無限的,決策規則可以很敏銳。數據是可重複的隨機樣本-有頻率。基本參數是固定的,即在此可重複的採樣過程中它們保持不變。

貝葉斯:概率未知的數量被處理,世界狀況可以隨時更新。從實現的樣品中觀察數據。參數是未知的,並以概率方式描述。數據是固定的。

有一個精采的博客文章,其中提供了貝葉斯和頻繁主義者如何解決相同問題的深入示例。為什麼不親自回答問題然後再檢查呢?

問題(摘自Panos Ipeirotis的博客):

您有一枚硬幣,翻轉時最終會冒出概率 $ p $ span>並以概率 $ 1-p $ span>結束。 ( $ p $ span>的值是未知的。)

嘗試估算 $ p $ span>,您將硬幣翻轉100次。它結束了71次。

然後您必須決定以下事件:“在接下來的兩次拋擲中,我們將連續獲得兩個頭。”

您敢打賭該事件會發生還是不會發生?

因為$ 0.71 ^ 2 = 0.5041 $,所以我認為這接近一個均勻的賭注,可以準備適度地以任意一種方式進行娛樂(並忽略先前形狀的任何問題)。我有時會以更低的賠率購買保險和彩票。
在該博客文章的結尾處說:“與其使用統一分佈而不是先驗,我們甚至可以更加不可知。在這種情況下,我們可以使用Beta(0,0)分佈作為先驗。這種分佈對應在任何情況下均值分佈的可能性均等的情況下。在這種情況下,貝葉斯方法和常客主義這兩種方法得出的結果相同。”到底是哪種總結!
該博客文章的“大”問題是,它不能充分體現非貝葉斯(但理性)決策者的行為特徵。只不過是一個稻草人。
-1
“尖銳”是什麼意思?
@mcb-精確
[Beta(.5,.5)](https://en.wikipedia.org/wiki/Beta_distribution)看起來根本不適合硬幣的_p_。(我想這應該是[“無信息的”先驗]](https://en.wikipedia.org/wiki/Prior_probability#Uninformative_priors),但是從日常意義上講,它並不是無意義的,而是p接近0是“被質疑的”。或1,似乎是錯誤的意見。)
Tony Breyal
2010-07-20 04:40:01 UTC
view on stackexchange narkive permalink

讓我們說一個人擲出一個六邊形的骰子,其結果為1、2、3、4、5或6。此外,他說,如果它落在3上,他會給你一個免費的文本

然後非正式地:

Frequentist 會說每個結局具有六分之一的發生機會。她認為概率是從長期頻率分佈中得出的。

貝葉斯 ,但是要說一秒鐘,我知道那個人,他是大衛布萊恩,著名的騙子!我有一種感覺,他在做些什麼。我要說的是,它只有3%的機會落在3個 BUT 上,我將重新評估該信念,並在他擲骰子越多時對其進行更改。如果我看到其他數字同樣頻繁地出現,那麼我將迭代地將機會從1%增加到稍微更高的機會,否則我將進一步減少它。她將概率視為對命題的信任程度。

我認為常客會(詳細地)指出他的假設,並且會避免做出任何有用的預測。也許他會說:“假設死是公平的,那麼每個結局就有六分之一的機會發生。此外,如果死角是公平的,而大衛·布萊恩擲死17次,則只有5%的機會它永遠不會落在3上,所以這樣的結果會讓我懷疑死是公平的。”
那麼“可能性”(就像在MLE中一樣)會成為常客的“概率”嗎?
常客不能使用假設的David Blaine骰子模型,而不必使用統一的公平骰子模型嗎?
Brett
2010-12-04 09:06:01 UTC
view on stackexchange narkive permalink

只是有點樂趣...

貝葉斯人是一個隱約地期待著一匹馬,瞥見一頭驢子的人,堅信自己已經看到了ule子。

從此站點:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

同一站點,一篇不錯的文章……

“貝葉斯定理的直觀解釋”

http://yudkowsky.net/rational/bayes

在這種情況下,常客不會是知道驢,m子和馬人口比例的人,並且在觀察一包pack子後便開始計算p值,以了解統計上是否存在顯著增加在mu子的人口比例。
這根本無法回答問題。
mcdowella
2010-12-04 12:54:30 UTC
view on stackexchange narkive permalink

要求貝葉斯人下注,其中可能包括蒼蠅能更快爬上牆,藥物將挽救大多數生命,或哪些囚犯應入獄的任何東西。他有一個帶提手的大箱子。他知道,如果將他所知道的一切都放進盒子裡,包括他的個人見解,然後轉動手柄,它將為他做出最好的決定。

請常客寫報告。他有一本大黑規。如果他的規則手冊涵蓋了要求他進行報告的情況,則他可以遵循規則並撰寫措辭謹慎的報告,以至於錯了,最糟糕的是,每100次(或20次,或者一次)

常客知道(因為他已經寫了報告),貝葉斯有時會押注,在最壞的情況下,當他的個人觀點是錯誤的時,可能結果很糟糕。該常客也知道(出於同樣的原因),如果每次與貝葉斯不同時都對貝葉斯賭,那麼從長遠來看,他會輸。

“從長遠來看,他會輸”是模棱兩可的。我認為“他”是貝葉斯人嗎?從長遠來看,他們不會平等嗎?貝葉斯人可以學習和改變自己的個人見解,直到符合實際(但未知)的事實為止。
大盒子和大規則書之間的根本區別是什麼?我無法理解這個比喻。
probabilityislogic
2011-08-28 20:51:24 UTC
view on stackexchange narkive permalink

用簡單的英語來說,貝葉斯推理和慣常論的區別在於回答問題的兩種不同方式:

什麼是概率?

概率就是邏輯

我的“非普通英語”的原因是,如果我們用$ 1 $表示真值,用$ 0 $表示虛假,則命題演算是概率演算的特例。另外,概率的演算可以從命題的演算中得出。這與“貝葉斯”推理最緊密地相符-儘管它還通過提供分配概率的原理以及操縱它們的原理來擴展應用程序中的貝葉斯推理。當然,這導致了後續問題“什麼是邏輯?”對我而言,作為這個問題的答案,我能給出的最接近的答案是:“邏輯是具有給定假設的理性人的常識性判斷”(什麼是理性人?等)。邏輯具有貝葉斯推理具有的所有相同功能。例如,邏輯不會告訴您要假設什麼或“絕對正確”。它僅告訴您一個命題的真相如何與另一個命題的真相相關。您必須始終為邏輯系統提供“軸”,才能開始得出結論。它們也具有相同的局限性,因為您可以從矛盾的公理中獲得任意結果。但是“軸心”只不過是先驗概率,已設置為$ 1 $。對我來說,拒絕貝葉斯推理就是拒絕邏輯。因為如果您接受邏輯,那麼因為貝葉斯推理“從邏輯上邏輯地流動”(對於普通英語:P來說是什麼),您還必須接受貝葉斯推理。

概率是頻率

儘管我不確定“頻率”在這裡使用的方式是否是簡單的英語術語-也許是“比例”是一個更好的詞。我想在常問問題答案中添加一個事件的概率被認為是真實的,可測量的(可觀察的?)數量,該數量獨立於計算該事件的人/對象而存在。但是我不能用“普通英語”的方式來做到這一點。

所以也許是“普通英語”版本的不同之處在於,常客性推理是嘗試從“絕對”概率進行推理,而貝葉斯推理是嘗試從“相對”概率進行推理。

另一個不同之處是,在將現實世界中的問題轉化為理論的抽像數學時,常識性基礎更加模糊。一個很好的例子是在理論中使用“隨機變量”-它們在數學的抽象世界中有一個精確的定義,但是沒有明確的程序可以用來確定某個觀測量是否為“隨機”。

貝葉斯推理方式,“隨機變量”的概念不是必需的。概率分佈被分配給一個量,因為它是未知的-這意味著它不能從我們所擁有的信息中進行邏輯推斷。這立刻提供了可觀測量與理論之間的簡單聯繫-因為“未知”是明確的。

您還可以在上面的示例中看到這兩種思維方式的進一步差異-“隨機”與“未知”。 “隨機性”的措辭使“隨機性”看起來像是實際數量的屬性。相反,“未知”取決於您要詢問哪個人該數量-因此,這是統計人員進行分析的屬性。這就產生了經常附加在每種理論上的“客觀”形容詞和“主觀性”形容詞。可以很容易地表明,“隨機性”不能成為某些標準示例的屬性,只需簡單地讓兩個經常進餐的人獲得相同數量的不同信息,以決定其“隨機性”。一種是通常的Bernoulli缸:常客1在繪畫時被蒙住眼睛,而常客2站在the上,看著常客1從中抽出球。如果“隨機性”的聲明是骨灰盒中球的屬性,則它不能依賴於常客1和2的不同知識-因此,兩個常客應該給出相同的“隨機”或“非隨機”聲明

如果您可以在不參考常識的情況下重寫此代碼,我將很感興趣。
@PeterEllis-常識怎麼了?我們都有它,不使用它通常是愚蠢的...
它實在是太有爭議了,而且在文化上也太具體了。 “常識”是在這種特定文化中被認為是明智的做事方式的捷徑(在時間和空間上,這常常看起來對另一種文化而言都不是明智的),因此在定義中提及它會掩蓋關鍵問題。作為邏輯定義的一部分,這尤其無濟於事(因此,我認為這是在特定上下文中的“理性人”的概念-尤其是因為我猜您對“理性人”的定義將是一個邏輯人)有常識的人!)
我不明白為什麼使用常識是不好的。用您對它的定義,為什麼我們不想做當時明智的事情?被躲避的“關鍵問題”是什麼?您說常識沒有明確的含義,然後去提供一個!
他不能提供一個,他的論據是“沒有普遍的定義”,只有文化特定的定義。來自不同文化背景的兩個人(包括不同的統計教育方式)很可能會對在特定情況下明智的做法有兩種不同的理解。
這個答案具有善意(對於簡單的英語來說是什麼?),但是我不相信(對於貝葉斯來說是什麼!)以下說法是正確的:“因為如果您接受邏輯……您還必須接受貝葉斯推理”。例如,如果您認為不是將數學的抽象理論轉化為現實世界,您會發現公理方法可以與頻率論和貝葉斯論證一致!可以說,第一種情況是Kolmogorov,第二種情況是Jeffreys。本質上,邏輯是概率論。不是它的解釋。
我喜歡最後3段,尤其是最後一段。這也是我最終使自己確信概率是一種主觀信念的方式,即不同的人對事件有不同的信息集,因此,他們對事件發生的可能性可能有不同的信念。我使用了相同的示例,兩個人從中抽出球
這個答案暗示Kolmogorov概率一定是貝葉斯概率,但不一定。
Aaron McDaid
2012-06-26 23:36:44 UTC
view on stackexchange narkive permalink

In reality, I think much of the philosophy surrounding the issue is just grandstanding. That's not to dismiss the debate, but it is a word of caution. Sometimes, practical matters take priority - I'll give an example below.

Also, you could just as easily argue that there are more than two approaches:

  • Neyman-Pearson ('frequentist')
  • Likelihood-based approaches
  • Fully Bayesian

A senior colleague recently reminded me that "many people in common language talk about frequentist and Bayesian. I think a more valid distinction is likelihood-based and frequentist. Both maximum likelihood and Bayesian methods adhere to the likelihood principle whereas frequentist methods don't."

I'll start off with a very simple practical example:

We have a patient. The patient is either healthy(H) or sick(S). We will perform a test on the patient, and the result will either be Positive(+) or Negative(-). If the patient is sick, they will always get a Positive result. We'll call this the correct(C) result and say that$$ P(+ | S ) = 1 $$or$$ P(Correct | S) = 1 $$If the patient is healthy, the test will be negative 95% of the time, but there will be some false positives.$$ P(- | H) = 0.95 $$$$ P(+ | H) = 0.05 $$In other works, the probability of the test being Correct, for Healthy people, is 95%.

So, the test is either 100% accurate or 95% accurate, depending on whether the patient is healthy or sick. Taken together, this means the test is at least 95% accurate.

So far so good. Those are the statements that would be make by a frequentist. Those statements are quite simple to understand and are true. There's no need to waffle about a 'frequentist interpretation'.

But, things get interesting when you try to turn things around. Given the test result, what can you learn about the health of the patient? Given a negative test result, the patient is obviously healthy, as there are no false negatives.

But we must also consider the case where the test is positive. Was the test positive because the patient was actually sick, or was it a false positive? This is where the frequentist and Bayesian diverge. Everybody will agree that this cannot be answered at the moment. The frequentist will refuse to answer. The Bayesian will be prepared to give you an answer, but you'll have to give the Bayesian a prior first - i.e. tell it what proportion of the patients are sick.

To recap, the following statements are true:

  • For healthy patients, the test is very accurate.
  • For sick patients, the test is very accurate.

If you are satisfied with statements such as that, then you are using frequentist interpretations. This might change from project to project, depending on what sort of problems you're looking at.

But you might want to make different statements and answer the following question:

  • For those patients that got a positive test result, how accurate is the test?

This requires a prior and a Bayesian approach. Note also that this is the only question of interest to the doctor. The doctor will say "I know that the patients will either get a positive result or a negative result. I also now that the negative result means the patient is healthy and can be send home. The only patients that interest me now are those that got a positive result -- are they sick?."

To summarize: In examples such as this, the Bayesian will agree with everything said by the frequentist. But the Bayesian will argue that the frequentist's statements, while true, are not very useful; and will argue that the useful questions can only be answered with a prior.

A frequentist will consider each possible value of the parameter (H or S) in turn and ask "if the parameter is equal to this value, what is the probability of my test being correct?"

A Bayesian will instead consider each possible observed value (+ or -) in turn and ask "If I imagine I have just observed that value, what does that tell me about the conditional probability of H-versus-S?"

您的意思是“對於生病的患者,測試不是很準確。”您忘記了NOT嗎?
在兩種情況下都非常準確,所以不,我沒有忘記一個詞。對於健康的人,結果將在95%的時間內是正確的(即“陰性”)。對於病人來說,結果在95%的時間內是正確的(即“正面”)。
我認為最大程度的“弱點”是假設數據具有一致的先驗,而“全貝葉斯”則可以更靈活地選擇先驗。
為了完成該示例,假設我們正在測試的人口中有0.1%患有D病:這不是我們的先前經歷。更有可能的是,大約30%的就診醫生且症狀與D相匹配的患者實際上患有D(根據不同的信息,例如不同疾病多久出現相同症狀,這可能或多或少)。因此,接受測試的人中有70%是健康的,有66.5%的人結果為陰性,有30%/ 33.5%的人患病。因此,如果給出陽性結果,則我們患者患病的後發概率為89.6%。下一個難題:我們如何知道70%的應試者有D?
user36160
2013-12-14 00:37:46 UTC
view on stackexchange narkive permalink

貝葉斯統計和慣常主義統計是兼容的,因為可以將它們理解為基於過去事件和假定模型評估未來事件概率的兩個極限情況,如果一個人承認在非常多的觀察結果的範圍內,沒有關於系統的不確定性,從這個意義上講,非常多的觀察結果等於知道模型的參數。

假設我們已經進行了一些觀察,例如,擲硬幣10次的結果。在貝葉斯統計中,您從觀察到的內容開始,然後評估未來觀察到的可能性或模型參數。在常客統計中,您通過假設已經進行了大量觀察的情況(例如硬幣無偏見並且如果多次拋硬幣給出50%的抬頭)的假設,從真實的想法(假設)開始。基於大量觀察結果(即假設)的這些情況,您可以像進行觀察一樣評估觀察的頻率,即10次擲硬幣的不同結果的頻率。只有到那時,您才能獲取實際結果,將其與可能結果的發生頻率進行比較,並確定結果是否屬於預期會頻繁發生的結果。如果是這種情況,您可以得出結論,所做的觀察與您的情況並不矛盾(=假設)。否則,您得出結論認為所觀察到的結果與您的情況不符,並且您拒絕了該假設。頻繁統計數據始於對假設某事物會觀察到的東西進行抽象實驗的結果,然後才將抽象實驗的結果與實際觀察到的結果進行比較。否則,這兩種方法是兼容的。他們都根據所做的或假設的觀察評估未來觀察的可能性。

我開始以一種更正式的方式來寫這篇文章:

將貝葉斯推理定位為常識性推理的一種特殊應用,反之亦然。

http://dx.doi.org/10.6084/m9.figshare.867707

手稿是新的。如果您碰巧看了它並發表評論,請告訴我。

Michael R. Chernick
2012-05-05 03:03:19 UTC
view on stackexchange narkive permalink

我要說的是,他們以不同的方式看待概率。貝葉斯是主觀的,並使用先驗信念來定義未知參數可能值的先驗概率分佈。因此,他依賴於deFinetti的概率論。該常客將概率視為與觀察到的比例相關的極限頻率的一部分。這符合Kolmogorov和von Mises提出的概率論。
常客只使用似然函數進行參數推斷。貝葉斯將其乘以並乘以一個先驗並對其進行歸一化,以獲得他用於推斷的後驗分佈。

+1很好的答案,但是應該強調的是,貝葉斯方法和頻率方法在對概率的解釋方面有所不同。另一方面,柯爾莫哥洛夫為概率論提供了一個“公理基礎”,它不需要像貝葉斯或慣常論者所採用的那樣的解釋(!)。從某種意義上說,公理系統有自己的生命!僅憑科爾莫哥羅夫的六個公理,我認為就不可能說他的公理系統是貝葉斯系統或貝葉斯系統,而且實際上可能與兩者都一致。
Demetrios Papakostas
2018-04-07 19:03:53 UTC
view on stackexchange narkive permalink

我回答這個問題的方式是frequentists將他們看到的數據與期望的數據進行比較。也就是說,他們有一個心智模型來確定某件事應如何發生,然後查看數據及其發生的頻率。也就是說,根據他們選擇的模型,他們看到數據的可能性有多大。

另一方面,

Bayesian組合他們的心理模型。也就是說,他們基於以前的經驗建立了一個模型,該模型告訴他們他們認為數據應該是什麼樣子,然後將其與觀察到的數據結合起來以建立某些 span>後驗”的信念。也就是說,他們發現了他們觀察到的數據後,他們尋求選擇的模型有效的可能性。

因此,換句話說,常客看$ P(data | model)$,而貝葉斯看$ P(model | data)$ ...?
有點。貝葉斯本質上是做一個P(模型|數據)$ \ prop $ P(數據|模型)P(模型),其中P(模型)是先驗的。我越了解,答案就越不充分。例如,常客統計數據的一個特徵是最大似然估計器,它最大程度地給出了所看到的數據ive,這些模型參數使我看到的可能性最大。貝葉斯主義者也希望這樣做,但是他們通過基於參數的某些先驗分佈對參數的所有值進行積分來計算模型。經常選擇的模型參數使他們看到的最有可能。
Emil M Friedman
2017-01-25 02:51:47 UTC
view on stackexchange narkive permalink

常客:自然的真實狀態是。如果我習慣性地進行這樣的分析,則95%的答案都是正確的。

貝葉斯:正確答案有95%的可能性。...我基於您提供給我的數據以及我們之前對真相的猜測。

ccrider
2015-09-20 17:28:46 UTC
view on stackexchange narkive permalink

常客:賭骰子。只有骰子的值會決定結果:您贏了賭注,還是沒有贏。僅取決於機會。

貝葉斯:玩德州撲克。您是唯一看到您兩張卡片的人。您對桌上的其他玩家有一些了解。您必須調整您在翻牌圈,轉牌圈和河牌上獲勝的可能性,並可能根據剩下的玩家來調整。他們經常虛張聲勢嗎?他們是好鬥的還是消極的玩家?所有這些將決定您的工作。不僅取決於您獲得前兩張牌的概率,還可以決定您是否獲勝。

玩常客撲克意味著每個玩家都將在開始時出示手牌,然後下注或翻牌前棄牌,顯示轉牌和河牌。現在,是否贏還是再次取決於機會。

Yang Fu
2016-03-13 16:04:32 UTC
view on stackexchange narkive permalink

說,如果您頭疼並去看醫生。假設,在醫生的決策集中,頭痛有兩種原因,一種是腦瘤(根本原因導致99%的時間頭痛),第二種是感冒(這種病在極少數患者中可能引起頭痛) 。

然後,基於頻頻方法的醫生決定將導致您的腦瘤。

基於貝葉斯方法的醫生將告訴您,您得了感冒(即使只有1%的感冒會引起頭痛)

(-1)尚不清楚“ Frequentist doc”和“ Bayesian doc”之間有什麼區別。我看不出有什麼原因使Frequentist文檔會*忽略*有關感冒引起頭痛的數據。貝葉斯文檔似乎並沒有使用貝葉斯定理或先驗,所以我看不出他的貝葉斯如何?
太不可思議了,無法成為一個有用的甚至有趣的類比。
A Lion
2010-07-21 00:54:13 UTC
view on stackexchange narkive permalink

將一隻公貓和一隻母貓在一個鋼製的房間裡梳了一下,連同足夠的食物和水一起待了70天。

一位常客說貓科動物的平均妊娠期為66天,雌貓在將貓咪圍起來時處於高溫狀態,一旦處於高溫狀態,她將反復交配4次。到7天。由於可能會有很多繁殖行為,並且隨後會有足夠的妊娠時間,因此,當盒子在第70天打開時,很可能會有一窩新生小貓。

貝葉斯會說,我聽到了第1天,盒子裡出現了嚴重的Marvin Gaye,然後今天早上,我聽到盒子里傳出了許多類似小貓的聲音。因此,如果不了解貓的繁殖知識,很有可能在第70天打開包裝盒時,會有一窩新生的小貓。

我寫的方式,特別是貝葉斯人對貓的繁殖了解不多,一開始只有常客會賭那隻小貓。我的“非常粗糙的例子”的相關要點主要是,常客在開始時就根據數據做出了預測,然後在沒有合併新的補充數據的情況下坐下來,而貝葉斯的數據沒有很多,但是繼續合併可用的相關數據。
...為什麼非貝葉斯人也不會利用額外的數據呢?


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 2.0許可。
Loading...