您將如何用簡單的英語描述將貝葉斯與常識推理區分開的特徵?
您將如何用簡單的英語描述將貝葉斯與常識推理區分開的特徵?
這是我向奶奶解釋的基本區別:
我將手機放到家裡的某個地方了。我可以使用儀器基座上的電話定位器來定位電話,當我按下電話定位器時,電話會開始發出嗶嗶聲。
問題:應該在我家的哪個區域搜索?
我能聽到電話的嗶嗶聲。我還有一個心理模型,可以幫助我識別聲音的發出區域。因此,在聽到嗶嗶聲後,我推斷出我必須搜索的位置才能找到手機。
我可以聽到手機嗶嗶聲。現在,除了可以幫助我識別聲音來源區域的思維模型之外,我還知道過去錯放手機的位置。因此,我會結合使用嗶嗶聲和以前關於我以前放錯位置手機的位置的先前信息,來推斷出我必須搜索以定位手機的區域。
舌頭緊緊貼在臉上:
貝葉斯定義“概率”的方式與大多數非統計學家完全相同,即表示命題或情況的合理性。如果您問他一個問題,他會給您直接答案,並分配概率來描述特定情況下可能的結果的可行性(並陳述其先前的假設)。
常客是相信概率代表的人事件發生的長期頻率;如果需要,他將發明一個虛擬的種群,從中可以將您的特定情況視為隨機樣本,以便他可以有意義地談論長期運行的頻率。如果您問他關於特定情況的問題,他將不會直接給出答案,而是要對這一(可能是虛構的)人口做出說明。許多非經常性統計學家會很容易將答案弄糊塗,並將其解釋為關於特定情況的貝葉斯概率。得出基本上相同的結果,差異主要是哲學問題,實際上是“課程的馬”問題。
您可能已經猜到了,我是貝葉斯專家和工程師。 ; o)
非常粗略地說,我會這樣說:
頻密主義者:抽樣是無限的,決策規則可以很敏銳。數據是可重複的隨機樣本-有頻率。基本參數是固定的,即在此可重複的採樣過程中它們保持不變。
貝葉斯:概率未知的數量被處理,世界狀況可以隨時更新。從實現的樣品中觀察數據。參數是未知的,並以概率方式描述。數據是固定的。
有一個精采的博客文章,其中提供了貝葉斯和頻繁主義者如何解決相同問題的深入示例。為什麼不親自回答問題然後再檢查呢?
問題(摘自Panos Ipeirotis的博客):
您有一枚硬幣,翻轉時最終會冒出概率 $ p $ span>並以概率 $ 1-p $ span>結束。 ( $ p $ span>的值是未知的。)
嘗試估算 $ p $ span>,您將硬幣翻轉100次。它結束了71次。
然後您必須決定以下事件:“在接下來的兩次拋擲中,我們將連續獲得兩個頭。”
您敢打賭該事件會發生還是不會發生?
讓我們說一個人擲出一個六邊形的骰子,其結果為1、2、3、4、5或6。此外,他說,如果它落在3上,他會給你一個免費的文本
然後非正式地:
Frequentist 會說每個結局具有六分之一的發生機會。她認為概率是從長期頻率分佈中得出的。
貝葉斯 ,但是要說一秒鐘,我知道那個人,他是大衛布萊恩,著名的騙子!我有一種感覺,他在做些什麼。我要說的是,它只有3%的機會落在3個 BUT 上,我將重新評估該信念,並在他擲骰子越多時對其進行更改。如果我看到其他數字同樣頻繁地出現,那麼我將迭代地將機會從1%增加到稍微更高的機會,否則我將進一步減少它。她將概率視為對命題的信任程度。
只是有點樂趣...
從此站點:
http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html
同一站點,一篇不錯的文章……
“貝葉斯定理的直觀解釋”
要求貝葉斯人下注,其中可能包括蒼蠅能更快爬上牆,藥物將挽救大多數生命,或哪些囚犯應入獄的任何東西。他有一個帶提手的大箱子。他知道,如果將他所知道的一切都放進盒子裡,包括他的個人見解,然後轉動手柄,它將為他做出最好的決定。
請常客寫報告。他有一本大黑規。如果他的規則手冊涵蓋了要求他進行報告的情況,則他可以遵循規則並撰寫措辭謹慎的報告,以至於錯了,最糟糕的是,每100次(或20次,或者一次)
常客知道(因為他已經寫了報告),貝葉斯有時會押注,在最壞的情況下,當他的個人觀點是錯誤的時,可能結果很糟糕。該常客也知道(出於同樣的原因),如果每次與貝葉斯不同時都對貝葉斯賭,那麼從長遠來看,他會輸。
用簡單的英語來說,貝葉斯推理和慣常論的區別在於回答問題的兩種不同方式:
什麼是概率?
概率就是邏輯
我的“非普通英語”的原因是,如果我們用$ 1 $表示真值,用$ 0 $表示虛假,則命題演算是概率演算的特例。另外,概率的演算可以從命題的演算中得出。這與“貝葉斯”推理最緊密地相符-儘管它還通過提供分配概率的原理以及操縱它們的原理來擴展應用程序中的貝葉斯推理。當然,這導致了後續問題“什麼是邏輯?”對我而言,作為這個問題的答案,我能給出的最接近的答案是:“邏輯是具有給定假設的理性人的常識性判斷”(什麼是理性人?等)。邏輯具有貝葉斯推理具有的所有相同功能。例如,邏輯不會告訴您要假設什麼或“絕對正確”。它僅告訴您一個命題的真相如何與另一個命題的真相相關。您必須始終為邏輯系統提供“軸”,才能開始得出結論。它們也具有相同的局限性,因為您可以從矛盾的公理中獲得任意結果。但是“軸心”只不過是先驗概率,已設置為$ 1 $。對我來說,拒絕貝葉斯推理就是拒絕邏輯。因為如果您接受邏輯,那麼因為貝葉斯推理“從邏輯上邏輯地流動”(對於普通英語:P來說是什麼),您還必須接受貝葉斯推理。
概率是頻率
儘管我不確定“頻率”在這裡使用的方式是否是簡單的英語術語-也許是“比例”是一個更好的詞。我想在常問問題答案中添加一個事件的概率被認為是真實的,可測量的(可觀察的?)數量,該數量獨立於計算該事件的人/對象而存在。但是我不能用“普通英語”的方式來做到這一點。
所以也許是“普通英語”版本的不同之處在於,常客性推理是嘗試從“絕對”概率進行推理,而貝葉斯推理是嘗試從“相對”概率進行推理。
另一個不同之處是,在將現實世界中的問題轉化為理論的抽像數學時,常識性基礎更加模糊。一個很好的例子是在理論中使用“隨機變量”-它們在數學的抽象世界中有一個精確的定義,但是沒有明確的程序可以用來確定某個觀測量是否為“隨機”。
貝葉斯推理方式,“隨機變量”的概念不是必需的。概率分佈被分配給一個量,因為它是未知的-這意味著它不能從我們所擁有的信息中進行邏輯推斷。這立刻提供了可觀測量與理論之間的簡單聯繫-因為“未知”是明確的。
您還可以在上面的示例中看到這兩種思維方式的進一步差異-“隨機”與“未知”。 “隨機性”的措辭使“隨機性”看起來像是實際數量的屬性。相反,“未知”取決於您要詢問哪個人該數量-因此,這是統計人員進行分析的屬性。這就產生了經常附加在每種理論上的“客觀”形容詞和“主觀性”形容詞。可以很容易地表明,“隨機性”不能成為某些標準示例的屬性,只需簡單地讓兩個經常進餐的人獲得相同數量的不同信息,以決定其“隨機性”。一種是通常的Bernoulli缸:常客1在繪畫時被蒙住眼睛,而常客2站在the上,看著常客1從中抽出球。如果“隨機性”的聲明是骨灰盒中球的屬性,則它不能依賴於常客1和2的不同知識-因此,兩個常客應該給出相同的“隨機”或“非隨機”聲明
In reality, I think much of the philosophy surrounding the issue is just grandstanding. That's not to dismiss the debate, but it is a word of caution. Sometimes, practical matters take priority - I'll give an example below.
Also, you could just as easily argue that there are more than two approaches:
A senior colleague recently reminded me that "many people in common language talk about frequentist and Bayesian. I think a more valid distinction is likelihood-based and frequentist. Both maximum likelihood and Bayesian methods adhere to the likelihood principle whereas frequentist methods don't."
I'll start off with a very simple practical example:
We have a patient. The patient is either healthy(H) or sick(S). We will perform a test on the patient, and the result will either be Positive(+) or Negative(-). If the patient is sick, they will always get a Positive result. We'll call this the correct(C) result and say that$$ P(+ | S ) = 1 $$or$$ P(Correct | S) = 1 $$If the patient is healthy, the test will be negative 95% of the time, but there will be some false positives.$$ P(- | H) = 0.95 $$$$ P(+ | H) = 0.05 $$In other works, the probability of the test being Correct, for Healthy people, is 95%.
So, the test is either 100% accurate or 95% accurate, depending on whether the patient is healthy or sick. Taken together, this means the test is at least 95% accurate.
So far so good. Those are the statements that would be make by a frequentist. Those statements are quite simple to understand and are true. There's no need to waffle about a 'frequentist interpretation'.
But, things get interesting when you try to turn things around. Given the test result, what can you learn about the health of the patient? Given a negative test result, the patient is obviously healthy, as there are no false negatives.
But we must also consider the case where the test is positive. Was the test positive because the patient was actually sick, or was it a false positive? This is where the frequentist and Bayesian diverge. Everybody will agree that this cannot be answered at the moment. The frequentist will refuse to answer. The Bayesian will be prepared to give you an answer, but you'll have to give the Bayesian a prior first - i.e. tell it what proportion of the patients are sick.
To recap, the following statements are true:
If you are satisfied with statements such as that, then you are using frequentist interpretations. This might change from project to project, depending on what sort of problems you're looking at.
But you might want to make different statements and answer the following question:
This requires a prior and a Bayesian approach. Note also that this is the only question of interest to the doctor. The doctor will say "I know that the patients will either get a positive result or a negative result. I also now that the negative result means the patient is healthy and can be send home. The only patients that interest me now are those that got a positive result -- are they sick?."
To summarize: In examples such as this, the Bayesian will agree with everything said by the frequentist. But the Bayesian will argue that the frequentist's statements, while true, are not very useful; and will argue that the useful questions can only be answered with a prior.
A frequentist will consider each possible value of the parameter (H or S) in turn and ask "if the parameter is equal to this value, what is the probability of my test being correct?"
A Bayesian will instead consider each possible observed value (+ or -) in turn and ask "If I imagine I have just observed that value, what does that tell me about the conditional probability of H-versus-S?"
貝葉斯統計和慣常主義統計是兼容的,因為可以將它們理解為基於過去事件和假定模型評估未來事件概率的兩個極限情況,如果一個人承認在非常多的觀察結果的範圍內,沒有關於系統的不確定性,從這個意義上講,非常多的觀察結果等於知道模型的參數。
假設我們已經進行了一些觀察,例如,擲硬幣10次的結果。在貝葉斯統計中,您從觀察到的內容開始,然後評估未來觀察到的可能性或模型參數。在常客統計中,您通過假設已經進行了大量觀察的情況(例如硬幣無偏見並且如果多次拋硬幣給出50%的抬頭)的假設,從真實的想法(假設)開始。基於大量觀察結果(即假設)的這些情況,您可以像進行觀察一樣評估觀察的頻率,即10次擲硬幣的不同結果的頻率。只有到那時,您才能獲取實際結果,將其與可能結果的發生頻率進行比較,並確定結果是否屬於預期會頻繁發生的結果。如果是這種情況,您可以得出結論,所做的觀察與您的情況並不矛盾(=假設)。否則,您得出結論認為所觀察到的結果與您的情況不符,並且您拒絕了該假設。頻繁統計數據始於對假設某事物會觀察到的東西進行抽象實驗的結果,然後才將抽象實驗的結果與實際觀察到的結果進行比較。否則,這兩種方法是兼容的。他們都根據所做的或假設的觀察評估未來觀察的可能性。
我開始以一種更正式的方式來寫這篇文章:
將貝葉斯推理定位為常識性推理的一種特殊應用,反之亦然。
http://dx.doi.org/10.6084/m9.figshare.867707
手稿是新的。如果您碰巧看了它並發表評論,請告訴我。
我要說的是,他們以不同的方式看待概率。貝葉斯是主觀的,並使用先驗信念來定義未知參數可能值的先驗概率分佈。因此,他依賴於deFinetti的概率論。該常客將概率視為與觀察到的比例相關的極限頻率的一部分。這符合Kolmogorov和von Mises提出的概率論。
常客只使用似然函數進行參數推斷。貝葉斯將其乘以並乘以一個先驗並對其進行歸一化,以獲得他用於推斷的後驗分佈。
我回答這個問題的方式是frequentists將他們看到的數據與期望的數據進行比較。也就是說,他們有一個心智模型來確定某件事應如何發生,然後查看數據及其發生的頻率。也就是說,根據他們選擇的模型,他們看到數據的可能性有多大。
另一方面,Bayesian人組合他們的心理模型。也就是說,他們基於以前的經驗建立了一個模型,該模型告訴他們他們認為數據應該是什麼樣子,然後將其與觀察到的數據結合起來以建立某些 span>後驗”的信念。也就是說,他們發現了他們觀察到的數據後,他們尋求選擇的模型有效的可能性。
常客:自然的真實狀態是。如果我習慣性地進行這樣的分析,則95%的答案都是正確的。
貝葉斯:正確答案有95%的可能性。...我基於您提供給我的數據以及我們之前對真相的猜測。
常客:賭骰子。只有骰子的值會決定結果:您贏了賭注,還是沒有贏。僅取決於機會。
貝葉斯:玩德州撲克。您是唯一看到您兩張卡片的人。您對桌上的其他玩家有一些了解。您必須調整您在翻牌圈,轉牌圈和河牌上獲勝的可能性,並可能根據剩下的玩家來調整。他們經常虛張聲勢嗎?他們是好鬥的還是消極的玩家?所有這些將決定您的工作。不僅取決於您獲得前兩張牌的概率,還可以決定您是否獲勝。
玩常客撲克意味著每個玩家都將在開始時出示手牌,然後下注或翻牌前棄牌,顯示轉牌和河牌。現在,是否贏還是再次取決於機會。
說,如果您頭疼並去看醫生。假設,在醫生的決策集中,頭痛有兩種原因,一種是腦瘤(根本原因導致99%的時間頭痛),第二種是感冒(這種病在極少數患者中可能引起頭痛) 。
然後,基於頻頻方法的醫生決定將導致您的腦瘤。
基於貝葉斯方法的醫生將告訴您,您得了感冒(即使只有1%的感冒會引起頭痛)
將一隻公貓和一隻母貓在一個鋼製的房間裡梳了一下,連同足夠的食物和水一起待了70天。
一位常客說貓科動物的平均妊娠期為66天,雌貓在將貓咪圍起來時處於高溫狀態,一旦處於高溫狀態,她將反復交配4次。到7天。由於可能會有很多繁殖行為,並且隨後會有足夠的妊娠時間,因此,當盒子在第70天打開時,很可能會有一窩新生小貓。
貝葉斯會說,我聽到了第1天,盒子裡出現了嚴重的Marvin Gaye,然後今天早上,我聽到盒子里傳出了許多類似小貓的聲音。因此,如果不了解貓的繁殖知識,很有可能在第70天打開包裝盒時,會有一窩新生的小貓。