由于 [數(shù)學(xué)趣題] 小球概率 ,發(fā)現(xiàn)好多人對(duì)條件概率仍不理解,容易出現(xiàn)誤解,因此在這里簡(jiǎn)單介紹一下條件概率。
一·什么是概率
這個(gè)問(wèn)題其實(shí)沒(méi)有看起來(lái)這么簡(jiǎn)單。一般來(lái)說(shuō),認(rèn)為概率是描述某個(gè)事件發(fā)生的可能性的屬性。如果一個(gè)實(shí)驗(yàn)可以無(wú)限重復(fù),我們?nèi)∧呈录l(fā)生的次數(shù)除以實(shí)驗(yàn)的總次數(shù)的值稱(chēng)為頻率,那么實(shí)驗(yàn)次數(shù)越多則頻率越接近概率(感興趣的可以了解一下大數(shù)定律)。但是這種求概率的前提是,概率是一個(gè)確定的值,實(shí)驗(yàn)是由概率決定結(jié)果,我們事先不知道概率大概是多少,然后根據(jù)實(shí)驗(yàn)不斷去用頻率收斂。但是如果實(shí)驗(yàn)次數(shù)不夠多,那么很有可能得到很離譜的結(jié)論。比如一個(gè)硬幣,我們連續(xù)扔五次都是正面朝上,那么頻率派就會(huì)認(rèn)為硬幣正面朝上的概率是1。
而貝葉斯派反過(guò)來(lái)認(rèn)為,實(shí)驗(yàn)的結(jié)果是確定的常量,而概率是一個(gè)隨機(jī)變量,概率表示事件的可信程度,是建立在對(duì)事件認(rèn)知的已有基礎(chǔ)上的。比如一個(gè)硬幣,貝葉斯派一開(kāi)始認(rèn)為硬幣正面朝上的概率是0.5(也可以是其他值),那么連續(xù)五次扔出正面朝上后,這個(gè)概率則可以用貝葉斯公式修正到一個(gè)0.5~1之間的數(shù)。
可以用烏鴉悖論來(lái)區(qū)分,考慮命題所有的烏鴉都是黑色的,那么它的逆否命題是所有不是黑色的東西都不是烏鴉,逆否命題顯然與原命題等價(jià)。如果我們看了成千上萬(wàn)個(gè)烏鴉,都是黑色的,根據(jù)頻率派的觀點(diǎn),原命題顯然是正確的。而貝葉斯派的先驗(yàn)概率也會(huì)再不斷地后驗(yàn)修正中得到一個(gè)較高的分布。那么如果我們看到了一個(gè)紅色的蘋(píng)果,是否可以認(rèn)為原命題的可信度上升。根據(jù)頻率派的觀點(diǎn),原命題正確的概率是一個(gè)定值,因此不會(huì)受到紅色蘋(píng)果的影響,而貝葉斯派的看法則會(huì)認(rèn)為原命題可信度上升,這個(gè)你可以在后面講到貝葉斯公式后嘗試看看。
二·條件概率
事件A和事件B各自有一個(gè)發(fā)生的概率,那么在事件A發(fā)生的條件下事件B發(fā)生的概率則稱(chēng)為條件概率,記為P(B|A)。
舉個(gè)例子,將一枚硬幣拋擲兩次,事件A為至少有一次正面朝上,事件B為兩次正面朝上,那么P(B|A)為多少。
我們先考慮扔兩次的樣本空間,正面朝上記為1,反面朝上記為0,則樣本空間為{11,10,01,00},這是一個(gè)古典概型(即等概率發(fā)生,很重要,很多錯(cuò)誤就是因?yàn)槊つ看_定古典概型),而A為{11,10,01},B為{11},那么P(B|A)可以確定為P(AB)/P(A)=1/3(其中AB是A,B同時(shí)發(fā)生的概率,這里即為11),這里容易有一個(gè)誤區(qū)把P(B|A)當(dāng)成P(B)/P(A)。
因此我們可以得到P(B|A)=P(AB)/P(A),P(AB)=P(B|A)P(A)
如果我們能得到樣本空間的一個(gè)劃分B1,B2,...,Bi,劃分即兩兩不重合且全部并集為整個(gè)樣本空間,如上面的{11,10,01,00},其中,11,10,01,00就是樣本空間的一個(gè)劃分。那么如果P(A)不容易求得,我們可以發(fā)現(xiàn)P(A)=P(AB1)+P(AB2)+...+P(ABi)=P(A|B1)P(B1)+...+P(A|Bi)P(Bi)
那么我們就可以得到一個(gè)求條件概率的公式,P(Bi|A)=P(ABi)/P(A)=P(A|Bi)P(Bi)/[P(A|B1)P(B1)+...+P(A|Bi)P(Bi)],這個(gè)公式我們稱(chēng)為貝葉斯公式。
回到我們一開(kāi)始的題目,一開(kāi)始有6個(gè)小球,隨機(jī)分配到三個(gè)盒子里,三個(gè)藍(lán)我記為0,三個(gè)紅我記為1。為防止搞錯(cuò),因此我這里用相對(duì)直觀的枚舉討論古典概型。實(shí)際上,我們只要考慮三個(gè)1三個(gè)0的全排列,然后把前兩個(gè)記為第一個(gè)盒子,中間兩個(gè)記為第二個(gè)盒子,最后兩個(gè)記為第三個(gè)盒子,然后隨機(jī)取一個(gè)盒子直接選第一個(gè)盒子(三個(gè)盒子等價(jià)),那么即可得到紅紅、紅藍(lán)、藍(lán)藍(lán)的概率比。
000111,001011,010011,100011,001101,010101,100101,001110,010110,100110,011001,101001,011010,101010,011100,101100,110001,110010,110100,111000
其中兩藍(lán)我用藍(lán)色標(biāo)出,兩紅我用紅色標(biāo)出,顯然藍(lán)藍(lán):藍(lán)紅:紅紅是4:12:4=1:3:1
如果換個(gè)角度考慮,第一個(gè)是藍(lán)的概率是1/2,那么第二個(gè)是2/5,藍(lán)藍(lán)就是1/5,紅紅也是1/5,因此即為1:3:1
這里我在原貼由于第二個(gè)忘記去掉一個(gè)球?qū)е碌玫搅隋e(cuò)誤的1:2:1的結(jié)論。
然后簡(jiǎn)單貝葉斯,A取為隨機(jī)拿出一個(gè)球?yàn)榧t球,Bi定為兩個(gè)球都是紅球,那么P(Bi|A)=P(A|Bi)P(Bi)/[P(A|B1)P(B1)+...+P(A|Bi)P(Bi)]=(1*1/5)/(1*1/5+1/2*3/5)=2/5
因此答案為2/5
練習(xí)題
假設(shè)生男孩和生女孩的概率都是50%,一個(gè)家庭有兩個(gè)孩子,已知其中有一個(gè)女兒,那么另一個(gè)是男孩的概率是多少。 |