<noscript id="lol87"></noscript>
  • <form id="lol87"><td id="lol87"></td></form>
    <optgroup id="lol87"><tt id="lol87"><pre id="lol87"></pre></tt></optgroup>
    <optgroup id="lol87"><th id="lol87"><span id="lol87"></span></th></optgroup>
    1. 
      
      • <rt id="lol87"></rt>
        <span id="lol87"><del id="lol87"></del></span>
        回復(fù)

        囚徒困境

        樓主: 32161 | 查看: 3536 | 回復(fù): 8

        發(fā)表于 2013-12-10 21:21:17
        本帖最后由 キャンディ 于 2013-12-10 21:25 編輯

        囚徒困境(prisoner's dilemma ):兩個(gè)被捕的囚徒之間的一種特殊博弈,說明為什么甚至在合作對(duì)雙方都有利時(shí),保持合作也是困難的。
        囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個(gè)人最佳選擇并非團(tuán)體最佳選擇。雖然困境本身只屬模型性質(zhì),但現(xiàn)實(shí)中的價(jià)格競(jìng)爭(zhēng)、環(huán)境保護(hù)等方面,也會(huì)頻繁出現(xiàn)類似情況。

        來源
        囚徒困境的故事講的是,兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個(gè)人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個(gè)坦白而另一個(gè)抵賴,坦白的放出去,抵賴的判十年。于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴、自己坦白的話放出去,不坦白的話判一年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,不坦白的話判十年,坦白還是比不坦白好。結(jié)果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判一年,顯然這個(gè)結(jié)果好。但這個(gè)帕累托改進(jìn)辦不到,因?yàn)樗荒軡M足人類的理性要求。囚徒困境所反映出的深刻問題是,人類的個(gè)人理性有時(shí)能導(dǎo)致集體的非理性——聰明的人類會(huì)因自己的聰明而作繭自縛。




        簡(jiǎn)介

        單次多重

        單次發(fā)生的囚徒困境,和多次重復(fù)的囚徒困境結(jié)果不會(huì)一樣。
        在重復(fù)的囚徒困境中,博弈被反復(fù)地進(jìn)行。因而每個(gè)參與者都有機(jī)會(huì)去“懲罰”另一個(gè)參與者前一回合的不合作行為。這時(shí),合作可能會(huì)作為均衡的結(jié)果出現(xiàn)。欺騙的動(dòng)機(jī)這時(shí)可能被受到懲罰的威脅所克服,從而可能導(dǎo)向一個(gè)較好的、合作的結(jié)果。作為反復(fù)接近無限的數(shù)量,納什均衡趨向于帕累托最優(yōu)。


        主旨

        囚徒們雖然彼此合作,堅(jiān)不吐實(shí),可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因?yàn)槌鲑u同伙可為自己帶來利益(縮短刑期),也因?yàn)橥锇炎约赫谐鰜砜蔀樗麕砝?,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實(shí)際上,執(zhí)法機(jī)構(gòu)不可能設(shè)立如此情境來誘使所有囚徒招供,因?yàn)榍敉絺儽仨毧紤]刑期以外之因素(出賣同伙會(huì)受到報(bào)復(fù)等),而無法完全以執(zhí)法者所設(shè)立之利益(刑期)作考量。







        類別

        固定困境

        試想像囚徒困境的情況進(jìn)行十次或以下。
        我們可以合理地設(shè)想,如果囚徒第一次被對(duì)方指控,第二次這個(gè)囚徒也會(huì)指控對(duì)方。相反,如果第一次


        相關(guān)書籍
        別人保持沉默,建立了互信的關(guān)系,你也會(huì)保持沉默,導(dǎo)致帕累托最優(yōu)。
        當(dāng)然,兩個(gè)囚徒都會(huì)有相似的想法,在第一局保持沉默,以期望建立互信關(guān)系,所以雙方都會(huì)保持沉默。第二局時(shí),雙方亦應(yīng)有相似的想法,繼續(xù)保持沉默,以期繼續(xù)在互信的情況下進(jìn)行第三局,以致余下的八局。
        這種想法合理嗎?
        在第十局時(shí),互信的關(guān)系明顯是沒有意義的,因?yàn)槭忠呀?jīng)完結(jié),囚徒?jīng)]有必要為維持互信的關(guān)系而沉默(沒有第十一局),所以第十局囚徒一定會(huì)背叛對(duì)方的,理由和只有一局囚徒困境一樣。
        問題是,既然大家都知道在第十局,無論如何對(duì)方都會(huì)背叛自己的,你在第九局保持沉默也是沒有意思的,要知道,保持沉默(友好關(guān)系)的原因是為了希望下一局別人保持沉默。所以第九局雙方都一定會(huì)背叛對(duì)方的。
        下一個(gè)問題是,雙方都有相同的想法,明知第九局對(duì)方會(huì)背叛自己,所以第八局保持沉默也是沒有意思的,第七局亦然,如此類推,納什均衡是十局都會(huì)互相背叛,建立互信關(guān)系是沒有可能的。
        只有在囚徒困境的局?jǐn)?shù)大家都不肯定的情況下,上述的推論才不會(huì)發(fā)生,才會(huì)出現(xiàn)互相保持沉默的現(xiàn)象。
        經(jīng)典困境



        例子
        1950年,由就職于蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關(guān)困境的理論,后來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,并命名為“囚徒困境”。經(jīng)典的囚徒困境如下:
        警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:
        若一人認(rèn)罪并作證檢控對(duì)方(相關(guān)術(shù)語稱“背叛”對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年。
        若二人都保持沉默(相關(guān)術(shù)語稱互相“合作”),則二人同樣判監(jiān)1年。

        若二人都互相檢舉(相關(guān)術(shù)語稱互相“背叛”),則二人同樣判監(jiān)8年。
        用表格概述如下:

        甲沉默
        甲背叛
        乙沉默
        二人同服刑1年
        乙服刑10年,甲即時(shí)獲釋
        乙背叛
        甲服刑10年,乙即時(shí)獲釋
        二人同服刑8年


        解說
        如同博弈論的其他例證,囚徒困境假定每個(gè)參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關(guān)心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為“嚴(yán)格劣勢(shì)”,理性的參與者絕不會(huì)選擇。另外,沒有任何其他力量干預(yù)個(gè)人決策,參與者可完全按照自己意愿選擇策略。
        囚徒到底應(yīng)該選擇哪一項(xiàng)策略,才能將自己個(gè)人的刑期縮至最短??jī)擅敉接捎诟艚^監(jiān)禁,并不知道對(duì)方選擇;而即使他們能交談,還是未必能夠盡信對(duì)方不會(huì)反口。就個(gè)人的理性選擇而言,檢舉背叛對(duì)方所得刑期,總比沉默要來得低。試設(shè)想困境中兩名理性囚徒會(huì)如何作出選擇:
        若對(duì)方沉默時(shí),背叛會(huì)讓我獲釋,所以會(huì)選擇背叛。
        若對(duì)方背叛指控我,我也要指控對(duì)方才能得到較低的刑期,所以也是會(huì)選擇背叛。
        二人面對(duì)的情況一樣,所以二人的理性思考都會(huì)得出相同的結(jié)論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場(chǎng)博弈中唯一可能達(dá)到的納什均衡,就是雙方參與者都背叛對(duì)方,結(jié)果二人同樣服刑8年。
        這場(chǎng)博弈的納什均衡,顯然不是顧及團(tuán)體利益的帕累托最優(yōu)解決方案。以全體利益而言,如果兩個(gè)參與者都合作保持沉默,兩人都只會(huì)被判刑1年,總體利益更高,結(jié)果也比兩人背叛對(duì)方、判刑8年的情況較佳。但根據(jù)以上假設(shè),二人均為理性的個(gè)人,且只追求自己個(gè)人利益。均衡狀況會(huì)是兩個(gè)囚徒都選擇背叛,結(jié)果二人判決均比合作為高,總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了:非零和博弈中,帕累托最優(yōu)和納什均衡是相沖突的。


        余下
        http://baike.baidu.com/link?url=93wlC76I1Imdzohn8BqQtA5gpWAttGUkso7iagMfOHp_t0u64YXSUVkgr6f6EIDJ

        0

        6

        分享

        | 發(fā)表于 2013-12-11 15:43:24
        本帖最后由 無遙之遠(yuǎn) 于 2013-12-11 15:44 編輯

        沒聽過,挺新鮮的

        小際,我說過,吃我的早晚要還回來的!
        | 發(fā)表于 2013-12-11 20:21:06
        此乃博弈論基礎(chǔ),經(jīng)濟(jì)學(xué)必學(xué)
        | 樓主| 發(fā)表于 2013-12-11 20:49:24
        在小說繪里聽過就查了一下
        | 發(fā)表于 2013-12-15 09:59:02
        這個(gè)在每天學(xué)點(diǎn)博弈學(xué)里面看到過
        | 發(fā)表于 2013-12-15 17:54:35
        這個(gè)我以前曾看到過。
        | 發(fā)表于 2014-7-25 12:06:06
        看來歹徒也要有好兄弟才行……
        | 發(fā)表于 2014-8-30 15:59:57
        類似的還看到過很多,比如抓綠豆,分財(cái)產(chǎn)等等
        好像是一本講邏輯推理的書上面的
        尚未登錄
        您需要登錄后才可以回帖 登錄 | 加入學(xué)院

        <noscript id="lol87"></noscript>
      • <form id="lol87"><td id="lol87"></td></form>
        <optgroup id="lol87"><tt id="lol87"><pre id="lol87"></pre></tt></optgroup>
        <optgroup id="lol87"><th id="lol87"><span id="lol87"></span></th></optgroup>
        1. 
          
          • <rt id="lol87"></rt>
            <span id="lol87"><del id="lol87"></del></span>
            日逼视频网站 | 老师我想要(h)小说 | 日本大乳护士挤奶 | www.papapa | 97色爱| 女仆脱了个精光被主人摸下面 | 一类黄色大片 | 国产精品ssss在线亚洲 | 羞羞偷拍视频 | 国产男女AV |