如何理解經濟學中的囚徒困境與納什均衡

2021-03-04 06:22:21 字數 3360 閱讀 5430

1樓:千里揮戈闖天涯

囚徒困境最早是由美國普林斯頓大學數學家阿爾伯特·塔克(albert

tucker)2023年提出來的。他當時編了乙個故事向史丹福大學的一群心理學家們解釋什麼是博弈論,這個故事後來成為博弈論中最著名的案例。故事內容是:

兩個嫌疑犯(a和b)作案後被警察抓住,隔離審訊;**的政策是「坦白從寬,抗拒從嚴」,如果兩人都坦白則各判8

年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據不足各判1年。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去「懲罰」另乙個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。

欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向乙個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累託最優。

囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同夥可為自己帶來利益(縮短刑期),也因為同夥把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同夥會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。

經濟學中的「囚徒困境」是什麼意思?

2樓:匿名使用者

囚徒困境(prison dilemma)是博弈

論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的**競爭、環境保護等方面,也會頻繁出現類似情況。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去「懲罰」另乙個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。

欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向乙個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累託最優。

囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同夥可為自己帶來利益(縮短刑期),也因為同夥把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同夥會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。

舉個例子:

2023年,由就職於蘭德公司的梅里爾·弗勒德(merrill flood)和梅爾文·德雷希爾(melvin dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

用**概述如下:

甲沉默(合作) 甲認罪(背叛)

乙沉默(合作) 二人同服刑半年 甲即時獲釋;乙服刑10年

乙認罪(背叛) 甲服刑10年;乙即時獲釋 二人同服刑2年

3樓:匿名使用者

囚徒困境:兩個**的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。(曼昆《經濟學原理》第五版,北京大學出版社)

囚徒困境博弈對經濟學的意義

4樓:匿名使用者

個人感覺囚徒困境的博弈分析是給大家展示了乙個納什均衡與直觀的最優相背的現象,當大家都考慮自己利益最大化的時候,雙方利益都受損,這與微觀經濟學中大家都將自己利益最大化時總體利益也最大是相背的。這種現象提供給經濟學更多的解釋與思考空間,比如怎樣避免囚徒困境啊,合作啊,遵守協議啊等等。不過我覺得出了經濟學,這個意義更大,畢竟經濟人假設只是人的一面,不是全部,不該由完全的經濟視角來解讀人性。

5樓:匿名使用者

個人最求利益最大化但在乙個互動的世界中並不一定是最優!

關於微觀經濟學的支付矩陣,這張圖怎麼理解,我看不懂,求大神幫忙

6樓:匿名使用者

教你看博bai弈論的**du,

口訣,先橫後zhi豎先右後左比大小,比

dao完大小就移動。本人經專驗之談。屬

如**,先看上面一行的右邊2個數字,發現10比-10大,就取左邊,再看左邊一列的豎排左邊2個數字,比大小,還是10比-10大,所以就取,正常**。正常**。

在從下面一行的右邊數字看,-50比-100大,取-50,在看右邊一列的左邊數字-50比-100大,所以還是-50,取**戰**戰。

所以這個博弈有2個均衡,取決於兩家的先後順序。

如果移動的時候沒完沒了就沒有均衡。

7樓:干戈一笑

這個是典型bai的「囚徒困境du」模型,最後的納什均zhi衡點肯定在-50,-50.,這樣dao理版解,如果他兩都按正常權的**銷售,那麼他們都能獲得10、10的好處,這裡你可以把10理解為收入,比如10億等等,反正你覺得怎麼好理解就怎麼理解,反正理解成好處就行,但是a會想:如果我不打**戰,對方打**戰,那麼我就會虧100,如果對方不打,而我打**戰,我只虧10,綜合考慮,我會選擇打**戰,因為損失會小點,反過來,n也會這麼想,那麼他們最後的結果必定是都打**戰。

意思就是個體的理性導致集體的非理性。

論述囚徒困境中兩個囚徒之間的博弈過程(西方經濟學) 15

8樓:血色的

囚徒困境可以簡單的用圖上的**表示出來,

針對甲而言,如果乙選擇

了沉默,則對於甲而言,選擇沉默是判罪一年,如果坦白,是立即獲釋;

如果已選擇了認罪,則對於甲而言,選擇沉默是判罪十年,選擇坦白,是判罪一年。

因此,無論乙做何種選擇,甲的最優策略只有選擇坦白。

同理,無論甲做何種選擇,乙的最優策略也只有選擇坦白。

所以,囚徒困境的納什均衡就是甲乙都選擇坦白。

這場博弈的納什均衡,顯然不是顧及團體利益的帕累託最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑1年,總體利益更高,結果也比兩人背叛對方、判刑8年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。

均衡狀況會是兩個囚徒都選擇背叛,結果二人判決均比合作為高,總體利益較合作為低。這就是「困境」所在。該例子漂亮地證明了:

非零和博弈中,帕累託最優和納什均衡是相衝突的。

如何理解福利經濟學的屬性

一般均衡理論是理論性的微觀經濟學的乙個分支,尋求在整體經濟的框架內解釋生產 消費和 一般均衡是指經濟中存在著這樣一套 系統,它能夠使 每個消費者都能在給定 下提供自己所擁有的生產要素,並在各自的預算限制下購買產品來達到自己的消費效用極大化 每個企業都會在給定的 下決定其產量和對生產要素的需求,來達到...

經濟學中互補品與替代品的區別,西方經濟學中,替代品與互補品是相同的定義嗎?

在經濟學上,互補品指的是在使用價值上可以相互補充配套使用的產品,比如電腦和電腦鍵盤,滑鼠和滑鼠墊等,他們是屬於互補品。而替代品則指的是在使用價值上可以相互替代的產品,比如蘋果和香蕉在水果層面上是屬於替代品,如果沒有蘋果可以吃,你可以吃香蕉。好吧,比如說碗和筷子,你買了碗,一般都要順帶買筷子 或者湯匙...

求哲學與經濟學的關係,哲學與經濟學的關係

在經濟學發展的早期階段,經濟學和哲學是一體的,經濟學是哲學的,哲學也是經濟學的。比如就經濟學的鼻祖亞當 斯密個人而言,他首先是一位哲學家,然後才是經濟學家,最先為其贏得聲譽的著作是 道德情操論 先於經濟學名著 國富論 亞當 斯密的好友休謨的 人性論 對 國富論 有著的深刻的影響,國富論 中著名的 理...