freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論公選課論文2-文庫吧

2025-11-01 02:40 本頁面


【正文】 有回報如果有時盡力了也沒有得到想要的結(jié)果你也可以坦然地面對因為盡力去做的你已經(jīng)無怨無悔得不到不是因為你沒有去珍惜和努力。一啄一飲,皆有得失。是非善惡,均為棋子。手執(zhí)本心,落子于世。千般輸贏,不失自我。第二篇:博弈論公選課論文博弈論淺述什么是博弈論?標(biāo)準(zhǔn)的說,博弈論又被稱為對策論(Games Theory),是研究具有斗爭或競爭性 質(zhì)現(xiàn)象的理論和方法,它既是現(xiàn)代數(shù)學(xué)的一個新分支,也是運籌學(xué)的一個重要學(xué)科。簡單的說,博弈論說的就是博、弈之間道理和奧妙。舉一個經(jīng)典的例子,博弈論中的“智豬博弈”。這個例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機(jī)會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了。“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會有踩踏板的動力了。如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個游戲規(guī)則的設(shè)計顯然是失敗的。改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強(qiáng)。對于游戲規(guī)則的設(shè)計者來說,這個規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因為競爭不強(qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓?。改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?,而多勞者多得。每次的收獲剛好消費完。對于游戲設(shè)計者,這是一個最好的方案。成本不高,但收獲最大。原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。從這樣一個簡單而經(jīng)典的例子中,我們可以最直觀的體驗到,博弈論對于人們的社會、經(jīng)濟(jì)、生活等方方面面的指導(dǎo)意義。要了解博弈論,首先就要了解博弈論中最基本的幾個名詞的含義。(1)決策人:在博弈中率先作出決策的一方,這一方往往依據(jù)自身的感受、經(jīng)驗和表面狀態(tài)優(yōu)先采取一種有方向性的行動。(2)對抗者:在博弈二人對局中行動滯后的那個人,與決策人要作出基本反面的決定,并且他的動作是滯后的、默認(rèn)的、被動的,但最終占優(yōu)。他的策略可能依賴于決策人劣勢的策略選擇,占去空間特性,因此對抗是唯一占優(yōu)的方式,實為領(lǐng)導(dǎo)人的階段性終結(jié)行為。(3)局中人(players):在一場競賽或博弈中,每一個有決策權(quán)的參與者成為一個局中人。只有兩個局中人的博弈現(xiàn)象稱為“兩人博弈”,而多于兩個局中人的博弈稱為 “多人博弈”。(4)策略(strategies):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導(dǎo)整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。(5)得失(payoffs):一局博弈結(jié)局時的結(jié)果稱為得失。每個局中人在一局博弈結(jié)束時的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)。所以,一局博弈結(jié)束時每個局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。(6)次序(orders):各博弈方的決策有先后之分,且一個博弈方要作不止一次的決策選擇,就出現(xiàn)了次序問題;其他要素相同次序不同,博弈就不同。(7)博弈涉及到均衡:均衡是平衡的意思,在經(jīng)濟(jì)學(xué)中,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達(dá)到了均衡。所謂納什均衡,它是一穩(wěn)定的博弈結(jié)果。那么究竟什么是納什均衡呢?在博弈G=﹛S1,?,Sn:u1,?,un﹜中,如果由各個博弈方的各一個策略組成的某個策論組合(s1*,?,sn*)中,任一博弈方i的策論si*,都是對其余博弈方策略的組合(s1*,?s*i1,sij*,s*i+1,?,sn*)的最佳對策,也即ui(s1*,?s*i1,si*,s*i+1,?,sn*)≥ui(s1*,?s*i1,sij*,s*i+1,?,sn*)對任意sij∈Si都成立,則稱(s1*,?,sn*)為G的一個納什均衡。但要注意的是,納什均衡,從實質(zhì)上說,是一種非合作博弈狀態(tài)。納什均衡達(dá)成時,并不意味著博弈雙方都處于不動的狀態(tài),在順序博弈中這個均衡是在博弈者連續(xù)的動作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個整體的最優(yōu)狀態(tài)。以下的囚徒困境就是一個例子。在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoner39。s dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個博弈的支付矩陣。囚徒困境博弈 [Prisoner39。s dilemma] A╲B 坦白 坦白8,8抵賴 0,10 抵賴10,01,1 對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優(yōu)的。顯然,根據(jù)對稱性,B也會選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴”,每人只被判刑1年。,(抵賴、抵賴)是帕累托最優(yōu)的,因為
點擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1