freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策問(wèn)題(更新版)

  

【正文】 期望收益值之和,從而,若某策略使期望收益最大,則該策略必使期望后悔值最小,定理得證。 ???風(fēng)險(xiǎn)型決策也可采用期望后悔值法求解。值得一提的是策略集也可以是無(wú)限集,例如,線(xiàn)性規(guī)劃就可行看成一個(gè)策略集是限集的確定型決策,問(wèn)題要求決策者從可行解集合(策略集)中挑選出最優(yōu)解。 期望值決策 收益(萬(wàn)元) 需求大 N1 需求中 N2 需求小 N3 期望值 概 率( pi) 大批量( S1) 500 300 - 250 - 65 中批量( S2) 300 200 80 126* 小批量( S3) 200 150 100 120 選擇期望值最大的決策為最優(yōu)決策 中批量的決策為最優(yōu)決策。 不確定決策的幾種準(zhǔn)則: ?悲觀準(zhǔn)則 ?樂(lè)觀準(zhǔn)則 ?等可能性準(zhǔn)則 ?樂(lè)觀系數(shù)準(zhǔn)則 ?后悔值準(zhǔn)則 悲觀準(zhǔn)則:最壞的情況下?tīng)?zhēng)取最好的結(jié)果 例 1. 某工廠決定投產(chǎn)一種新產(chǎn)品。這一部分工作既具有一定的創(chuàng)造性又在很大程度上影響到結(jié)果,對(duì)它研究也是十分有趣的。 ? ???圖 情況 1求解:容易求得守方的贏得矩陣 1 211 2211 24A?? ????? ?????? ??? ? ? ????? ???? ????????這是一個(gè)有鞍點(diǎn)的矩陣,鞍點(diǎn)為 a22。按常規(guī)做法,在防御正面上一般采用同一種技術(shù)密度。 分析 評(píng)價(jià)防坦克地雷場(chǎng)的重要指標(biāo)是戰(zhàn)斗效力,而布雷密度是基本因素之一。在 Bradleg構(gòu)造的矩陣中容易發(fā)現(xiàn) a1j< a3j, j=1,2 故 3優(yōu)于 1??梢郧蟮? , , ,不存在穩(wěn)定解,需要考慮其他解法。這樣,美軍將占領(lǐng)海峽并徹底殲滅德軍第九軍。 雙方應(yīng)如何決策,使自己能有較大的機(jī)會(huì)贏得戰(zhàn)爭(zhēng)的勝利呢? 我們將用建立矩陣對(duì)策模型的方法,來(lái)試圖求得雙方的最優(yōu)策略。 最后,我們來(lái)考察幾個(gè)對(duì)策問(wèn)題的實(shí)例。 表 B方 A方 1 2 3 1 2 3 4 ( 8,2) ( 3,4) ( 1,6) ( 4,2) ( 0,9) ( 9,0) ( 6,2) ( 4,6) ( 7,3) ( 2,7) ( 8,1) ( 5,1) 假如 A、 B雙方仍采取穩(wěn)妥的辦法, A發(fā)現(xiàn)如采取策略 4,則至少可獲利4,而 B發(fā)現(xiàn)如采取策略 1,則至少可獲利 2。 記 ,由于 , 在 yk=1, yj=0 ( j≠k)時(shí)達(dá)到最大值 u, m a xKjju E E?1 1njjy???1m a x n jjyjEy?? 故 應(yīng)為線(xiàn)性規(guī)劃問(wèn)題 X 1nij iia x u???min u , j=1, 2, …, n (即 Ej≤Ek) 11m iix??xi≥0, i =1,2,…, m 的解。故對(duì)A方選取的最佳概率 x1和 x2,必滿(mǎn)足: ??? ???1 2 1 212 2 81x x x xxx? ? ??? ???即 11 1 21 2 12 1 22 212 1a x a x a x a x? ? ?? ???由此解得 x1=, x2=。一旦戰(zhàn)斗機(jī)未被擊落,它將以 擊毀其選中的轟炸機(jī)。 m a x m inT T TxyX R Y X R Y x R Y??XY定理 ( Von Neumann)任意混合策略對(duì)策問(wèn)題必存在鞍點(diǎn),即必存在概率向 量和,使得: (證明從略)。此時(shí),在只使用純策略的范圍內(nèi),對(duì)策問(wèn)題無(wú)解。然而,在實(shí)際遇到的零和對(duì)策中更典型的是 μ+ν≠0的情況。 ???????? 例: 某單位采購(gòu)員在秋天時(shí)要決定冬天取暖用煤的采購(gòu)量。 證明: (充分性) 由 μ 和 ν 的定義可知,存在一行(例如 p行) μ為 p行中的最小元素且存在一列(例如 q列),- ν 為 q列中的最大元素。當(dāng) B采取策略 2時(shí),其損失不會(huì)超過(guò) 2。 在有些兩人對(duì)策的贏得表中, A之所得并非明顯為 B之所失,但雙方贏得數(shù)之和為一常數(shù)。記局中人集合為 I = {1,?, k},對(duì)每一 i∈ I,有一策略集合 Si,當(dāng) I中每一局中人 i選定策略后得一個(gè)局勢(shì) s;將 s代入贏得函數(shù) F,即得一矢量 F(s) = ( F1(s),?, Fk(s)),其中 Fi(s)為在局勢(shì) s下局中人 i的贏得(或支付)。 例如 ,若一對(duì)策中包含 A、 B兩名局中人,其策略集合分別為SA = { 1,…, m}, SB = { 1,…, n}。對(duì)策問(wèn)題中,對(duì)應(yīng)于每一局中人存在著一個(gè)策略集合,而每一策略集合中至少要有兩個(gè)策略,否則該局中人可從此對(duì)策問(wèn)題中刪去,因?yàn)閷?duì)他來(lái)講,不存在選擇策略的余地。在這類(lèi)模型中,參與對(duì)抗的各方都有一些可供選擇的策略,該模型為對(duì)抗各方提供獲得最優(yōu)對(duì)策的方法 ? 決策分析 – 在決策環(huán)境不確定和風(fēng)險(xiǎn)情況下對(duì)幾種被選方案進(jìn)行決策的準(zhǔn)則和方法 ? 預(yù)測(cè) – 對(duì)未來(lái)的發(fā)展作出的推測(cè)。? 玩撲克牌,比大小 ? 兩組撲克牌,分別是 7和 8 ? 你們先選,然后先出 ? 為什么我是總能贏? ? 這就是決策,對(duì)策 ? 田忌賽馬 ? 田忌賽馬是大多數(shù)人都熟知的故事,傳說(shuō)戰(zhàn)國(guó)時(shí)期齊王欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個(gè)等級(jí)的馬各一匹進(jìn)行比賽,每局賭金為一千金。 ? 對(duì)策論(博弈論) – 解決具有對(duì)抗性局勢(shì)的模型。局中人能采取的可行方案稱(chēng)為策略,每一局中人可采取的全部策略稱(chēng)為此局中人的策略集合。當(dāng)對(duì)策問(wèn)題各方都從各自的策略集合中選定了一個(gè)策略后,各方采取的策略全體可用一矢量 S表示,稱(chēng)之為一個(gè)純局勢(shì)(簡(jiǎn)稱(chēng)局勢(shì))。綜上所述,一個(gè)對(duì)策模型由局中人、策略集合和贏得函數(shù)三部分組成。例如若A有 m種策略, B有 n種策略,贏得矩陣 11 12 121 22 212nnmnm m m na a aa a aRa a a????????????表示若 A選取策略 i而 B選取策略 j,則 A之所得為 aij(當(dāng) aij0時(shí)為支付)。如果 A采取策略 2,無(wú)論 B采取什么策略, A的贏得均不會(huì)少于 2. ? B采取各方案的最大損失為 max {12,14, - 6}=14, max {- 6,2,0}=2, max {30,18, - 10}=30和 max {- 22,10,16} =16。 定理 零和對(duì)策 G具有穩(wěn)定解的充要條件為 μ +ν = 0。 一般又可以證明。 具有穩(wěn)定解的零和對(duì)策問(wèn)題是一類(lèi)特別簡(jiǎn)單的對(duì)策問(wèn)題,它所對(duì)應(yīng)的贏得矩陣存在鞍點(diǎn),任一局中人都不可能通過(guò)自己?jiǎn)畏矫娴呐?lái)改進(jìn)結(jié)果。但此時(shí)若 B改換策略 2,又會(huì)使 A輸?shù)?4, …… 。 定義 若存在 m維概率向量和 n維概率向量,使得對(duì)一切 m維概率向量 X和 n 維概率向量 y有 則稱(chēng)( , )為混合策略對(duì)策問(wèn)題的鞍點(diǎn)。若戰(zhàn)斗機(jī)阻擊 I,它將同時(shí)受到兩架轟炸機(jī)的射擊,被擊中的概率為 。若 E( 1) ≠E( 2),不妨設(shè) E( 1) E( 2),則 B方必采用 1以減少指揮部被轟炸的概率。 ?? ? 零和對(duì)策的解法 ? 矩陣對(duì)策的線(xiàn)性規(guī)劃法 A方選擇混合策略 的目的是使得 Xm in m a xTTX YX RY X RY? 1m in m a x ( )nTjjX YjX R y e?? ?1m in m a xnjjX YjEy??其中 ej為只有第 j個(gè)分量為 1而其余分量均為零的向量, Ej = XTRej。 例 現(xiàn)有一對(duì)策問(wèn)題,雙方獲利情況見(jiàn)表 。怎樣建立一個(gè) “公平 ”的分配原則是一個(gè)較為困難的問(wèn)題,將在第九章中介紹。Bradley將軍有三種可供選擇的策略:他可以命令后備軍原地待命,當(dāng)海峽形勢(shì)危急時(shí)支援第一軍或出擊東部敵人,以減輕第一軍的壓力。如不需增援,后備軍可東進(jìn)繞行到德軍后方。 上述分析估計(jì)是由 Bradley將軍作出的,據(jù)此構(gòu)造出 A方贏得矩陣 12123 113215 66213BA???????????????????????這是一個(gè) 32對(duì)策矩陣。 現(xiàn)在回過(guò)來(lái)討論美、德軍隊(duì)對(duì)策問(wèn)題。 ?? 例 (防坦克地雷場(chǎng)的布設(shè)) 實(shí)戰(zhàn)中,攻方為了增強(qiáng)攻擊力,大量使用攻擊力強(qiáng)、防御堅(jiān)固的坦克;守方為了抵御對(duì)方攻擊,需要大量殺傷敵方的有生力量,有效對(duì)策之一是布設(shè)防坦克地雷場(chǎng)。對(duì)守方來(lái)講,布雷密度通??煞殖?,1,2等有限個(gè)等級(jí)。守方設(shè)計(jì)了三種布雷方案 1, 2, 3,(圖 ),試求守方的贏得矩陣和最優(yōu)策略。策略的設(shè)計(jì)并沒(méi)有包含在決策問(wèn)題的求解中,事實(shí)上,僅當(dāng)策略設(shè)計(jì)完成后,即策略集合給定后,決策問(wèn)題才被給定,從而才能被求解,因而,在用對(duì)策論方法研究實(shí)際課題時(shí),應(yīng)當(dāng)特別注意策略的設(shè)計(jì)。 不確定環(huán)境下的決策 決策者面臨的決策環(huán)境由一些自然狀態(tài)組成,決策者可以采取若干決策方案,每一種決策方案在不同的自然狀態(tài)下出現(xiàn)的結(jié)果是已知的,但決策者 不能預(yù)先估計(jì) 各種自然狀態(tài)出現(xiàn)的 概率 。 決策者 能預(yù)先估計(jì) 決策環(huán)境中各種自然狀態(tài)出現(xiàn)的 概率 。這種決策問(wèn)題的結(jié)構(gòu)較為簡(jiǎn)單,決策者只需比較各種方案,確定哪一方案最優(yōu)即可。如對(duì)例 1,分別求出方案 1(鉆井)和 2(不鉆井)的期望收益值: ??E( 1) =(- 30) +20 + 40 = 16(萬(wàn)元) E( 2) =0 由于 E( 1)> E( 2),選取 1作為最佳策略。 ? m a xij k j ijkl a a??? max kjk a定理 最大期望收益法與最小期望后悔值法等價(jià),即兩者選出的最佳 策略相同。 如遇到陰雨天氣,則維持正常速度,不必支付額外費(fèi)用。 解:由于未來(lái)的天氣狀態(tài)未知,但各種天氣狀況出現(xiàn)的概率已知,本例是一個(gè)風(fēng)險(xiǎn)型決策問(wèn)題,所謂的額外費(fèi)用應(yīng)理解為期望值。遇到?jīng)Q策點(diǎn)則比較各方案分枝的效益期望值以決定方案的優(yōu)劣,并且用雙線(xiàn)劃去淘汰掉的方案分枝,在決策點(diǎn)旁標(biāo)上最佳方案的效益期望值,計(jì)算步驟如下: ( 1)在機(jī)會(huì)節(jié)點(diǎn) E、 F處計(jì)算它們的效益期望值 E(E) = (- 24000)+ (- 18000)+ (- 12023) =- 19800 E(F) = (- 54000)+ (- 46000)+ (- 38000) =- 50800 ( 2)在第一級(jí)決策點(diǎn) C、 D處進(jìn)行比較,在 C點(diǎn)處劃去正常速度分枝,在D處劃去應(yīng)急分枝。下面結(jié)合一個(gè)例子,介紹幾種處理這類(lèi)問(wèn)題的方法。 ?( 3)樂(lè)觀系數(shù)法( Hurwicz決策準(zhǔn)則) 樂(lè)觀系數(shù)法采用折中的辦法,引入一個(gè)參數(shù) t, 0≤t≤1,稱(chēng) t為樂(lè)觀系數(shù)。事實(shí)上,采取什么方法決策與決策者的心理狀態(tài)有關(guān)。記該商品的進(jìn)貨量為 (決策變量),若 ,進(jìn)貨過(guò)量,每單位進(jìn)貨過(guò)剩將造成 k0元過(guò)量損失;反之,若 ,進(jìn)貨不足,每單位進(jìn)貨不足將造成 ku元的不足損失。 故燒雞的最佳制作量為 28只?,F(xiàn)有三個(gè)廠生產(chǎn)這種配件,牌號(hào)為 A, B, C。接下來(lái)由買(mǎi)者報(bào)價(jià),每一次都比前次高,最后誰(shuí)出的價(jià)格高拍賣(mài)品即歸誰(shuí)所有。 日本統(tǒng)帥山本五十六大將心里很明白: 在日本艦隊(duì)穿過(guò)俾斯麥海的三天航行中,不可能躲開(kāi)盟軍的空中打擊,他要策劃的是盡可能減少損失。由于氣候惡劣,能見(jiàn)度差,盟軍只能實(shí)施兩天的
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1