freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策理論與方法教學(xué)作者羅黨第四章動態(tài)決策分析(編輯修改稿)

2025-02-01 19:16 本頁面
 

【文章內(nèi)容簡介】 2 4萬元 2萬元 - 3萬元 1萬 多階段決策 多階段決策問題的決策方法 例 42的決策樹 1H買 不試 試 不買 1 ??2 8 3?30000??340604 1a22 9 1 ?30000202303a100003 1()H5 2 ?13 ?2023030000??3406012a2?1330000202303 10000?1011()H6 2 ?13 ?400002023030000??340601a221330000202303a10000?1213()H7 ????3406012a21330000?202303 1000014152 1 150002780527305500?100017305本講內(nèi)容 序貫決策 序貫決策的基本概念 上面的多階段決策,階段數(shù)是確定的。除這種決策外,還有一些決策的階段數(shù)不是事先確定的,它依賴于執(zhí)行決策過程中出現(xiàn)的情況。這種決策問題稱為序貫決策( sequential decision problem)。 序列決策在進(jìn)行決策后又產(chǎn)生一些新的情況,需要進(jìn)行新的決策,接著又有一些新的情況,又需要進(jìn)行新的決策。這樣決策、情況、決策 ……,這就構(gòu)成一個序列。 序貫決策 序貫決策的基本概念 序貫決策是用于隨機(jī)性或不確態(tài)定性動態(tài)系統(tǒng)最優(yōu)化的決策方法。它的特點是: 1)所研究的系統(tǒng)是動態(tài)的,即系統(tǒng)所處的狀態(tài)與時間有關(guān),可周期(或連續(xù))地對它觀察; 2)決策是序貫地進(jìn)行的,即每個時刻根據(jù)所觀察到的狀態(tài)和以前狀態(tài)的記錄,從一組可行方案中選用一個最優(yōu)方案(即作最優(yōu)決策),使取決于狀態(tài)的某個目標(biāo)函數(shù)取最優(yōu)值(極大或極小值); 3)系統(tǒng)下一步 (或未來 )可能出現(xiàn)的狀態(tài)是隨機(jī)的或不確定的。 序貫決策 序貫決策的基本概念 系統(tǒng)在每次作出決策后下一步可能出現(xiàn)的狀態(tài)是不能確切預(yù)知的,存在兩種情況: 1)系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布是已知的,可用客觀概率的條件分布來描述。對于這類系統(tǒng)的序貫決策研究得較完滿的是狀態(tài)轉(zhuǎn)移律具有無后效性的系統(tǒng),相應(yīng)的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態(tài)規(guī)劃相結(jié)合的產(chǎn)物。 2)系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布不知道,只能用主觀概率的條件分布來描述。用于這類系統(tǒng)的序貫決策屬于決策分析的內(nèi)容。 ? ? ? ?22,r a E f E? 序貫決策 序貫決策的決策方法 序貫決策的過程是:從初始狀態(tài)開始,每個時刻做出最優(yōu)決策后,接著觀察下一步實際出現(xiàn)的狀態(tài),即收集新的信息,然后再做出新的最優(yōu)決策,反復(fù)進(jìn)行直至最后。 解決序貫決策問題的有效辦法仍然是決策樹,解決序貫決策的關(guān)鍵是確定一個決策序列終止的原則。在下例中,這個原則就是:不管到?jīng)Q策的哪個階段,只要有一個非經(jīng)抽樣的后悔期望值小于進(jìn)行一次抽樣的費用,決策序列便可終止。 ? ? ? ?22,r a E f E? 序貫決策 序貫決策的決策方法 例 431 某工廠的產(chǎn)品每 1000件裝成一箱出售。每箱中產(chǎn)品的次品率有 , , ,其概率分別為 , , ?,F(xiàn)在的問題是:出廠前是否要對產(chǎn)品進(jìn)行嚴(yán)格檢驗,將次品挑出??梢赃x擇的行動有兩個:① 整箱檢驗 (a1) ,檢驗費 為每箱 100元;②整箱不檢驗 (a2 ) ,但如果顧客在使用中發(fā)現(xiàn)次品,每件次品除條換為合格品外還要賠償 。 序貫決策 ?為了更好地做出決定可以先從一箱中隨機(jī)抽取 1件作為樣本檢驗它,然后根據(jù)這件產(chǎn)品是都次品再決定該箱是否要檢驗,抽樣成本為 。進(jìn)行第一次抽樣后,除選擇檢驗還是不檢驗外,還可以根據(jù)前面抽樣的結(jié)果,考慮再進(jìn)行一次抽樣檢驗如此形成一個決策序列。 ?試進(jìn)行序列決策: ( 1)是否需要抽樣?(若需要,抽樣幾次?) ( 2)在抽樣或不抽樣的前提下,采用何種方案進(jìn)行檢驗? 【 例 】 解: θ1, θ2, θ3分別表示產(chǎn)品次品率為 , , 。 對于抽樣檢驗一件產(chǎn)品 , X=1和 X=0分別表示樣品為次品和合格品兩個結(jié)果 。 結(jié)果值均用期望損失值表示 。 序列決策樹圖不能夠一次繪制成功 , 而是隨著決策過程序列的延伸和終止依次進(jìn)行 。 為了簡化圖形 , 行動方案 al和 a2可能出現(xiàn)的狀態(tài)及其對應(yīng)的損失值均在圖中略去 , 僅在方案枝末端標(biāo)注上期望損失值 。 1 4 5 3 2 8 6 7 a1 a2 A1 A2 A3 A4 X1=0 X1=1 9 X2=0 X2=1 a1 a2 (略) … … … 相應(yīng)的損失矩陣為 ?????????? ?1250000)( 32ijrR先進(jìn)行第一次抽樣的后驗概率計算 ?????3111 )()|0()0(jjj pxpXP ?? ?????? ?該問題的費用矩陣為: )0( )()|0()0|(111111 ???????XPPXpXP ??? )0( )()|0()0|(122112 ???????XPPXPXP ??? )0( )()|0()0|(133113 ???????XPPXPXP ??? ?????3111 )()|1()1(jjj PXPXP ?? ?????? ?【 例 】 )1( )()|1()1|(111111 ???????XPPXPXP ??? )1( )()|1()1|(122112 ???????XPPXPXP ??? )1( )()|1()1|(133113 ???????XPPXPXP ???第一次抽樣的后驗概率矩陣為 ???????????426 568 004 034 622 342 )|(3211???? XP01 ?X 11 ?X后驗行動方案的期望損失值矩陣為 )|()|( 11 XPRXaR ???????????
點擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1