freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策理論與方法教學(xué)作者羅黨第四章動態(tài)決策分析(參考版)

2025-01-16 19:16本頁面
  

【正文】 。 本章小結(jié) 本章介紹了動態(tài)決策的基本概念與基本方法 , 重點是:多階段決策 、 序貫決策 、 決策樹等概念 , 動態(tài)規(guī)劃 、 決策樹方法及其在多階段決策 、 序貫決策中的應(yīng)用 。 例 2 上例中 , 若每年是否采取廣告策略需要依據(jù)上一年的經(jīng)營情況而定 , 應(yīng)該如何決策 ? 解: 這是一個三階段決策問題 。以一年為一個時期,如果不采用廣告推廣產(chǎn)品或采取廣告措施,狀態(tài)的轉(zhuǎn)移矩陣分別如下 P1 暢銷 滯銷 暢銷 滯銷 不采取廣告措施 采取廣告措施 P2 暢銷 滯銷 暢銷 滯銷 例 2 假定上一年處于暢銷狀態(tài) , 每年的廣告費(fèi)為 15萬元 。 例 2 我國出口某種設(shè)備,在國際市場上的銷售狀況有兩種:暢銷和滯銷。另外 , 三種措施的成本費(fèi)分別為 150萬 , 40萬 , 30萬 。 記 則 馬爾可夫應(yīng)用實例 例 1 某生產(chǎn)商標(biāo)為 A的產(chǎn)品的廠商為了與另外兩個生產(chǎn)同類產(chǎn)品 B和 C的廠家競爭 , 有三種可供選擇的措施: (1)發(fā)放有獎債券; (2)開展廣告宣傳; (3)優(yōu)質(zhì)售后服務(wù) 。 ? ?jxPP nnnjnj ??? ???? li mli m )(? ? ? ? ?jnnnn jxPixjxP ?????? ???? lim|lim 0由于初始狀態(tài)對 n步轉(zhuǎn)移后所處狀態(tài)的影響隨 n增大而減少,故: 因此我們可以從 n步轉(zhuǎn)移矩陣的 極限取得穩(wěn)態(tài)概率分布 ??n PPPnn 1?? PPP nnnn 1)( li mli m ????? ?稱 167。 馬爾可夫決策 由上例可看出 ??312321221121)2(21331323121311)2(13321322121211)2(12311321121111)2(11pppppppppppppppppppppppppppp????????????????????????從而有 ? ? 2)2( PPPp ij ???一般地,有 ? ? nnij Pp ?)(167。 167。 馬爾可夫決策 已知: ? ? ????????31,31,31, )0(3)0(2)0(1)0( PPPP問某人開始在第 1部門工作,一年后在第 2部門工作的概率是多少?一年后,技術(shù)人員在 3個部門工作的概率各為多少? 167。初始狀態(tài),即技術(shù)人員開始是在某部門工作的概率用 Pj(0)表示, j= 1, 2, 3; pij表示處于第 i個部門的技術(shù)人員在半年后轉(zhuǎn)移到第 j個部門的概率。 馬爾可夫決策 例: 某企業(yè)為使技術(shù)人員具有多方面經(jīng)驗,實行技術(shù)人員在技術(shù)部門、生產(chǎn)部門和銷售部門的輪換工作制度。 ( 1)具有有限種狀態(tài); ( 2)具有馬爾可夫性; ( 3)轉(zhuǎn)移概率具有平穩(wěn)性。 ?若一步轉(zhuǎn)移概率不隨時間變化 (具有穩(wěn)定性 ),記 pij=P{xn=j | xn1=i },稱矩陣 P= (pij )為轉(zhuǎn)移概率矩陣。 含義: {x(tn)}的將來只是通過現(xiàn)在與過去發(fā)生聯(lián)系 , 一旦現(xiàn)在已知 , 則將來與過去無關(guān) 。 167。 馬爾可夫決策 馬爾可夫決策問題 ?馬氏過程 馬爾科夫( M . A . Markov )提出一種描述系統(tǒng)狀態(tài)轉(zhuǎn)移的數(shù)學(xué)模型,稱為馬爾科夫過程,簡稱馬氏過程。 ?其中一種最簡單、最基本的情形,是每一時期狀態(tài)參數(shù)的概率分布只與這一時期的前一時期實際所處的狀態(tài)有關(guān),而與更早的狀態(tài)無關(guān),這就是所謂的馬爾可夫鏈。 馬爾可夫決策 ?研究這樣的一類決策問題: 采取的行動已經(jīng)確定,但將這個行動付諸實踐的過程又分為幾個時期。 ?若為正品 , 則采取行動方案 a2, 即整箱產(chǎn)品不予檢驗; ?若為次品 , 則采取行動方案 a1, 即整箱產(chǎn)品予以檢驗 , 序列決策過程也可以用簡化決策樹圖表示 。 在 s1狀態(tài)點處 , 期望損失值為: (元) ????在 A1決策點處,最滿意方案的期望損失值為: )( 元??所以截去 a1和 a2。 a1 a2 s1 a1 a2 s2 a1 a2 s3 a1 a2 s3 a1 a2 s2 A1 A2 A3 S1 S2 … 在 A3上 X2=0的決策點處 , 最滿意行動方案為a2 , 截去 a1和 s3; 在 X2=1的決策點處 , 最滿意行動方案為 a1,截去 a2和 s3。 同樣 , 對于 X2=1決策點處 ,由于方案 a1的期望損失值 用 , 則這一分枝也應(yīng)終止 。 X2= 0和 X2=1分別表示第二次抽樣抽取一個樣品為正品和次品 。 而在 Xl= 0的決策點處 , 由于行動方案 al, a2。 最滿意方案是,應(yīng)抽取一件產(chǎn)品作樣品檢驗。 為了簡化圖形 , 行動方案 al和 a2可能出現(xiàn)的狀態(tài)及其對應(yīng)的損失值均在圖中略去 , 僅在方案枝末端標(biāo)注上期望損失值 。 結(jié)果值均用期望損失值表示 。 ?試進(jìn)行序列決策: ( 1)是否需要抽樣?(若需要,抽樣幾次?) ( 2)在抽樣或不抽樣的前提下,采用何種方案進(jìn)行檢驗? 【 例 】 解: θ1, θ2, θ3分別表示產(chǎn)品次品率為 , , 。 序貫決策 ?為了更好地做出決定可以先從一箱中隨機(jī)抽取 1件作為樣本檢驗它,然后根據(jù)這件產(chǎn)品是都次品再決定該箱是否要檢驗,抽樣成本為 ?,F(xiàn)在的問題是:出廠前是否要對產(chǎn)品進(jìn)行嚴(yán)格檢驗,將次品挑出。 ? ? ? ?22,r a E f E? 序貫決策 序貫決策的決策方法 例 431 某工廠的產(chǎn)品每 1000件裝成一箱出售。 解決序貫決策問題的有效辦法仍然是決策樹,解決序貫決策的關(guān)鍵是確定一個決策序列終止的原則。用于這類系統(tǒng)的序貫決策屬于決策分析的內(nèi)容。對于這類系統(tǒng)的序貫決策研究得較完滿的是狀態(tài)轉(zhuǎn)移律具有無后效性的系統(tǒng),相應(yīng)的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態(tài)規(guī)劃相結(jié)合的產(chǎn)物。它的特點是: 1)所研究的系統(tǒng)是動態(tài)的,即系統(tǒng)所處的狀態(tài)與時間有關(guān),可周期(或連續(xù))地對它觀察; 2)決策是序貫地進(jìn)行的,即每個時刻根據(jù)所觀察到的狀態(tài)和以前狀態(tài)的記錄,從一組可行方案中選用一個最優(yōu)方案(即作最優(yōu)決策),使取決于狀態(tài)的某個目標(biāo)函數(shù)取最優(yōu)值(極大或極小值);
點擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1