正文內(nèi)容

運籌學(xué)決策論ppt課件-資料下載頁

2025-05-03 18:35本頁面

　　

【正文】 1211ppppP設(shè) G＝ (g1， g2)，由 G＝ GP Markov Decision 設(shè) G＝ (g1， g2)，由 G＝ GP ??????????????????5352212122211211ppppP???????????53522121),(),( 2121 gggg1,5321,5221 21212211 ?????? gggggggg95,9421 ?? gg Markov Decision 收益預(yù)測模型 ),( nn if ? 設(shè)系統(tǒng)在第 n個時期處于狀態(tài) X(n)=i，轉(zhuǎn)移到過程終結(jié)時的總期望收益為 ?? ,2,1。,2,1)],([),(111 ???? ???? nmijfrPifnjnnijijnn ??rij 表示從狀態(tài) X(n)=i 轉(zhuǎn)移到下一個狀態(tài) X（ n+1） =j 相應(yīng)的收益，則有： πn表示從第 n個時期到過程終結(jié)的決策規(guī)則 δ的序列 },{1 ??nn ??),( 1?? nnn ???其中 δn為第 n個時期的決策規(guī)則， Markov Decision q(i)表示由狀態(tài) i 作一次轉(zhuǎn)移的期望報酬，即狀態(tài)的即時期望報酬．則 ),2,1()(1????mjijij mirPiq ?),()(),(111??????mjnnijnn jfPiqif ??令或 )1()(1?????mjjijii nfPqnf Markov Decision 若記數(shù)從末端開始，上式的逆序?qū)懛椋? ?????????????)()()()(21nfnfnfnFm??????????????mqqqQ?21?????????????mmmmmmPPPPPPPPPP????212222111211則 ?,2,1)1()( ????? nnFPQnFQF ?)1(?? ,2,1。,2,1)1()(1????? ??nminfPqnfmjjijii Markov Decision Markov Decision 【例】商品的轉(zhuǎn)移概率矩陣和利潤表如下暢銷滯銷暢銷滯銷暢銷滯銷暢銷 50 10 滯銷 20 － 20 轉(zhuǎn)移概率表利潤表 (萬元 ) q1= 50+ 10＝ 30， q2= 20+ (－ 20)＝－ 4 ),2,1()(1????mjijij mirPiq ??,2,1)1()( ????? nnFPQnF30 30 43( 2)4 4 30 43 54 .3( 3 )4 16 .56FF? ? ? ? ? ? ? ?? ? ?? ? ? ? ? ? ? ???? ? ? ? ? ? ? ?? ? ? ? ? ? ? ?? ? ?? ? ? ? ? ? ? ??? ? ? ? ? ? ? ?n 1 2 3 4 5 6 f1(n) 30 44 f2(n) － 4 6期利潤預(yù)測最優(yōu)策略模型 Markov決策由五重組來描述： 1. 狀態(tài) i 2. 策略集，狀態(tài) i 的策略規(guī)則為 3. 轉(zhuǎn)移概率矩陣 P 4. 報酬，狀態(tài) i 的策略規(guī)則為轉(zhuǎn)移到狀態(tài) j 的報酬為期望即時報酬為 5. 目標函數(shù) V(n) },{ 1 ??nn ?? )(i?)(i? )(iijr?)(iiq? Markov Decision Markov決策（ MD）描述在某一時刻（階段）隨機變量 X處于狀態(tài) i ，決策者選擇某個策略使目標最優(yōu)。 MD常用的目標有 3種：； 2. 折扣目標；有限階段目標最大。通過 Z變換： mifnPqnfPqnfmjjijimjjijii,2,1])1[()1()(11????????? ???? Markov Decision ???Mjjiji qsv1( 1 ) ( 0)F T Q SF?? ()iif n nv f??記 ? ?11mi i jji jv n f p n vq f???? ? ? ?? ???1mi ij jijv f p fq?? ?? ?i=1,2, …, m () 解方程組求出變量 fi 與 v 采用迭代計算：（ 1）選擇一個初始策，每一個狀態(tài) i（ i=1， 2… ， m）選擇一個決策規(guī)則使其決策，令 n=0； n?0)( ?nmf)()( iu nki ??n?(2) 對已知策略，令，求解方程組 ()，得相應(yīng)的策略獲利 v（ n）和相對值 f（ n），（ i=1,2,…,m ； n=0,1,2… ）； Markov Decision （ 3）應(yīng)用上一策略已求得的，尋求一個新的策略規(guī)則 δn+1，對每一個狀態(tài) i，使 )(nmf11( ) ( ) ()1m a x nnmii ni i j j ijv q p f f?????? ? ? ??由此得新的策略 1?n?（ 4）若所得策略與前次迭代所得策略完全相等，則停止迭代，已得到了最優(yōu)策略；否則回到步驟 2，令 n=n+1． 1?n? n? Markov Decision 【例】某水泥廠有一臺窯爐處于兩種運行狀態(tài)，即運轉(zhuǎn)和故障，窯爐工人每年定期檢查設(shè)備一次．若窯爐正常則選擇維護或不維護；若窯爐故障則選擇大修或常規(guī)維修，其轉(zhuǎn)移概率與相應(yīng)的報酬如下表，試求該廠應(yīng)采取的最佳策略使在無限期的未來每年所獲平均收入最大．表 11 .12 轉(zhuǎn)移概率和報酬 )()( iv Ki ?? ??iip?1 ??iip2 ??2iir???1 iir?)(iiq?狀態(tài) I 決策轉(zhuǎn)移概率報酬期望即時報酬 1．運轉(zhuǎn) 1.(不維護 ) 2.(維護 ) 50 48 0 0 25 2．故障 1.(大修 ) 2.(常修 ) － 5 － 3 0 0 － 4 － Markov Decision 【解】此問題共有兩種狀態(tài)，每個狀態(tài)有兩種決策，因此共有四種可行決策。 1)1(u 2)1(u1)2(u 2)2(u111 ?????? ??mjijij rpq 21 ?q 412 ??q ??q為運轉(zhuǎn)時不維護；為運轉(zhuǎn)時維護；為故障時大修；為故障時進行常規(guī)維修． (1)選取初始策略 0? 1 )2(01 )1(0 )2(,)1( uu ?? ??令即當(dāng)運轉(zhuǎn)時不維護 ,而故障時大修，則有 ??????? ???????? 425Q Markov Decision Markov Decision (2) 開始定值運算，并估計初始策略 ????????????212211fffvfffv令 f2=0，解上述方程組，得 v（ 0） =， )0(1 ?f0)0(2 ?f(3) 進入策略改進程序，求改進策略．對狀態(tài) 1，尋求策略 ,使 )(1ku)0(1)0(212)0(1111m a x ffPfpq kkk ??? a x ???????????????????選取決策 , ，當(dāng)窯爐運轉(zhuǎn)，采取維護策略， 2)1(u????? ??mjinjiijii ffpqnn1)()()( 11m a x ??對狀態(tài) 2，尋求新策略 ,使 ku )2()0(2)0(2212)0(1212m a x ffPfpq kkk ??? a x ?????????????????????1 )2(u選取決策，當(dāng)窯爐故障時，采取大修策略．求得改進策略為： ,)1( 2 )1(1 u?? 1 )2(1 )2( u??策略與策略不同，所以還沒有得到最優(yōu)策略，須繼續(xù)迭代． 1? 0? Markov Decision (4) 再進行定值運算求 )1(2)1(1)1( , ffv????????????????)1(2)1(1)1(2)1()1(2)1(1)1(1)1(fffvfffv，令 0)1(2 ?f 解方程得： v（ 1） =， )1(1 ?f 0)1(2 ?f(5) 尋求改進策略， 2?對狀態(tài) 1，有： a x ????????????????????仍取策略 )2(1u Markov Decision a x ?????????????????????對狀態(tài) 2，有：仍取策略 )1(2u因此得到： )2(12 )1( u?? )1(22 )2( u??這與前一次迭代結(jié)果完全一樣，因而求得了最優(yōu)策略即為：運轉(zhuǎn)時的決策是進行維護，故障時進行大修，工廠未來每年期望報酬為． Markov Decision Markov Decision 作業(yè)：教材 P269 T 10 The End of Chapter 11 2 3 1 現(xiàn)在擴建明年擴建 () () 10 8 1 8 6 1 (1) () (0) () () () 習(xí)題習(xí)題 1 2 3 摸球不摸球 0 白：紅： 4 5 藍：綠： 10 11 50 0 12 13 50 0 藍：綠： 6 8 7 9 第 2次摸球第 2次摸球不摸球不摸球－ 10 － 10 － 10 0 0 25 － 5 25 0

點擊復(fù)制文檔內(nèi)容

教學(xué)課件相關(guān)推薦

運籌學(xué)決策分析1(qh)-資料下載頁

【總結(jié)】第十五章決策分析15．1決策系統(tǒng)一、什么叫決策？所謂決策，簡單地說就是做決定的意思，詳細地說，就是為確定未來某個行動的目標，根據(jù)自己的經(jīng)驗，在占有一定信息的基礎(chǔ)上，借助于科學(xué)的方法和工具，對需要決定的問題的諸因素進行分析，計算和評價，并從兩個以上的可行方案中，選擇一個最優(yōu)方

2025-05-14 22:15

運籌學(xué)課件——第4講馬爾可夫決策-資料下載頁

【總結(jié)】引例：牛奶廠決策?最佳經(jīng)營策略選擇：?北京地區(qū)鮮牛奶由三個廠家提供，該地區(qū)客戶總數(shù)為100萬戶，假定廠家每年從每個客戶那里平均獲利50元，客戶資源每月都在三個廠家之間相互流動，廠家2考慮從以下兩套候選方案之中選擇一個實施：?方案一：吸引老客戶，須花費450萬元；?方案二：吸引廠家

2025-05-10 15:30

運籌學(xué)動態(tài)規(guī)劃ppt課件-資料下載頁

【總結(jié)】第1頁共64頁第四章動態(tài)規(guī)劃——DynamicProgramming（DP）動態(tài)規(guī)劃是運籌學(xué)的一個重要分支，是解決多階段決策過程最優(yōu)化問題的一種非常有效的方法。1951年，美國數(shù)學(xué)家貝爾曼（）等人，根據(jù)一類多階段決策問題的特點，把多階段決策問題變換為一系列相互聯(lián)系的單階段決策問題，然后分階段逐個加以解決。

2025-05-03 18:35

運籌學(xué)考研試題ppt課件-資料下載頁

【總結(jié)】運籌學(xué)考研試題匯編運籌學(xué)OperationalResearch一、線性規(guī)劃（每題20分）設(shè)線性規(guī)劃問題為：北京工商大學(xué)2022年攻讀碩士學(xué)位研究生入學(xué)考試試題考試科目：物流管理與運籌學(xué)第一部分運籌學(xué)（60分）????????????????0,,6242..2mi

2025-05-03 18:36

運籌學(xué)lpilppt課件(2)-資料下載頁

【總結(jié)】運籌學(xué)模型（1）[生產(chǎn)計劃模型]國內(nèi)某手機產(chǎn)商考慮生產(chǎn)甲、乙、丙、丁型號的四款手機，每款手機都需要依次經(jīng)過A、B、C三個車間加工完成。假設(shè)每款手機需要各車間加工的工時（單位：小時）、每個車間的最大生產(chǎn)能力以及每款手機預(yù)期的利潤都已知，具體數(shù)據(jù)參見表2-4-1。表2-4-1手機車間甲

2025-05-03 18:35

管理運籌學(xué)復(fù)習(xí)ppt課件-資料下載頁

【總結(jié)】管理運籌學(xué)復(fù)習(xí)馬昌譜13977301216SHUFE2線性規(guī)劃問題?線性規(guī)劃主要解決有限資源的最佳分配問題??決策變量的取值要求非負。??存在一組決策變量構(gòu)成的線性等式或不等式的約束條件。??存在唯一的線性目標函數(shù)（極大或極?。?。?求解方法：?圖解法?單純形

2025-01-10 04:16

運籌學(xué)對偶靈敏ppt課件-資料下載頁

【總結(jié)】第3章對偶理論和靈敏度分析?對偶理論(DualTheory)?靈敏度分析(SensitivityAnalysis)?用矩陣形式表示?原問題：?對偶問題：minω=Y’bA’Y≥CY≥0maxZ=CXAX≤bX≥0項目原問題對偶問題系數(shù)矩陣A約束系數(shù)

2025-05-03 18:35

運籌學(xué)ch信管ppt課件-資料下載頁

【總結(jié)】信息系羅捍東1假設(shè)有某種資源的總數(shù)量為a(例如原樹料、能源、機器設(shè)備、勞動力、食品等)，可用于生產(chǎn)n種產(chǎn)品，若生產(chǎn)第j種產(chǎn)品所使用的資源數(shù)為xj時，可獲得利潤為gj(xj)，問如何分配該種資源，使所獲得的總利潤達到最大。一、資源分配問題該問題的數(shù)學(xué)模型可表示為：112212

2025-05-03 18:35

運籌學(xué)總復(fù)習(xí)ppt課件-資料下載頁

【總結(jié)】《運籌學(xué)》總復(fù)習(xí)（1）期末考試題型（2）內(nèi)容概要回顧題目類型?選擇填空(10~15分)?判斷正誤(10~15分)?線性規(guī)劃建模與計算(15~20分)?靈敏度分析(15~20分)?動態(tài)規(guī)劃建模與計算(10~15分)?圖與網(wǎng)絡(luò)求解計算(10~15分)?排隊論計算與優(yōu)化(10~15分)第1

2025-05-03 18:35

運籌學(xué)網(wǎng)絡(luò)計劃ppt課件-資料下載頁

【總結(jié)】Chapter7網(wǎng)絡(luò)計劃NetworkProgramming繪制網(wǎng)絡(luò)圖DrawworkplotNetworkParameter網(wǎng)絡(luò)的優(yōu)化OptimizationofNetwork運籌學(xué)Operations

2025-05-05 22:37

管理運籌學(xué)統(tǒng)籌ppt課件-資料下載頁

【總結(jié)】統(tǒng)籌方法第一節(jié)概述第二節(jié)統(tǒng)籌圖的組成第三節(jié)統(tǒng)籌圖的繪制第四節(jié)統(tǒng)籌圖時間參數(shù)計算統(tǒng)籌方法一、統(tǒng)籌法產(chǎn)生與發(fā)展第一節(jié)概述1956年美國杜邦建筑公司和蘭德公司發(fā)展了一種“關(guān)鍵線路法”（CriticalPathMethod，簡稱CPM）。

2025-01-10 02:34

運籌學(xué)群決策-資料下載頁

【總結(jié)】上一章所研究的多屬性決策問題是由單個決策者從有限個方案中，選擇一個決策者認為滿意的方案。其決策行為主要表現(xiàn)在單一效用函數(shù)或單一優(yōu)先關(guān)系的構(gòu)造和分析，這一類決策是所謂的獨斷型決策。但在現(xiàn)代社會生活中，實際決策的形成往往不是一個人說了算的。由于各種經(jīng)濟決策問題變得越來越復(fù)雜，在許多情況下都有必要集中一群人的智慧來共同解決決策問題。即使是人們每天碰到的日常決策，雖然本質(zhì)上不屬于群決策的范疇，但也會

2025-06-22 08:57

運籌學(xué)排隊論課件-資料下載頁

【總結(jié)】運籌學(xué)課程上海交通大學(xué)管理學(xué)院OperationResearch第八講第十二章排隊論OperationResearch第八講排隊現(xiàn)象?火車站的售票口?理發(fā)店?客戶服務(wù)電話?乘校車?港口?食堂吃飯?生產(chǎn)流水線這類現(xiàn)象的特點：顧客到來是隨機的，服務(wù)機構(gòu)對顧客的

2025-08-20 11:04

網(wǎng)絡(luò)計劃運籌學(xué)ppt課件-資料下載頁

【總結(jié)】1補充：網(wǎng)絡(luò)計劃技術(shù)(統(tǒng)籌法)基本概念確定性網(wǎng)絡(luò)計劃網(wǎng)絡(luò)圖的優(yōu)化不確定性網(wǎng)絡(luò)計劃2022/2/122一.什么是網(wǎng)絡(luò)計劃技術(shù)/統(tǒng)籌法對于任何一項生產(chǎn)制造、科學(xué)實驗、工程實施、軍事作戰(zhàn)等項目活動，為了充分利用有限的時間、空間與資源（人力、物力、財力），都必須編制一個科學(xué)的工作組織計劃來有效地組織、調(diào)度與控制該項

2025-01-17 18:45

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

運籌學(xué)決策論ppt課件-資料下載頁

運籌學(xué)決策分析1(qh)-資料下載頁

運籌學(xué)課件——第4講馬爾可夫決策-資料下載頁

運籌學(xué)動態(tài)規(guī)劃ppt課件-資料下載頁

運籌學(xué)考研試題ppt課件-資料下載頁

運籌學(xué)lpilppt課件(2)-資料下載頁

管理運籌學(xué)復(fù)習(xí)ppt課件-資料下載頁

運籌學(xué)對偶靈敏ppt課件-資料下載頁

運籌學(xué)ch信管ppt課件-資料下載頁

運籌學(xué)總復(fù)習(xí)ppt課件-資料下載頁

運籌學(xué)網(wǎng)絡(luò)計劃ppt課件-資料下載頁

管理運籌學(xué)統(tǒng)籌ppt課件-資料下載頁

運籌學(xué)群決策-資料下載頁

運籌學(xué)排隊論課件-資料下載頁

網(wǎng)絡(luò)計劃運籌學(xué)ppt課件-資料下載頁

mba運籌學(xué)頁ppt課件-資料下載頁

運籌學(xué)決策論ppt課件(已修改)

運籌學(xué)決策論ppt課件(編輯修改稿)

運籌學(xué)決策論ppt課件-wenkub.com

運籌學(xué)決策論ppt課件(已改無錯字)

運籌學(xué)決策論ppt課件-資料下載頁