freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

什么是智能體(編輯修改稿)

2024-09-01 02:22 本頁面
 

【文章內(nèi)容簡介】 、圖象處理、人工生命、遺傳編碼和機器學(xué)習(xí)等方面獲得了廣泛的運用。流程圖:1 強化學(xué)習(xí)在實際應(yīng)用中的困難?強化學(xué)習(xí)吸引人的特點之一在于其形式化的基礎(chǔ)。如果某個條件(比如無限次的嘗試和一個馬爾可夫環(huán)境)滿足,智能體將收斂到一個最佳的動作選擇策略。不幸的是,這些條件在復(fù)雜的環(huán)境中幾乎無法滿足,強化學(xué)習(xí)有下面幾個困難:(1) 不能處理隨時間變化的目標(biāo),學(xué)習(xí)到的動作策略是針對一個固定目標(biāo)集的;(2) 如果目標(biāo)改變,就不得不重新學(xué)習(xí)一切(3) 對實際應(yīng)用來說,狀態(tài)空間太大,以至于學(xué)習(xí)要花很多的時間才能變得有效(4) 只有當(dāng)接收到一個獎勵的時候,智能體才能夠開始學(xué)習(xí)導(dǎo)致那個獎勵的動作序列,而且結(jié)果是花費大量的時間去學(xué)習(xí)很長的動作序列(5) 對于錯誤的感知或隱藏的狀態(tài),在任何時間智能體都難于知道它處在什么情形下(6) 很難把初始知識融入到學(xué)習(xí)中(7) 當(dāng)并行采用多個動作的時候,智能體不能夠再學(xué)習(xí)1 學(xué)習(xí)與進化之間的關(guān)系(1) 進化與學(xué)習(xí)是生物適應(yīng)的兩種形式(2) 在空間和時間上不同。進化是“一個選擇性繁殖與替代的過程”,它依賴于分布式個體群的存在;學(xué)習(xí)是“一組發(fā)生在個體生命期內(nèi)的修正”。(3) 進化是“一種能抓住相對較慢的可能包括幾個生物代的環(huán)境變化的適應(yīng)形式”;學(xué)習(xí)“使得個體去適應(yīng)在同一代層上不可預(yù)測的環(huán)境變化”(4) 相互影響1 模擬機器人開發(fā)中會遇到的問題,為什么要使用模擬機器人?模擬機器人開發(fā)會遇到的問題:(1) 傳感器:物理傳感器不能從背景中分離對象,它們不是在穩(wěn)定的坐標(biāo)系統(tǒng)中起作用,而且不能提供關(guān)于目標(biāo)絕對位置的信息。(2) 模擬通常不考慮真實智能體在其環(huán)境中交互的所有物理規(guī)則,質(zhì)量、摩擦、慣性等(3) 物理傳感器把不確定的值與命令傳遞給可能有不確定效果的執(zhí)行器,而在模擬中通常使用格子環(huán)境以及返回正確信息的傳感器。(4) 電流與機械方面的差異,在機器人上位置不同可能有不同的性能使用模擬機器人的原因:學(xué)習(xí)常常要求用偶爾產(chǎn)出不可接受的結(jié)果的行為來實驗。在真實的物理系統(tǒng)中出錯成本可能非常昂貴甚至是危險的。1 自組織的特征(1) 信息共享系統(tǒng)中每一個單元都掌握全套的“游戲規(guī)則”和行為準(zhǔn)則,這一部分信息相當(dāng)于生物DNA中的遺傳信息,為所有的細(xì)胞所共享; (2
點擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1