【正文】
ities, we have the tendency to divide a problem into welldefined pieces, and make progress on each one. But as we make progress, the problems tend to move away from each other.” —— Daphne Koller, 2023 80 解決鴻溝的主要思路 ?Daphne Koller教授圍繞著如何解決上述問題(即填補高層推理與底層數(shù)據(jù)解釋之間的“鴻溝”),提出一種解決方法,就是建立連接的三座 “概念橋梁”( Conceptual bridges),分別是: – 表示 ( Representation) – 推理 ( Reasoning) – 學習 ( Learning) 81 解決鴻溝的主要思路(續(xù) 1) ?另一種代表性的解決方法是,美國德克薩斯大學奧斯汀分校( University of Texas at Austin)的 Peter Stone在 2023年獲得 IJCAI07的“ Computers and Thought Award”杰出青年大獎時所作的學術(shù)報告 – Peter Stone. Learning and multiagent reasoning for autonomous agents. In: Proceedings of 2023 International Joint Conference on Artificial Intelligence (IJCAI07), . 82 解決鴻溝的主要思路(續(xù) 2) ? 建立 完全自主的 Agents( Complete autonomous agents) ,這些 Agents具有高度的魯棒性和靈活性,它們可感知環(huán)境,進行高層認知和決策,在環(huán)境中進行自主執(zhí)行,即具有學習、交互、組合及合作等能力。他認為這種研究方法可分為兩條基本路線: – 基本算法研究 ,主要包括機器學習、多 Agents系統(tǒng)( MAS); – 應(yīng)用研究 ,主要包括實現(xiàn)面向特定的復(fù)雜環(huán)境的完全自主 Agents,以及從面向特定應(yīng)用的自主 Agents實現(xiàn)中總結(jié)發(fā)現(xiàn)普遍規(guī)律。 83 解決鴻溝的主要思路(續(xù) 3) ?美國華盛頓大學的 Pedro Domings教授提出的馬爾可夫邏輯網(wǎng)絡(luò)( Markov Logic Networks) – 將謂詞邏輯與統(tǒng)計學習方法有機地結(jié)合起來 – 可填補 AI中存在的高層與底層之間的鴻溝 84 完全自主 Agent的關(guān)鍵技術(shù) ? Peter Stone還指出,自從 1983年 Tom Mitchell獲得“ Computers and Thought Award”杰出青年大獎并做了關(guān)于機器學習的學術(shù)報告后,從機器學習的觀點來看,面向分類和預(yù)測的 有監(jiān)督學習 ( Supervised learning)方法得到了極大發(fā)展,并涌現(xiàn)出很多通用的工具包。同時,面向數(shù)據(jù)聚類的 無監(jiān)督學習 ( Unsupervised learning)方法也取得了很大進展。 ? 然而,從自主 Agents的觀點來看,最近出現(xiàn)的 增強學習( Reinforcement learning) 似乎更加重要,因為增強學習在很多序列決策問題中能夠自主收集所需要的訓練數(shù)據(jù),學習到將狀態(tài)映射為行為的策略,并從延遲獎賞中( Delayed reward)學習如何選擇正確的行為,它實現(xiàn)了探索( Exploration)與開發(fā)( Exploitation)之間的權(quán)衡。 85 完全自主 Agent的主要應(yīng)用 ? Peter Stone給出了當前完全自主 Agents的四個主要應(yīng)用領(lǐng)域,分別是: – 足球機器人 ( Robot soccer) – 無人駕駛車輛 ( Autonomous vehicles) – 拍賣 Agents( Bidding agents) – 自主計算 ( Autonomic puting)。 – 其中,機器人足球和無人駕駛車輛是屬于“物理Agents”( Physical agents),而拍賣 Agents和自主計算則屬于“軟件 Agents”。這些應(yīng)用充分展示了機器學習與多 Agents推理的緊密結(jié)合,它涉及自適應(yīng)及層次表達、分層學習、 遷移學習( Transfer learning) 、自適應(yīng)交互協(xié)議、 Agent建模等關(guān)鍵技術(shù)。 86 課外閱讀論文(可選 1- 2篇): ? Wooldridge M, Jennings N R. Intelligent agents: theory and practice. Knowledge Engineering Review, 1995, 10(2): 115152 ? Jennings N R, Sycara K, Wooldridge M. A roadmap of agent research and development. Autonomous Agents and MultiAgent Systems. Boston: Kluwer Academic Publishers, 1998, 275306 ? Peter Stone. Learning and multiagent reasoning for autonomous agents. In: Proceedings of 2023 International Joint Conference on Artificial Intelligence (IJCAI07), 87 其它值得研讀的論文(可選): ? Intelligent agents: theories, architectures, and languages. ? Mobile software agents: an overview. ? A mobile agent based service architecture for Inter telephony. ? A mobile agentbased advanced service architecture for wireless Inter telephony: design, implementation, and evaluation. ? Intelligent agents on the Web: a review. 【 注 】 :上述論文一般均可通過 google搜索到 。 88 歡迎批評指正, 謝謝! 89 演講完畢,謝謝觀看!