freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

機(jī)器學(xué)習(xí)研究-文庫吧資料

2024-08-01 19:44本頁面
  

【正文】 能有不同的用戶共享,而不同用戶需要不同的解答。 ? 傳統(tǒng)的統(tǒng)計(jì)分析方法不能滿足這些要求,需要研究觀測數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。 復(fù)雜數(shù)據(jù)分析的要求 ? 需要考慮每個(gè)被觀測 (積累 )數(shù)據(jù)在這個(gè)領(lǐng)域中所扮演的角色。 ? 隨著獲得數(shù)據(jù)越來越容易,這個(gè)問題將越來越突出。 ? 對一定的需求,在保持需求信息不丟失的條件下,減少數(shù)據(jù)長度是閱讀數(shù)據(jù)的必要條件。 ? 假設(shè)每頁 A4有 1000字符,這大約 1035頁。 ? 人類閱讀數(shù)據(jù)能力是有限的,需要計(jì)算機(jī)幫助。 ? 醫(yī)療診斷、零售業(yè)的各種問題、經(jīng)濟(jì)分析等專家系統(tǒng)所面臨的問題就于此有關(guān)。 ? 情報(bào)分析:尋找不同常規(guī)行為的事件。 ? 電信業(yè):對長久大戶的特殊服務(wù),對電信業(yè)至關(guān)重要。 ? 個(gè)別事件可能比統(tǒng)計(jì)顯現(xiàn)的事件更為重要。 基于統(tǒng)計(jì)的數(shù)據(jù)分析不能滿足需求 ? 在某些行業(yè),僅僅依賴積累的數(shù)據(jù)所建立的模型不能準(zhǔn)確地預(yù)測未來。但是,這些數(shù)據(jù)的積累也帶來副作用,一方面,消耗大量資源,另一方面,無法使用的數(shù)據(jù),就是垃圾。 ? R 復(fù)雜數(shù)據(jù)分析 ?復(fù)雜數(shù)據(jù)分析的一般性說明 ?符號機(jī)器學(xué)習(xí) 復(fù)雜數(shù)據(jù)分析 一類需求 ? 機(jī)器學(xué)習(xí)研究方興未艾,還有大量的理論與技術(shù)問題未解決。 ? 建立了從數(shù)據(jù)到分布的基本方法。 為什么吸引人 ?弱分類器比強(qiáng)分類器設(shè)計(jì)簡單 ?以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ) Vapnik的貢獻(xiàn) ? 給出了可以指導(dǎo)機(jī)器學(xué)習(xí)算法設(shè)計(jì)的泛化理論。 集成 ? 在分類時(shí),采用投票的方式?jīng)Q定新樣本屬于哪一類。 弱分類器 ?如果一個(gè)分類器的分類能力 (泛化 )稍大于 50%,這個(gè)分類器稱為弱分類器。 集成機(jī)器學(xué)習(xí) ? 1990年 Shapire證明,如果將多個(gè)弱分類器集成在一起,它將具有強(qiáng)分類器的泛化能力。 集成機(jī)器學(xué)習(xí)動(dòng)機(jī) ? 弱分類器設(shè)計(jì)簡單。 ? 措施: ? 軟邊緣:將邊緣改為軟性 (有個(gè)范圍 ),以適應(yīng)需要。 ? 集成機(jī)器學(xué)習(xí) 。 ? 技術(shù)措施:同時(shí)考慮不滿足一致性假設(shè)的情況。 ? 準(zhǔn)確地說,加大特征空間維數(shù)是一個(gè)方法,確定最小維數(shù)沒有 P算法。 ? 最大邊緣盡量大,也決定于核函數(shù)的選擇。 ? 這就是 SVM。 SVM ? 給定核函數(shù),如果它可以保證將樣本集合在特征空間變換為兩個(gè)不相交的閉凸集,則對這個(gè)樣本集合的最大邊緣可以通過二次規(guī)劃、計(jì)算幾何等方法獲得。 核技術(shù) ? 可以證明,一定存在一個(gè)映射,稱為核函數(shù),將在歐式空間定義的樣本映射到特征空間 (一個(gè)更高維的空間 ),使得在特征空間上,樣本構(gòu)成兩個(gè)不相交的閉凸集。 線性不可分問題 ?劃分問題:怎樣獲得兩個(gè)不相交的閉凸集。 泛化能力的幾何解釋 (示意圖 ) 線性可分問題 ? 定理: ? 如果一個(gè)樣本集合是線性可分的,它們一定可以構(gòu)成兩個(gè)不相交的閉凸集。泛化能力可以使用樣本集合的邊緣來刻畫。這意味著,樣本集合必須是可劃分的。 ? 這是統(tǒng)計(jì)機(jī)器學(xué)習(xí)理論的精髓。 ? 由此,建立基于樣本集合結(jié)構(gòu)的 VC維來描述的理論。 Vapnik的統(tǒng)計(jì)觀點(diǎn) ? Vapnik希望改變 Duda的統(tǒng)計(jì)觀點(diǎn)。 ? 事實(shí)上, Vapnik的統(tǒng)計(jì)理論才是其精華,而基于這個(gè)理論的算法只是從這個(gè)統(tǒng)計(jì)理論派生的自然結(jié)果。 統(tǒng)計(jì)機(jī)器學(xué)習(xí)理論與 SVM ? 對機(jī)器學(xué)習(xí)的研究者來說,統(tǒng)計(jì)機(jī)器學(xué)習(xí)理論所派生的算法 SVM似乎更有吸引力。 ? 這項(xiàng)研究的意義是為研究者回歸感知機(jī)做好了輿論的準(zhǔn)備。 ? 劃分是機(jī)器學(xué)習(xí)的一個(gè)目標(biāo),但是,不是預(yù)測任務(wù)的主要研究目標(biāo)。 ? 直到今天,還有大量的學(xué)者以此作為機(jī)器學(xué)習(xí)的指導(dǎo)思想。 ? 這樣,注重從劃分變?yōu)榉夯? ? 在感知機(jī)時(shí)代,基于 Duda泛化理論無法指導(dǎo)機(jī)器學(xué)習(xí)算法的設(shè)計(jì),這樣,評價(jià)機(jī)器學(xué)習(xí)算法只能以劃分能力作為指標(biāo)。 評述 ? 由于人們沒有找到基于樣本集合 Q的描述泛化能力的數(shù)學(xué)工具。 ?泛化能力需要使用世界 W來刻畫,是無法構(gòu)造的判據(jù)。 ? 由于可能存在不同的劃分樣本集合方法,其泛化能力不同,泛化能力最強(qiáng)的劃分就是我們希望的分類器。只有找到一個(gè)等價(jià)關(guān)系
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1