freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

機(jī)器學(xué)習(xí)中距離與相似度度量(編輯修改稿)

2025-09-11 22:15 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 0,1] 特點(diǎn): 對(duì)不同特征維度進(jìn)行伸縮變換 改變?cè)紨?shù)據(jù)的分布。使各個(gè)特征維度對(duì)目標(biāo)函數(shù)的影響權(quán)重是一致的) 對(duì)目標(biāo)函數(shù)的影響體現(xiàn)在數(shù)值上 把有量綱表達(dá)式變?yōu)闊o(wú)量綱表達(dá)式 。 列 行 馬式距離 若協(xié)方差矩陣是單位矩陣(各個(gè)樣本向量之間獨(dú)立同分布) ,則公式就成了: 則 Xi與 Xj之間的馬氏距離等于他們的歐氏距離。 即:若協(xié)方差矩陣是對(duì)角矩陣,公式變成了標(biāo)準(zhǔn)化歐氏距離。 標(biāo)準(zhǔn)化歐氏距離是在假設(shè)數(shù)據(jù) 各個(gè)維度不相關(guān) 的情況下,利用數(shù)據(jù)分布的特性計(jì)算出不同的距離。如果維度相互之間數(shù)據(jù)相關(guān)(例如:身高較高的信息很有可能會(huì)帶來(lái)體重較重的信息,因?yàn)閮烧呤怯嘘P(guān)聯(lián)的),就要用到 馬氏距離 相似度度量 相似度度量( Similarity),即計(jì)算個(gè)體間的相似程度,與距離度量相反, 相似度度量的值越小 ,說(shuō)明個(gè)體間相 似度越小 , 差異越大。 兩個(gè)向量越相似,向量夾角越小,余弦值的絕對(duì)值越大;值為負(fù),兩向量負(fù)相關(guān)。 應(yīng)用:文本的相似度和推薦系統(tǒng)等。 余弦相似度 舉個(gè)簡(jiǎn)單栗子 : 句子 A: 這只皮靴號(hào)碼大了。那只號(hào)碼合適 句子 B: 這只皮靴號(hào)碼不小,那只更合適 怎樣計(jì)算上面兩句話(huà)的相似程度? 基本思路 :如果這兩句話(huà)的用詞越相似,它們的內(nèi)容就應(yīng)該越相似。因此,可以從詞頻入手,計(jì)算它們的相似程度。 第一步,分詞 。 句子 A: 這只 /皮靴 /號(hào)碼 /大了。那只 /號(hào)碼 /合適。 句子 B: 這只 /皮靴 /號(hào)碼 /不 /小,那只 /更 /合適。 第二步,列出所有的詞。 這只,皮靴,號(hào)碼,大了。那只,合適,不,小,很 第三步,計(jì)算詞頻。 句子 A: 這只 1,皮靴 1,號(hào)碼 2,大了 1。那只 1,合適 1,不 0,小 0,更 0 句子 B: 這只 1,皮靴 1,號(hào)碼 1,大了 0。那只 1,合適 1,不 1,小 1,更 1 第四步,寫(xiě)出詞頻向量。 句子 A: (1, 1, 2, 1, 1, 1, 0
點(diǎn)擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1