freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

機器學習中距離與相似度度量(編輯修改稿)

2025-09-11 22:15 本頁面
 

【文章內容簡介】 0,1] 特點: 對不同特征維度進行伸縮變換 改變原始數據的分布。使各個特征維度對目標函數的影響權重是一致的) 對目標函數的影響體現在數值上 把有量綱表達式變?yōu)闊o量綱表達式 。 列 行 馬式距離 若協方差矩陣是單位矩陣(各個樣本向量之間獨立同分布) ,則公式就成了: 則 Xi與 Xj之間的馬氏距離等于他們的歐氏距離。 即:若協方差矩陣是對角矩陣,公式變成了標準化歐氏距離。 標準化歐氏距離是在假設數據 各個維度不相關 的情況下,利用數據分布的特性計算出不同的距離。如果維度相互之間數據相關(例如:身高較高的信息很有可能會帶來體重較重的信息,因為兩者是有關聯的),就要用到 馬氏距離 相似度度量 相似度度量( Similarity),即計算個體間的相似程度,與距離度量相反, 相似度度量的值越小 ,說明個體間相 似度越小 , 差異越大。 兩個向量越相似,向量夾角越小,余弦值的絕對值越大;值為負,兩向量負相關。 應用:文本的相似度和推薦系統(tǒng)等。 余弦相似度 舉個簡單栗子 : 句子 A: 這只皮靴號碼大了。那只號碼合適 句子 B: 這只皮靴號碼不小,那只更合適 怎樣計算上面兩句話的相似程度? 基本思路 :如果這兩句話的用詞越相似,它們的內容就應該越相似。因此,可以從詞頻入手,計算它們的相似程度。 第一步,分詞 。 句子 A: 這只 /皮靴 /號碼 /大了。那只 /號碼 /合適。 句子 B: 這只 /皮靴 /號碼 /不 /小,那只 /更 /合適。 第二步,列出所有的詞。 這只,皮靴,號碼,大了。那只,合適,不,小,很 第三步,計算詞頻。 句子 A: 這只 1,皮靴 1,號碼 2,大了 1。那只 1,合適 1,不 0,小 0,更 0 句子 B: 這只 1,皮靴 1,號碼 1,大了 0。那只 1,合適 1,不 1,小 1,更 1 第四步,寫出詞頻向量。 句子 A: (1, 1, 2, 1, 1, 1, 0
點擊復制文檔內容
規(guī)章制度相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1