freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

機(jī)器學(xué)習(xí)中距離與相似度度量(專業(yè)版)

2024-09-21 22:15上一頁面

下一頁面
  

【正文】 當(dāng)然,這一特性也有它的好處,無法計算 pearson系數(shù)可以認(rèn)為這兩組數(shù)據(jù)沒有任何相關(guān)性。那只 1,合適 1,不 1,小 1,更 1 第四步,寫出詞頻向量。 標(biāo)準(zhǔn)化歐氏距離是在假設(shè)數(shù)據(jù) 各個維度不相關(guān) 的情況下,利用數(shù)據(jù)分布的特性計算出不同的距離。 該距離最常用的 p 是 2 和 1, 無窮大 ?P=2是 歐幾里得距離 ( Euclidean distance), ?P=1是 曼哈頓距離 ( Manhattan distance)。 ?當(dāng) p 趨近于無窮大時,閔可夫斯基距離轉(zhuǎn)化成 切比雪夫距離 ( Chebyshev distance) 閔可夫斯基距離 pnkpkk xx1121 ?????????缺點: 舉個栗子 二維樣本 (身高 ,體重 ),其中身高范圍是 150~190,體重范圍是 50~60,有三個樣本: a(180,50), b(190,50),c(180,60)。如果維度相互之間數(shù)據(jù)相關(guān)(例如:身高較高的信息很有可能會帶來體重較重的信息,因為兩者是有關(guān)聯(lián)的),就要用到 馬氏距離 相似度度量 相似度度量( Similarity),即計算個體間的相似程度,與距離度量相反, 相似度度量的值越小 ,說明個體間相 似度越小 , 差異越大。 句子 A: (1, 1, 2, 1, 1, 1, 0, 0, 0) 句子 B: (1, 1, 1, 0, 1, 1, 1, 1, 1) 第五步,使用公式計算相似度 計算結(jié)果:夾角的余弦值為 ,非常接近于 1,所以,上面的句子 A和句子 B是基本相似的 ( 1)歐氏距離從向量間的 絕對距離 區(qū)分差異,計算得到的相似度值對向量各個維度內(nèi)的 數(shù)值特征非常敏感 ,而余弦夾角從向量間的 方向夾角 區(qū)分差異,對向量各個維度內(nèi)的 數(shù)值特征不敏感 ,所以同時修正了用戶間可能存在的度量標(biāo)準(zhǔn)不統(tǒng)一的問題。 絕對數(shù)值不敏感 考慮這三組數(shù)據(jù), a:(1,2,3,4) b:(40,50,70,80) c:(50,60,70,80),我們可以直觀的
點擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1