freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘?qū)嶒瀳蟾?22443)(已修改)

2024-08-21 01:29 本頁面
 

【正文】 數(shù)據(jù)挖掘?qū)嶒瀳蟾妗訖?quán)K近鄰法 一、 數(shù)據(jù)源說明1. 數(shù)據(jù)理解數(shù)據(jù)來自于天貓對顧客的BuyOrNot(買與不買),BuyDNactDN(消費活躍度),ActDNTotalDN(活躍度),BuyBBrand(成交有效度),BuyHit(活動有效度)這五個變量的統(tǒng)計。數(shù)據(jù)分成兩類數(shù)據(jù),一類作為訓(xùn)練數(shù)據(jù)集,一類為測試數(shù)據(jù)集。現(xiàn)實世界的數(shù)據(jù)一般是不完整的、有噪聲的和不一致的。數(shù)據(jù)清理例程試圖填充缺失的值,光滑噪聲并識別離群點,并糾正數(shù)據(jù)中的不一致。a) 缺失值:當數(shù)據(jù)中存在缺失值是,忽略該元組b) 噪聲數(shù)據(jù):本文暫沒考慮。二、 基于變量重要性的加權(quán)K近鄰法[1]由于我們計算K近鄰法默認輸入變量在距離測度中有“同等重要”的貢獻,但情況并不總是如此。我們知道不同的變量對我們所要預(yù)測的變量的作用是不一定一樣的,所以找出對輸出變量分類預(yù)測有意義的重要變量對數(shù)據(jù)預(yù)測具有重要作用。同時也可以減少那些對輸出變量分類預(yù)測無意義的輸入變量,減少模型的變量。為此,采用基于變量重要性的K近鄰法,計算加權(quán)距離,給重要的變量賦予較高的權(quán)重,不重要的變量賦予較低的權(quán)重是必要的。(1)算法思路:我們引進為第i個輸入變量的權(quán)重,是輸入變量重要性(也稱特征重要性),F(xiàn)I函數(shù),定義為:。其中為第i個輸入變量的特征重要性,這里,依第i個輸入變量對預(yù)測誤差的影響定義。設(shè)輸入變量集合包含p個變量:。剔除第i個變量后計算輸入變量的誤判率,記為。若第i個變量對預(yù)測有重要作用,剔除變量
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1