freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

淘寶數(shù)據(jù)挖掘論文--以淘寶連衣裙店鋪評論數(shù)據(jù)挖掘為例(已修改)

2025-06-20 04:46 本頁面
 

【正文】 1 淘寶評論數(shù)據(jù)挖掘 以淘寶連衣裙店鋪評論數(shù)據(jù)挖掘為例 內(nèi)容摘要 數(shù)據(jù)挖掘方法能夠找到海量數(shù)據(jù)中有潛在價值的知識與模式 ,所用到的數(shù)學(xué)算法在經(jīng)過多年完善修正已經(jīng)日趨穩(wěn)定 ,在金融、電信等領(lǐng)域的應(yīng)用也有很多的成功案例。近年隨著電商的發(fā)展,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)上的應(yīng)用也逐漸受到關(guān)注,主要應(yīng)用的方向是淘寶用戶的消費行為偏好的研究。 本文嘗試使用數(shù)據(jù)分析的方法、借助數(shù)據(jù)挖掘工具,對淘寶上 150 家不同消費層次連衣裙店鋪的評論進(jìn)行挖掘分析,旨在從淘寶用戶的評論中發(fā)現(xiàn)不同消費層次的消費者對連衣裙消 費的關(guān)注點以及影響因素。同時以淘寶評論數(shù)據(jù)挖掘為例子希望能拓展數(shù)據(jù)挖掘應(yīng)用于淘寶數(shù)據(jù)挖掘上的研究 ,以提供新的思路與借鑒。 關(guān)鍵詞 : 數(shù)據(jù)挖掘,文本分析,淘寶評價,分詞,詞頻統(tǒng)計 Abstract Data mining is able to find out the potential value and knowledge of mass data and the mathematical algorithms of it used in recent years has bee stable, the application in the fields of finance,telemunications and others also have many success in the field of microblog user interest,it has not yet using maturely. Recent years,with the development of electricity merce,the application of data mining technology in electronic merce has gradually been concerned,those research is mainly used in consumer behavior of Taobao user . This paper attempts to explore Taobao consumer habits,consumer preferences and preferences with data analysis method and data mining tools,meanwhile, I hope to expand the application scope of data mining in Taobao user reviews research and provide new ideas and references. 2 Key words: data mining ,text analysis,Taobao evaluation,participle,Word frequency 目錄 1 研究背景 1 研究意義 3 研究方法 3 文本采集工具 3 文本預(yù)處理以及分析 4 文獻(xiàn)綜述 4 4 數(shù)據(jù)挖掘概念 4 數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)分析的區(qū)別 5 數(shù)據(jù)挖掘方法 5 聚類分析 6 聚類分析的概念 6 聚類分析的算法 6 6 淘寶評論的概述 7 連衣裙消費者分類特征的發(fā)現(xiàn)與分類模型的建立 7 連衣裙消費者分類特征的發(fā)現(xiàn) 7 連衣裙評論分類模型的建立 10 11 淘寶評論數(shù) 據(jù)挖掘 11 樣本的確定 11 評論挖掘 12 淘寶評論數(shù)據(jù)預(yù)處理 12 淘寶評論數(shù)據(jù)的篩選統(tǒng)計 13 淘寶評論的分析 18 Kmeans 快速聚類 18 3 分析結(jié)論 21 22 參考文獻(xiàn) 23 后記 24 致謝 24 1 研究背景 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展與成熟,目前,互聯(lián)網(wǎng)的應(yīng)用顯然已經(jīng)成為改變?nèi)藗兩盍?xí)慣、生活狀況的主要產(chǎn)業(yè)。隨著阿里巴巴在美國的上市,電子商務(wù)已經(jīng)成為促進(jìn)經(jīng)濟發(fā)展一支強大的力量。 2021 年 2 月 3 日,中國互聯(lián)網(wǎng)絡(luò)信息中心( CNNIC)在京發(fā)布第 35次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》(以下簡稱《報告》)?!秷蟾妗凤@示,截至 2021 年 12 月,我國網(wǎng)民規(guī)模達(dá) 億,互聯(lián)網(wǎng)普及率為 %,具體如圖 。互聯(lián)網(wǎng)普及的同時,網(wǎng)絡(luò)購物人群也在增長,截至 2021 年 12 月中國網(wǎng)絡(luò)購物規(guī)模 已經(jīng)達(dá)到 36142 萬人,網(wǎng)民使用率高達(dá) % ,圖 顯示 20212021 年中國網(wǎng)購交易額一年年增長趨勢。圖 2021 年中國網(wǎng)絡(luò)購物市場用戶購買商品品類分布圖中可以看到服裝鞋帽類是網(wǎng)購中占最大比例的,高達(dá) %。 圖 Chinese Inter users and Inter peration 2 圖 20212021 年中國網(wǎng)購交易金額及增長率 20212021 China39。s online shopping transaction amount and growth rate 圖 2021 年中國網(wǎng)絡(luò)購物市場用戶購買商品品類分布 Figure 2021 Distribution of china’s online shopping product categories 近年來,電子商務(wù)快速發(fā)展,使得越來越多的傳統(tǒng)企業(yè)看到了電子商務(wù)的發(fā)展?jié)摿Γ?zhàn)略市場轉(zhuǎn)向網(wǎng)絡(luò)商城,使得網(wǎng)絡(luò)店鋪數(shù)量如雨后春筍一般。然而消費者在 3 網(wǎng)絡(luò)購物中的行為與在實體店中的購物行為是有 巨大差別的,其中比較顯著的差別便是產(chǎn)品評論,基于淘寶評論的數(shù)據(jù)挖掘研究淘寶消費者的評論顯示出的影響購物者消費的因素,對淘寶評論的數(shù)據(jù)挖掘能幫助商家了解用戶購物行為,從而調(diào)整店鋪的經(jīng)營策略,實現(xiàn)更多盈利。 研究意義 本文以淘寶連衣裙為例,挖掘不同層次的消費者對于在淘寶上對于其購買的連衣裙的評價,通過數(shù)據(jù)挖掘算法中的 k中心算法和關(guān)聯(lián)規(guī)則算法對這些評價進(jìn)行分類,從評價的分類中將消費者劃分為幾個類別,分析不同類別的消費者網(wǎng)購連衣裙的影響因素,使得淘寶賣家更加了解用戶的購物行為,從而為淘寶賣家提出提高營業(yè) 額的策略。 研究方法 文本采集工具 本文中淘寶評論的數(shù)據(jù)是通過八爪魚采集器進(jìn)行采集的。采集流程如圖 。通過該流程采集提取淘寶網(wǎng)頁中的評論文本,采集后的數(shù)據(jù)以 .xls 文件格式保存。 圖 八爪魚淘寶數(shù)據(jù)采集流程圖 Data Acquisition flowchart 4 文本預(yù)處理以及分析 本次研究文本預(yù)處理主要通過 WORD 以及 EXCEL 這兩個軟件,首先將保存的數(shù)據(jù)在EXCEL 中利用宏功能將沒有規(guī)則的文本進(jìn)行分詞處理,再將劃分好的詞導(dǎo)出到 WORD 中進(jìn)行詞語的篩選以及格式的去除,分詞中無用的詞語剔除,然后保存為純文本。接著再利用 EXCEL 對分詞好的文本進(jìn)行詞頻計算統(tǒng)計,以及比率計算,也就是對文本進(jìn)行量化處理。 文本預(yù)處理結(jié)束后利用 SPSS 軟件對評價進(jìn)行分析,首先利用 Pearson 算法進(jìn)行相關(guān)性分析,驗證樣本的相關(guān)性,并判斷是否需要降維處理。相關(guān)性分析結(jié)束后,進(jìn)行聚類分析,利用 K 平均值聚類算法對數(shù)據(jù)進(jìn)行一輪分類,再接著用利用系統(tǒng)聚類算法對數(shù)據(jù)進(jìn)行二次分類。 文獻(xiàn)綜述 數(shù)據(jù)挖掘的概述以及淘寶評論分類模型的構(gòu)建主要是通過 閱讀大量文獻(xiàn)整理得出的。 數(shù)據(jù)挖掘概念 隨著人們對數(shù)據(jù)的深入了解及廣泛使用,現(xiàn)在人們對數(shù)據(jù)的定義不僅僅是對事物定性或定量的記錄,事實上數(shù)據(jù)還應(yīng)包括信息和知識等。信息和知識可以反映為某些行為以及現(xiàn)象,我們需要從海量并且真實的數(shù)據(jù)中提取出可以為人類所用,并且是針對用戶興趣的信息和知識,最終為可以服務(wù)于人類的潛在的信息和知識。 互聯(lián)網(wǎng)發(fā)展快速的時代,信息時刻處于爆炸狀態(tài),面對豐富的信息資源,人類如何高效地找出對自己有價值的數(shù)據(jù)成為了亟待
點擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1