freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

華中地區(qū)數(shù)學(xué)建模比賽一等獎(jiǎng)-全文預(yù)覽

  

【正文】 第三屆華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請(qǐng)賽題目: 互聯(lián)網(wǎng)論壇用戶的識(shí)別與探究 【摘 要】互聯(lián)網(wǎng)論壇已經(jīng)成為互聯(lián)網(wǎng)企業(yè)與用戶、,運(yùn)用網(wǎng)絡(luò)神采軟件對(duì)論壇信息進(jìn)行數(shù)據(jù)挖掘(采集過(guò)程見(jiàn)附錄三),建立模型分別對(duì)言論領(lǐng)袖、話題用戶、活躍用戶和關(guān)系圈這四個(gè)方面進(jìn)行了識(shí)別.(1)對(duì)于言論領(lǐng)袖的識(shí)別:首先,運(yùn)用網(wǎng)絡(luò)神采軟件從網(wǎng)站上搜集得到相應(yīng)的數(shù)據(jù),提取發(fā)帖數(shù)、精華貼數(shù)、瀏覽數(shù)和跟帖數(shù)的多個(gè)用戶的數(shù)據(jù)信息,再運(yùn)用多種科學(xué)的手段篩選出可能是言論領(lǐng)袖的網(wǎng)絡(luò)用戶, 針對(duì)影響用戶成為言論領(lǐng)袖幾個(gè)主要因素,建立了層次分析模型,判斷出誰(shuí)最有可能是言論領(lǐng)袖.(2)對(duì)于話題用戶的識(shí)別:本文從跟帖主題和談?wù)搩?nèi)容等方面進(jìn)行考慮,建立了關(guān)鍵字識(shí)別模型,首先對(duì)某一特定話題進(jìn)行模糊處理,得到關(guān)鍵詞及關(guān)鍵詞的近義詞所組成的集合;然后對(duì)某一時(shí)間段內(nèi)的主題帖標(biāo)題進(jìn)行檢索,所討論話題關(guān)鍵詞及近義詞的主貼的集合;最后,對(duì)上述步驟所出現(xiàn)的用戶組成集合,取出現(xiàn)頻數(shù)的均值,高于均值的用戶即為可能的話題用戶.(3)對(duì)于活躍用戶的識(shí)別:本文建立了模糊決策模型,對(duì)論壇用戶的各指標(biāo)數(shù)據(jù)無(wú)綱量化處理后,在進(jìn)行模糊隸屬度排序得到用戶的隸屬度活躍程度綜合水平的高低排序. (4)對(duì)于關(guān)系圈的識(shí)別:針對(duì)某一個(gè)用戶的關(guān)系圈,本文通過(guò)對(duì)戶主的每一個(gè)帖子所有的回復(fù)用戶進(jìn)行統(tǒng)計(jì),采用一定的篩選流程,運(yùn)用Excel統(tǒng)計(jì)軟件,就可以找到與戶主經(jīng)常聯(lián)系的用戶,即可以得到戶主的關(guān)系圈.本文主要圍繞網(wǎng)絡(luò)論壇上各種用戶的識(shí)別,通過(guò)軟件對(duì)數(shù)據(jù)進(jìn)行挖掘,建立層次分析模型及模糊決策模型,再結(jié)合MATLAB軟件進(jìn)行合理的求解.關(guān)鍵詞:數(shù)據(jù)挖掘,用戶識(shí)別,層次分析模型,模糊決策模型一、問(wèn)題重述中國(guó)互聯(lián)網(wǎng)經(jīng)歷了十年的快速增長(zhǎng)期,進(jìn)而已經(jīng)成為互聯(lián)網(wǎng)域用戶、,本文將圍繞互聯(lián)網(wǎng)用戶識(shí)別,重點(diǎn)解決以下幾個(gè)問(wèn)題:根據(jù)論壇所發(fā)帖子的跟帖數(shù)量、精華貼數(shù)、置頂時(shí)間、發(fā)帖總數(shù)等變量切入,發(fā)現(xiàn)言論領(lǐng)袖,并進(jìn)行綜合評(píng)價(jià).依據(jù)跟帖主題、談?wù)搩?nèi)容判斷話題用戶的定位,大概識(shí)別出話題用戶.通過(guò)登陸頻率、參與話題數(shù)量等方面綜合評(píng)價(jià)出活躍用戶.從帖子關(guān)聯(lián)關(guān)系等方面綜合評(píng)價(jià),發(fā)掘人際關(guān)系圈.二、問(wèn)題分析本文以論壇用戶為研究對(duì)象,通過(guò)利用多種統(tǒng)計(jì)軟件對(duì)論壇信息進(jìn)的行數(shù)據(jù)挖掘,建立數(shù)學(xué)模型,達(dá)到對(duì)言論領(lǐng)袖、話題用戶、活躍用戶和關(guān)系圈這四個(gè)方面的識(shí)別.首先,針對(duì)言論領(lǐng)袖的識(shí)別,可以搜集得到論壇用戶所發(fā)的帖子數(shù)、跟帖數(shù)、精華貼數(shù)等數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行初步篩選得到更有可能成為言論領(lǐng)袖的部分用戶,然后擬定運(yùn)用層次分析法分析得到樣本中的言論領(lǐng)袖,達(dá)到識(shí)別言論領(lǐng)袖的目的.然后,針對(duì)話題用戶的識(shí)別,關(guān)注某一話題的用戶的定位從其跟帖的主題、談?wù)搩?nèi)容來(lái)判斷,找出與話題有關(guān)的關(guān)鍵詞,然后將利用編程對(duì)一篇回帖中出現(xiàn)關(guān)鍵詞的頻率進(jìn)行統(tǒng)計(jì),出現(xiàn)頻率高的自然是話題用戶.再次,針對(duì)活躍用戶的識(shí)別,就是要將待選用戶按照一定指標(biāo)進(jìn)行排序,然后,基于量化后的指標(biāo)值,隸屬度越大則條件越理想.最后,針對(duì)關(guān)系圈的識(shí)別,本文擬通過(guò)對(duì)戶主的每一個(gè)帖子所有的回復(fù)用戶進(jìn)行統(tǒng)計(jì),然后采用一定的篩選流程,運(yùn)用Excel統(tǒng)計(jì)軟件,找到與戶主經(jīng)常聯(lián)系的用戶,從而得到戶主的關(guān)系圈.三、模型假設(shè)假設(shè)本文中提取的論壇用戶信息不隨時(shí)間的變化而改變.假設(shè)在對(duì)言論領(lǐng)袖的識(shí)別中不存在論壇刷帖、灌水等現(xiàn)象.四、符號(hào)說(shuō)明 表示模糊決策矩陣 表示模糊正理想 表示模糊負(fù)理想 表示隸屬度 表示模糊指標(biāo)矩陣 表示權(quán)重向量五、模型的建立與求解言論領(lǐng)袖言論領(lǐng)袖是最具影響力的論壇人物,在言論領(lǐng)袖的確定中,本文考慮到的是瀏覽數(shù)、跟帖數(shù)、精華帖數(shù)、,然后再運(yùn)用層次分析法從個(gè)用戶中選出言論領(lǐng)袖. 設(shè)定的評(píng)判標(biāo)準(zhǔn)如下:(1)發(fā)帖數(shù),剔除掉一些比值太小的用戶.(2)主題數(shù).(3)跟帖數(shù)與瀏覽數(shù)在發(fā)表的帖子后面,寫(xiě)上自己的意見(jiàn),稱為跟帖,說(shuō)明該帖有嘩眾取寵的嫌疑,不可能成為言論領(lǐng)袖;當(dāng)瀏覽數(shù)與跟帖數(shù)的比值太大時(shí),.(4)精華帖數(shù)精華貼是論壇中的一種帖子種類(lèi),是被版主或管理員加為精華的帖子,一般此類(lèi)貼子內(nèi)容豐富,在評(píng)定話題用戶中占重要比重.(5)威望論壇威望是指該用戶在論壇的交往能力,、交往能力越強(qiáng),在數(shù)據(jù)的整理中我們添加威望指標(biāo),剔除掉威望值較小的用戶,這樣就簡(jiǎn)化得到更優(yōu)的數(shù)據(jù).通過(guò)(采集過(guò)程見(jiàn)附錄三),本文特此選取其中13位用戶(標(biāo)號(hào)1~13)進(jìn)行評(píng)價(jià),如表1所示:表1 論壇用戶信息序號(hào)用戶名主題發(fā)帖總數(shù)發(fā)帖比例跟帖數(shù)瀏覽數(shù)跟帖/瀏覽威望精華貼數(shù)1周小福21135884168108917256252屬牛的牛牛09639000/0003妞妞552882672561338348004jiaxuanxuan532511529063890577Angel02000/0006小影咖啡1053364741007nonolove9991414611561185976808不知道可樂(lè)01000/0009豬豬老婆03918000/00010我是大贏家211318686904011衛(wèi)斯里429868184008055212似神仙04015000/0263213月影星稀1211963620387275501由以上敘述的方法,、10;、12;對(duì)剩下的用戶繼續(xù)篩選,排除掉威望指小于5的用戶6;得到最后相對(duì)有可能成為言論領(lǐng)袖的用戶.根據(jù)上面方法對(duì)
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1