freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

本科畢業(yè)設(shè)計(jì)_微博輿情管理平臺(tái):數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)-wenkub.com

2024-08-26 21:56 本頁面
   

【正文】 初步 實(shí)現(xiàn)了微博輿情管理平臺(tái)的功能。 通過 加入語義分析模塊,可以 極大 提高 預(yù)警 的準(zhǔn)確率,實(shí)現(xiàn)對媒體模式微博消息的預(yù)警。如美國專利局編號(hào)為 4930077 的專利提出了通過文本分析來預(yù)測輿情的方法加州大學(xué)伯克利分校社會(huì)科學(xué)計(jì)算實(shí)驗(yàn)室的 SDA 項(xiàng)目,主要針對網(wǎng)頁數(shù)據(jù)進(jìn)行自動(dòng)分北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 33 析;國內(nèi)的方正智思是北大方正技術(shù)研究院挾多年積累的中文信息處理的技術(shù),研發(fā)推出的一個(gè)中文智能信息挖掘與知識(shí)管理的軟件開發(fā)包與服務(wù)系統(tǒng)。進(jìn)而 完成 對趨勢分析模塊的改進(jìn),對趨勢分析模塊的初步改進(jìn)設(shè)想是將 微博傳播趨勢分析 進(jìn)行 分類,微博達(dá)人模式 適用 現(xiàn)行模塊, 媒體 模塊則需要重新設(shè)定參數(shù),進(jìn)行修改,同 時(shí) 在趨勢分析模塊中加入文本傾向性分析,也就是語義分析模塊來提高微博分析的準(zhǔn)確性,并且實(shí)現(xiàn)對熱點(diǎn)的熱度分級(jí) 。 而 如果實(shí)現(xiàn)了 中文 語義分析 , 充分解析 微博句子 或詞語, 對于 敏感話題識(shí)別和微博輿情趨勢分析將會(huì)有 重要 意義。微博 輿情信息 與 普通 文本 的 最大區(qū)別在于 它 的擴(kuò)散性 和 不可控性 , 信息內(nèi)容非常動(dòng)態(tài) 。 微博題目 熱點(diǎn)預(yù)警結(jié)果 消息最終走 勢 結(jié)果對比 李克強(qiáng)將在波茨坦會(huì)議舊址發(fā)表講話 黃色級(jí) 藍(lán)色級(jí) 錯(cuò)誤 江蘇鹽城政府單位吃喝 27萬 黃色級(jí) 藍(lán)色級(jí) 錯(cuò)誤 南京一郵局被強(qiáng)拆 橙色級(jí) 橙色級(jí) 正確 李克強(qiáng):無論多忙都要抽時(shí)間讀書 藍(lán)色級(jí) 藍(lán)色級(jí) 正確 埃及浮雕刻有“丁錦昊到此一游” 橙色級(jí) 紅色級(jí) 正確 人民日報(bào):農(nóng)村孩子為何不愿 黃色級(jí) 藍(lán)色級(jí) 錯(cuò)誤 北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 30 躍“龍門” 人民日報(bào)海外版:房地產(chǎn)商哭窮屬賣萌裝天真 藍(lán)色級(jí) 黃色級(jí) 錯(cuò)誤 鄭州暴雨 黃色級(jí) 黃色級(jí) 正確 江蘇男子坐冤獄 8年獲補(bǔ)償金 萬元 藍(lán)色級(jí) 藍(lán)色級(jí) 正確 營養(yǎng)餐食 物變質(zhì),營養(yǎng)縮水,問題不斷 藍(lán)色級(jí) 黃色級(jí) 錯(cuò)誤 陳佩斯關(guān)于網(wǎng)絡(luò)輿論的評論 黃色級(jí) 黃色級(jí) 正確 王石:愛國主義與民族主義 黃色級(jí) 黃色級(jí) 正確 銀河 SOHO 環(huán)境監(jiān)測 藍(lán)色級(jí) 藍(lán)色級(jí) 正確 小學(xué)生作文《停車》 藍(lán)色級(jí) 藍(lán)色級(jí) 正確 Esports 海濤: G1聯(lián)賽 IG負(fù)于 LGD 黃色級(jí) 黃色級(jí) 正確 圖 48 分析 結(jié)果分析 圖 根據(jù)與 真實(shí)走向的對比,可以發(fā)現(xiàn)在微博達(dá)人模式中,趨勢分析 預(yù)警成為 熱點(diǎn)的結(jié)果的準(zhǔn)確率在 80%左右, 即使沒有 成為當(dāng)日熱點(diǎn) 也是 關(guān)注比較靠前的話題 。 而 若 10000 以上 也出現(xiàn)兩次或 以上,則分為橙色級(jí),也就是很可能成為多日熱點(diǎn)。 趨勢 分析 模塊 對曾經(jīng) 成為過熱點(diǎn)的微博消息 的傳播特點(diǎn)進(jìn)行 整理 后,得出兩種熱點(diǎn)傳播模型,一種是傳統(tǒng)媒體在微博建立的用戶 的 傳播方式,一種是微博達(dá)人的消息傳播模式, 圖 45就是兩種 方式 的 轉(zhuǎn)發(fā) 量時(shí)間曲線圖, 例子 選擇則是 媒體 模式 選 擇 的是南方周末 “ 一名中國公民在波士頓爆炸案中遇難 ” 的消息傳播,微博達(dá)人模式選擇 的是“國學(xué) 大師 劉文典說過 的一句話 ” , 圖 46 和 圖 47選擇 的是傳播量時(shí)間曲線圖, 其中 南方周末的微博消息 在一天的時(shí)間內(nèi)的轉(zhuǎn)發(fā)量為 997, 傳播用戶量 接近 500 萬 ,其中南方周末本身的 粉絲數(shù)量 就占了 近 450 萬 ,轉(zhuǎn)發(fā) 率 非常低,但是傳播范圍廣,依然是熱點(diǎn),而微博達(dá)人模式則不一樣,轉(zhuǎn)發(fā)量為 724,最終 傳播用戶量接近 10 萬 , 在 一定范圍內(nèi)也成為了熱點(diǎn),而它的傳播時(shí)間圖就和起點(diǎn)很高的南方周末的圖形很不一樣,有著較高的轉(zhuǎn)發(fā)率,雖然廣度不及南方周末,但也 成為 過熱點(diǎn)話題 。 微博用戶 對該輿情關(guān)注度低,傳播速度慢,輿情影響局限在較小范圍內(nèi),沒有 成為當(dāng)日 熱點(diǎn) 的可能; 黃色級(jí) (Ⅲ級(jí) ):出現(xiàn)輿情。預(yù)警體現(xiàn)動(dòng)態(tài)的認(rèn)知,預(yù)案體現(xiàn)靜態(tài)的防范。 微博 輿情 預(yù)警 模塊 微博 輿情 預(yù)警 預(yù)警的概念源于對重大自然災(zāi)害征兆的研究。同時(shí)我們發(fā)現(xiàn) WeiboRank 算法和用戶的 followers 兩個(gè)序列的傳播影響人次覆蓋率比較相近,這說明如果在不太要求精確性的情況下,用戶粉絲數(shù)量基本上能夠反映用戶的傳播影響力。該數(shù)據(jù)是以用戶的微博信息在區(qū)域內(nèi)被真實(shí)傳播的過程中所能影響到的人次的實(shí)測結(jié)果為依據(jù),將每個(gè)微博用戶所發(fā)出的所有微博的實(shí)測北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 24 影響人數(shù)進(jìn)行迭加獲得的每個(gè)微博用戶的真實(shí)傳播影響力。將所有節(jié)點(diǎn)的 WeiboRank 初始值設(shè)為 0. 1,通過迭代到收斂為止,可以得到所有用戶的 WR 值。其物理上表征在節(jié)點(diǎn) j 的所有鄰居的互動(dòng)關(guān)系中,節(jié)點(diǎn) i 相對于 j 的重要程度。 SC(i)為用戶 i 在監(jiān)測時(shí)間段內(nèi)所轉(zhuǎn)發(fā)的所有微博數(shù)量。本研究中邊權(quán)Wij 采用歷史轉(zhuǎn)發(fā)比率 Rt(i,j)來表示。每個(gè)節(jié)點(diǎn) 的 PR 值為所有鄰居好友對其貢獻(xiàn) PR值的綜合 WeiboRank 算法 微博中用戶的傳播影響力受到很多因素的影響,例如用戶的跟隨者數(shù)量、關(guān)注用戶量、帳號(hào)是否有認(rèn)證,以及微博本身的質(zhì)量、新鮮度等。這個(gè)重要性得分值為:PR( T) /C(T) 其中 PR( T)為 T 的 PageRank 值, C(T)為 T 的出鏈數(shù),則 A的 PageRank值為一系列類似于 T 的頁面重要性得分值的累加。 PageRank 算法 著名的 PageRank 算法是衡量網(wǎng)絡(luò)中節(jié)點(diǎn)重要程度的經(jīng)典 算法。北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 20 圖 43 Kmeans 算法流程圖 Kmeans 算法的基本思想是: 先設(shè)置一個(gè)聚類 數(shù)目 n,系統(tǒng) 隨機(jī)選擇n個(gè)文本作為初始的 聚類 中心,然后挨個(gè)比較每個(gè)文本與各個(gè)類中心的 相似度 ,將它賦予給最相似的那 個(gè) 類中心所在的類 。 2. 隨機(jī)選擇 n個(gè)文本作為聚類中心。非監(jiān)督學(xué)習(xí)又稱歸納性學(xué)習(xí)( clustering)利用 K 方式 (Kmeans),建立中心( centriole),通過循環(huán)和遞減運(yùn)算(iterationamp。一般實(shí)在是數(shù)據(jù)組中包含最終結(jié)果( 0, 1)。稍為嚴(yán)格的提法是:機(jī)器學(xué)習(xí)是一門研究機(jī)器獲取新知識(shí)和新技能,并識(shí)別現(xiàn)有知識(shí)的學(xué)問。 目前,常用的使用這個(gè)思想的算法有: Kmeans 算法、 Kmedoids 算法,系統(tǒng)中使用的是 Kmeans 算法 機(jī)器 學(xué)習(xí) 機(jī) 器學(xué)習(xí) (Machine Learning)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。本系統(tǒng)使用劃分法進(jìn)行文本聚類。一個(gè)文本表現(xiàn)為一個(gè)由文字和標(biāo)點(diǎn)符號(hào)組成的字符串,由字或字符組成詞,由詞組成短語,進(jìn)而形成句、段、節(jié)、章、篇的結(jié)構(gòu)。 文本聚類就是從很多文檔中把一些內(nèi)容相似的文檔聚為一類。 假設(shè)文檔向量為 di=(di1, di2, ?, dit),查詢向量為 Q=(wq1,wq2, ?, wqt)。此時(shí),通過比較兩個(gè)向量的相似性就能解決兩個(gè)文檔之間的相似性問題。 圖 42 VSM 文檔 向量化 表示示例 然而,二值表示的方法并沒有考慮一個(gè)詞項(xiàng)在文檔中出現(xiàn)的次數(shù)。 向量空間模型主要涉及以下兩方面的工作: 1)構(gòu)建向量表示文檔、查詢中的詞項(xiàng) 2)度量任意文檔向量和查詢向量的相似性 以 下則對該三方面的工作進(jìn)行詳細(xì)介紹。 圖 32 微博輿情 管理平臺(tái)數(shù)據(jù)分析系統(tǒng)主要流程 四 、微博輿情管理平臺(tái)的實(shí)現(xiàn) 樣本 選取與數(shù)據(jù)來源 網(wǎng)絡(luò)爬蟲的主要功能是搜集 Inter 中的各種信息。 北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 13 圖 31 微博 輿情管理平臺(tái)三大模塊 微博 輿情管理平臺(tái)的主要流程 如下 , 首先 輸入要 查詢 的微博消息的關(guān)鍵詞或核心微博, 然后利用 網(wǎng)絡(luò)爬蟲 來 收集 微博 中的消息 內(nèi)容 , 包括微博內(nèi)容,轉(zhuǎn)發(fā)關(guān)系, 博主 ID,發(fā)布時(shí)間 等。 通過 研究發(fā)現(xiàn), 消息 成為熱點(diǎn) 中 有以下3種 規(guī)律, 每一種 都會(huì)在熱點(diǎn)的成長曲線中 出現(xiàn)。 微博 傳播模型 由 微博背對臉的特點(diǎn) 可 以 知 道 微博 消息 傳播 的單向性, 類似 病毒的傳播,病毒感染一臺(tái)主機(jī)則這臺(tái)主機(jī)進(jìn)入感染態(tài),而感染一臺(tái)服務(wù)器 ,則訪問這臺(tái)服務(wù)器的所有主機(jī)都會(huì)了解這個(gè)病毒,或感染或免疫,微博中消息北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 10 傳播也是如此,普通用戶相當(dāng)于終端,而微博意見領(lǐng)袖 則 相當(dāng)于服務(wù)器,區(qū)別 在于,消息的接受是被動(dòng)的,只要登錄微博就能看到關(guān)注者的消息,而不用 像 用戶一樣需要登錄服務(wù)器。 也有 部分用戶從來不 與 粉絲互動(dòng),但其絕對粉絲數(shù)量較多, 也可以 獲得較大影響力。 排名 昵稱 粉絲 用戶類型 時(shí)間 二次轉(zhuǎn)發(fā) 1 思想焦距 1209767 個(gè)人認(rèn)證 202039 15:03:00 368 2 杜子健 324621 個(gè)人認(rèn)證 202039 13:07:01 51 3 歷史塵封檔案 538570 微博達(dá)人 202039 15:45:02 40 4 煮酒談史 214251 微博達(dá)人 202039 16:11:35 37 5 人性之美麗 213917 微博達(dá)人 202039 15:06:26 22 6 長江直播 47390 微博達(dá)人 202039 15:17:05 18 7 敵我媒體采訪團(tuán) 275145 個(gè)人認(rèn)證 202039 15:03:06 9 8 彭三金 176135 個(gè)人認(rèn)證 202039 15:03:07 3 9 笑著做教師 11370 個(gè)人認(rèn)證 202039 16:38:55 3 北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 9 10 王周生 7162 個(gè)人認(rèn)證 202039 15:23:09 3 圖 22 微博 消息影響力前 10名 不過 轉(zhuǎn)發(fā)量并不是 判斷 意見領(lǐng)袖影響力的唯一標(biāo)準(zhǔn),包 括粉絲數(shù),轉(zhuǎn)發(fā)率 以及 活躍程度均是評估意見領(lǐng)袖 影響 程度的 重要 參考標(biāo)準(zhǔn), 通過 對實(shí)驗(yàn)數(shù)據(jù)結(jié)果的總結(jié),發(fā)現(xiàn)微博意見領(lǐng)袖有以下幾個(gè) 特點(diǎn) :基本上所有的微博意見領(lǐng)袖均是新浪 認(rèn)證 用戶,圖 22也 說明了這一觀點(diǎn), 而 且認(rèn)證用戶容易獲得普通用戶 認(rèn)可 和接受 , 發(fā)布消息 的真實(shí)性 也比較可靠。 從而 有了意見領(lǐng)袖這一概念,在人際傳播網(wǎng)絡(luò)中經(jīng)常為他人提供信息、意見、評論,并對他人施加影響的 “ 活躍分子 ” ,是大眾傳播效果的形成過程的中介或過濾的環(huán)節(jié) 。 未知狀態(tài)就是 不知道消息的 狀態(tài) ,通常就是他所關(guān)注的人中沒有傳播這條消息;轉(zhuǎn)發(fā)狀態(tài) 就是 這個(gè)用戶知道這條消息 , 并且對這條消息很感興趣,轉(zhuǎn)發(fā)了這條 狀態(tài) , 就把 這條消息通過 他 的粉絲繼續(xù)傳播了下去 ;已知不傳播狀態(tài)則是知道了 這條 消息 ,但是因?yàn)椴桓信d趣,沒有轉(zhuǎn)發(fā)這消息或發(fā)布相關(guān)的消息。 背對臉這種特性, 則是 很生動(dòng)表明了微博與平常網(wǎng)絡(luò)平臺(tái) 相比 最大的特點(diǎn), 其 傳播消息的途徑是單向的,被關(guān)注者發(fā)布 消息 無需 理會(huì) 關(guān)注者的反應(yīng), 關(guān)注者關(guān)注 著被關(guān)注者的消息, 就類似 一個(gè) 人 在玩電腦游戲,而他的粉絲就是站在他背后觀看的人,觀看者可以看到游戲的進(jìn)度,但游戲者卻不用理會(huì)觀看者在做什么,這就是 微博 消息傳播背對臉的特性 。而以新浪微博 為例, 其用戶 可以選擇一個(gè)或多個(gè)的關(guān)注組別,例如娛樂,新聞 , 經(jīng)濟(jì)等 ,這就 讓 用戶可以更加便捷 的 了解自己 需 要的某些方面的信息 。北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 5 網(wǎng)民 根據(jù) 現(xiàn)實(shí) 社會(huì) 或者 網(wǎng)絡(luò)上發(fā)生的新聞 可以 在各種平臺(tái)上直接發(fā)表自己的見解和意見, 根據(jù) 其他網(wǎng)民的見解進(jìn)行 交換觀點(diǎn) , 而 網(wǎng)絡(luò)的虛擬性也使 虛假不良信息的發(fā)布變得容易和更具蠱惑性, 容易 成為 熱點(diǎn) 。 第二章 分析 了微博消息傳播的模型,研究了微博消息傳播的特點(diǎn),建立了微博消息傳播的模型。 研究意義 網(wǎng)絡(luò)輿情反映了民情民意,在為國家管理者決策提供參考依據(jù)的同時(shí)北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 4 也存在引發(fā)社會(huì)問題的風(fēng)險(xiǎn),尤其是國內(nèi)外敵對勢力經(jīng)常利用互聯(lián)網(wǎng),別有用心地煽動(dòng)不良情緒或發(fā)動(dòng)串聯(lián),以期影響我國社會(huì)穩(wěn)定。 與傳統(tǒng)輿情相比,網(wǎng)絡(luò)輿情具有傳播快速和實(shí)時(shí)互動(dòng)的特點(diǎn)。輿情 管理與監(jiān)控, 就是通過 對互聯(lián)網(wǎng)信息挖掘采集技術(shù)的整合, 實(shí)現(xiàn)自動(dòng) 抓取互聯(lián)網(wǎng)中的海量信息,可以 利用 一些算法 自動(dòng) 對信息分類, 主題 分 析,傾向分析等北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文) 第 頁 3 功能,形成圖表 或者簡報(bào)結(jié)論,便于用戶掌握 。與此同時(shí),現(xiàn)實(shí)生活與虛擬世界交互影響,呈現(xiàn)出一種你中有我、我中有你的局面。如果把中間的一些定語省略掉,輿情就是民眾的社會(huì)政治態(tài)度。有研究者指出:“所謂‘輿情’,實(shí)際上就是大眾密
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1