freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

本科畢業(yè)設計_微博輿情管理平臺:數(shù)據(jù)分析系統(tǒng)的設計與實現(xiàn)-資料下載頁

2025-08-18 10:58本頁面

【導讀】情則是網(wǎng)絡輿情的重要組成部分,它的特點有:直接性,突發(fā)性,偏差性,豐富性和互動性。過對抓取數(shù)據(jù)的分析發(fā)現(xiàn)了微博傳播的單向性,便捷性,背對臉等特點,還有微博意見領袖在微博傳播中的重要作用,微博熱點的產(chǎn)生規(guī)律。對數(shù)據(jù)分析的結(jié)果提出了趨勢分析的算法。利用空間向量模型完成對微博

  

【正文】 而微博達人模式則不一樣,轉(zhuǎn)發(fā)量為 724,最終 傳播用戶量接近 10 萬 , 在 一定范圍內(nèi)也成為了熱點,而它的傳播時間圖就和起點很高的南方周末的圖形很不一樣,有著較高的轉(zhuǎn)發(fā)率,雖然廣度不及南方周末,但也 成為 過熱點話題 。 從 兩者 的傳播圖形中可以看出,轉(zhuǎn)發(fā)率并不 能成為 熱點 評估 的標準 。兩種 模式中,有一共同點則是 都曾經(jīng) 出現(xiàn)過 短時間內(nèi)的傳播量激增, 然后成為 熱點,根據(jù) 這一 特性 設計 了 趨勢 分析模塊, 從最早的意見領袖開始,每出現(xiàn)一個意見領袖, 提取 這一 意見領袖后一小時的意見領袖的傳播廣度, 設定 不同的 M值 (一小時 內(nèi)微博傳播量),根據(jù)以往 數(shù)據(jù)可以得出, M值在 5000 以下 為藍色級基本無威脅,在 10000 到北京交通大學畢業(yè)設計(論文) 第 頁 27 50000 為黃色 級,需要注意,有很大概率成為熱點,而 50000 以上 則肯定成為熱點,但持續(xù)時間 還未 能有效的分級,也就是 還 不能 對 橙色 和 紅色 級進行有效分級,但已能區(qū)分熱點與否 。當 M值在 5000 到 10000 時 ,成為熱點的概率經(jīng)過統(tǒng)計在 50%左右,而如果 M值在 5000 到 10000 之間 出現(xiàn)的次數(shù)能達到兩次,則成為熱點的概率能大大提高,大概能達到 80%左右,所以 若 M值在 5000 到 10000 之間 時,統(tǒng)計 M 值 的 次數(shù), 若 只出現(xiàn)一次,則為 藍色 級,若出現(xiàn)兩次 或 以上,為黃色級 。 而 若 10000 以上 也出現(xiàn)兩次或 以上,則分為橙色級,也就是很可能成為多日熱點。 圖 45 轉(zhuǎn)發(fā) 量時間曲線圖北京交通大學畢業(yè)設計(論文) 第 頁 28 圖 46 微博 達人模式 圖 圖 47 媒體模式 傳播 圖 北京交通大學畢業(yè)設計(論文) 第 頁 29 趨勢 分析結(jié)果比較 利用 趨勢分析 模塊對 微博 消息 進行分析 , 對 分析 結(jié)果與最終消息走勢進行 對比,結(jié)果如 圖 48 所示 , 總共 測試了 15 組 微博消息, 媒體 模式 10組句子 和 微博達人 模式 5 組。 前 10 組 為媒體傳播模式的微博消息,其中 ―江蘇鹽城政府單位吃喝 27 萬 ‖, ―南京 一郵局被強拆 ‖, ―埃及浮雕刻有‘丁錦昊到此一游 ’ ‖, ―人民日報海外版:房地產(chǎn)商哭窮屬賣萌裝天真 ‖, ―鄭州暴雨 ‖,這 5 條 微博成為熱點,其 余 沒有成為熱點 , 趨勢分析模塊 沒有預測出 ―江蘇政府單位吃喝 ‖, ―人民日報海外版:房地產(chǎn)商哭窮屬賣萌裝天真 ‖這 兩 條熱點 ;誤 測了 ―李克強發(fā)表講話 ‖, ―人民日報:農(nóng)村孩子為何不愿躍‘龍門’ ‖ 為 熱點 ,準確率 只 有 60%。 在 微博達人模式中, ―營養(yǎng)餐食物變質(zhì),營養(yǎng)縮水,問題不斷 ‖這條 熱點沒有預測出,但其他熱點均成功預測并且沒有 誤報 熱點, 準確率 為 80%。 微博題目 熱點預警結(jié)果 消息最終走 勢 結(jié)果對比 李克強將在波茨坦會議舊址發(fā)表講話 黃色級 藍色級 錯誤 江蘇鹽城政府單位吃喝 27 萬 黃色級 藍色級 錯誤 南京一郵局被強拆 橙色級 橙色級 正確 李克強:無論多忙都要抽時間讀書 藍色級 藍色級 正確 埃及浮雕刻有“丁錦昊到此一游” 橙色級 紅色級 正確 人民日報:農(nóng)村孩子為何不愿 黃色級 藍色級 錯誤 北京交通大學畢業(yè)設計(論文) 第 頁 30 躍“龍門” 人民日報海外版:房地產(chǎn)商哭窮屬賣萌裝天真 藍色級 黃色級 錯誤 鄭州暴雨 黃色級 黃色級 正確 江蘇男子坐冤獄 8 年獲補償金 萬元 藍色級 藍色級 正確 營養(yǎng)餐食 物變質(zhì),營養(yǎng)縮水,問題不斷 藍色級 黃色級 錯誤 陳佩斯關于網(wǎng)絡輿論的評論 黃色級 黃色級 正確 王石:愛國主義與民族主義 黃色級 黃色級 正確 銀河 SOHO 環(huán)境監(jiān)測 藍色級 藍色級 正確 小學生作文《停車》 藍色級 藍色級 正確 Esports 海濤: G1 聯(lián)賽 IG 負于 LGD 黃色級 黃色級 正確 圖 48 分析 結(jié)果分析 圖 根據(jù)與 真實走向的對比,可以發(fā)現(xiàn)在微博達人模式中,趨勢分析 預警成為 熱點的結(jié)果的準確率在 80%左右, 即使沒有 成為當日熱點 也是 關注比較靠前的話題 。 而 媒體 模式中的準確率就比較差強人意了 ,只有 60%左右,根據(jù) 實驗結(jié)果發(fā)現(xiàn)媒體本身擁有眾多粉絲數(shù),所以發(fā)表的消息雖然成為熱點的可能性非常大,但也總有 40%的新聞只是 新聞 , 傳播 面廣 而沒有成為熱點,所以對媒體模式的更準確預警分析有待 改進 。 初步 設想對媒體認證的意見領袖 傳播的 微博消息 加上 一個轉(zhuǎn)發(fā)率的對比,但 尚未 從 已知 數(shù)據(jù)中發(fā)現(xiàn)熱點與轉(zhuǎn)發(fā)率的明顯關系。 北京交通大學畢業(yè)設計(論文) 第 頁 31 五 、 結(jié)論 與展望 系統(tǒng) 不足 盡管微博輿情 監(jiān)控技術日趨成熟, 但是微博 輿情本身 的 特點及復雜性使得微博輿情信息 的 處理不能 像 普通 文本信息 的 處理那樣進行 。微博 輿情信息 與 普通 文本 的 最大區(qū)別在于 它 的擴散性 和 不可控性 , 信息內(nèi)容非常動態(tài) 。 由于 時間 和精力有限,這個系統(tǒng)尚未做到盡善盡美,主要還存在以下幾個方面問題: 動態(tài)監(jiān)測 對 微博信息的實時獲取,是 趨勢 分析的 關鍵 ,由于新 浪 API 的限制 ,導致對微博 消息 的抓取有一定限制,在抓取數(shù)據(jù)時會有一定時間的延遲,在數(shù)據(jù)挖掘方面有待改進。 而且 從系統(tǒng)功能方面,首先實現(xiàn)的是對指定微博內(nèi)容的熱點趨勢分析,而沒有實現(xiàn)從實時所有微博信息中發(fā)現(xiàn)熱點, 網(wǎng)絡 抓取技術這 方面有待改進。 分析技術 漢語 語義的豐富性與 復雜 性導致中文分詞與語義分析的困難 , 許多適用英文語義分析 的 算法 無法 用于中文 語義, 由于中文 語義 分析 需要建立自然語料庫,這方面 需要 的工作量過大,時間和精力不足,所以在這方面只有一些理論研究,沒有實現(xiàn)。 而 如果實現(xiàn)了 中文 語義分析 , 充分解析 微博句子 或詞語, 對于 敏感話題識別和微博輿情趨勢分析將會有 重要 意義。 分析準確率 從 的 結(jié)果分析中發(fā)現(xiàn),對于媒體傳播模式的微博消息的 預警 準確率 基帶 提高 , 需要加入 文本 傾向性分析 和 轉(zhuǎn)發(fā)率等因素來提高 分析 準確北京交通大學畢業(yè)設計(論文) 第 頁 32 率。 未來 展望 改進 預期 由于技術 限制,對一些 傳播 特別廣的全國 范圍 性的 消息 熱點的 監(jiān)測沒能 實現(xiàn), 希望能 對挖掘算法進行改進,完成對這 種熱點的特點分析和模型建立 。 通過 更多 的數(shù)據(jù)抓取來改進微博意見領袖 影響力 算法。進而 完成 對趨勢分析模塊的改進,對趨勢分析模塊的初步改進設想是將 微博傳播趨勢分析 進行 分類,微博達人模式 適用 現(xiàn)行模塊, 媒體 模塊則需要重新設定參數(shù),進行修改,同 時 在趨勢分析模塊中加入文本傾向性分析,也就是語義分析模塊來提高微博分析的準確性,并且實現(xiàn)對熱點的熱度分級 。 新增 功能 文本 傾向性分析模塊 傳統(tǒng)的輿情分析和調(diào)查主要采用靜態(tài)的手段,如:通過調(diào)查問卷,電話和面談,國內(nèi)外都有不少專業(yè)的調(diào)查公司和院所參與調(diào)查問題和場景的設計工作。 而網(wǎng)絡輿情分析系統(tǒng)是讓計算機去動態(tài)的收集數(shù)據(jù),對其進行自動分析形成輿情分析結(jié)果。網(wǎng)絡輿情分析系統(tǒng)所涉及的領域眾多,不過各個子領域的一些相關技術是可以互相參考和借鑒的。如美國專利局編號為 4930077 的專利提出了通過文本分析來預測輿情的方法加州大學伯克利分校社會科學計算實驗室的 SDA 項目,主要針對網(wǎng)頁數(shù)據(jù)進行自動分北京交通大學畢業(yè)設計(論文) 第 頁 33 析;國內(nèi)的方正智思是北大方正技術研究院挾多年積累的中文信息處理的技術,研發(fā)推出的一個中文智能信息挖掘與知識管理的軟件開發(fā)包與服務系統(tǒng)。這些成型系統(tǒng)一般由數(shù)據(jù)收集、數(shù)據(jù)預處理和數(shù)據(jù)分析等模塊組成。 對 現(xiàn)有各種主題分類相關技術進行研究,分類列出了這些技術中對文本傾向性分類仍然適用的方式和方法,并總結(jié)了其中面臨的主要技術瓶頸;通過列舉文本傾向性分類處理對象的特點規(guī)律,總結(jié)了在構(gòu)建傾向性分類器時需要著重考慮的問題和因素。針對目前傾向性語義資源匱乏的現(xiàn)狀,收集和整理了當前主要的基礎語義資源,分析了在構(gòu)建語義資源時需要考慮的因素,提出了用于傾向性分類的語義資源的構(gòu)建方法并實際構(gòu)建了一部領域極性詞典。 通過 加入語義分析模塊,可以 極大 提高 預警 的準確率,實現(xiàn)對媒體模式微博消息的預警。 結(jié)束語 隨著網(wǎng)絡 在 全球 范圍內(nèi) 的 飛速發(fā)展, 網(wǎng)絡已經(jīng) 逐漸發(fā)展 成反映 社會輿情的 主要 載體 , 微博輿情也成了網(wǎng)絡輿情的重要組成 部分 。 微博輿情 管理平臺 在 民意調(diào)查, 輿情 監(jiān)控 和 消息獲取 等 方面均有很大價值。 針對目前輿情 管理平臺的研究現(xiàn)狀, 本文 重在研究其中數(shù)據(jù)分析系統(tǒng)的內(nèi)容, 有 以下貢獻: 整合 中文分詞系統(tǒng)與 空間向量 模型 及 Kmeans 算法,實現(xiàn) 了對微博 數(shù)據(jù)的 轉(zhuǎn)化及聚類,給出了微博意見領袖的 評估 算法 及 對微博消息的預警等功能 。初步 實現(xiàn)了微博輿情管理平臺的功能。 北京交通大學畢業(yè)設計(論文) 第 頁 34 參考文獻 [1] 張洋 , 何楚杰 , 段俊文 , 等 . 微博輿情熱點分析系統(tǒng)設計研究 [J]. 信息網(wǎng) 絡安全 , 2020 (9): 6064 [2] 王藝 . 重大突發(fā)公共事件的微博輿情監(jiān)測與引導初探 [J]. 貴州民族學院學報 : 哲學社會科學版 , 2020 (5): 148151 [3] 楊濤 . 智能信息處理技術在互聯(lián)網(wǎng)輿情分析中的應用 [D]. 同濟大學 , 2020 [4] 張超 . 文本傾向性分析在輿情監(jiān)控系統(tǒng)中的應用研究 [D][D]. 北京 : 北京郵電大學 , 2020. [5] 唐曉波 , 宋承偉 . 基于復雜網(wǎng)絡的微博輿情分析 [J]. 情報學報 , 2020, 31(11): 11531162. [6] 王晶 , 朱珂 , 汪斌強 . 基于信息數(shù)據(jù)分析的微博研究綜述 [J]. 計算機應用 , 2020, 12(32): 7. [7] 莫溢 , 劉盛華 , 劉悅 , 等 . 一種相關話題微博信息的篩選規(guī)則學習算法 [J]. 中文信息學報 , 2020, 26(5): 16. [8] 譚俊武 . 面向網(wǎng)絡輿情分析的文本傾向性分類技術的研究與實現(xiàn) [D][D]. 國防科學技術大學 , 2020. [9] 陸浩 . 網(wǎng)絡輿情監(jiān)測研究與原型實現(xiàn) [D][D]. 北京 : 北京郵電大學 , 2020. [10] 肖宇 , 許煒 , 商召璽 . 微博用戶區(qū)域影響力識別算法及分析 [J]. 計算機科學 , 2020, 39(9): 3842. [11] 楊春霞 , 胡丹婷 , 胡森 . 微博病毒傳播模型研究 [J]. Computer Engineering, 2020, 38(15). 北京交通大學畢業(yè)設計(論文) 第 頁 35 [12] 李雯靜 , 許鑫 , 陳正權(quán) . 網(wǎng)絡輿情指標體系設計與分析 [J]. 情報科學 , 2020, 27(7): 986991. [13] 滕達 . 基于趨勢分析的網(wǎng)絡輿情監(jiān)控系統(tǒng) (TANCMS) 的研究與實現(xiàn) [D]. 國防科學技術大學 , 2020. [14] Larsen B, Aone C. Fast and effective text mining using lineartime document clustering[C]//Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 1999: 1622. [15] Kumar V, Tan P N, Steinbach M. Cluster analysis: basic concepts and algorithms[J]. Introduction to data mining, 2020: 487586. [16] Page L, Brin S, Motwani R, et al. The PageRank citation ranking: bringing order to the web[J]. 1999. 附錄Ⅰ: 翻譯原文 Cluster Analysis:Basic Concepts and Algorithms Cluster analysis divides data into groups (clusters) that are meaningful, useful,or both. If meaningful groups are the goal, then the
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1