freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于新浪微博的用戶信息爬蟲及分析畢業(yè)論文-資料下載頁

2025-08-18 14:32本頁面
  

【正文】 (cur,2,())。 (cur,3,())。 cur++。 } } } 微博用戶標簽分類查詢 通過選擇標簽類別和擬合度兩個參數(shù),向服務器請求信息,服務器從數(shù)據(jù)庫中獲取信息后返回給客戶端相應的微博用戶 ID,昵稱,粉絲數(shù)和關注數(shù)。 發(fā)布微博并 @列表框中的微博用戶昵稱 當使用客戶端的其他功能獲取到許多微博用戶之后,用戶可以在文本框中填寫相應的內容,單擊該請求按鈕之后,客戶端會提取列表框的微博用 戶昵稱,與文本框的內容結合后,經(jīng)過 URLEncode 編碼,轉換成微博文本,向服務器請求該微博文本的發(fā)布。 UrlEncode 編碼: 21 因為該請求指令涉及到用戶的輸入,對于用戶的輸入,必須進行轉碼處理, UrlEncode可以對用戶輸入的中文字符和其他特殊的標點符號轉換成 %的字符串。發(fā)送Postnormalweibo 請求,發(fā)送微博。 微博用戶昵稱模糊搜索 微博用戶的模糊搜索是新浪提供的一個接口,可以用來快速的搜索具有較高影響力的微博用戶 ID。發(fā)送 showsearchuser 請求,獲取模糊搜索的數(shù)據(jù)。 微博用戶微博查詢 當數(shù)據(jù)列表框里 面又微博用戶信息時,雙擊該行數(shù)據(jù),發(fā)送 showweibo 請求,將可以查看該微博用戶最新發(fā)布 的五十條微博。 22 4 系統(tǒng)部署與測試 系統(tǒng)部署圖 系統(tǒng)的爬蟲部分和服務端部分運行于一臺服務器上,并有數(shù)據(jù)庫服務器與同一個內網(wǎng)中,客戶端通過萬維網(wǎng)訪問本系統(tǒng),系統(tǒng)部署結構如圖 41 所示: 圖 41 系統(tǒng)部署圖 系統(tǒng)測試 軟件測試是系統(tǒng)質量保證的主要活動之一。 在開發(fā)本系統(tǒng)時,為了使本系統(tǒng)能穩(wěn) 定的運行,對本系統(tǒng)進行了有針對性的全面測試: 數(shù)據(jù)爬蟲部分測試: 啟動爬蟲程序,開始進行微博用戶信息和微博信息爬取,五個小時后系統(tǒng)正常運行,運行日志顯示微博用戶爬取了八十多萬個,微博信息已經(jīng)爬取了一百一十多萬個。登錄數(shù)據(jù)庫進行查看,圖 42 為這五個小時內爬取到的微博用戶數(shù)據(jù)信息一共有117853 行數(shù)據(jù),數(shù)據(jù)按主鍵 ID 字段升序排序,數(shù)據(jù)錄入正常,各個字段數(shù)據(jù)正確。 23 圖 42 數(shù)據(jù)庫數(shù)據(jù) 服務器與客戶端的測試: 啟動服務器和客戶端,客戶端對每一個命令接口進行操作,檢測每一個功能是否能夠正常工作: 1) 輸入用戶名 和密碼,點擊登錄按鈕。若用戶名和密碼正確,成功登錄,若密碼錯誤。彈出信息框,顯示密碼錯誤。如圖 43所示: 圖 43 密碼錯誤提示 24 2) 點擊注冊新用戶,填入郵箱地址,成功收到郵件,郵件內包含驗證碼,填寫完整注冊信息,若驗證碼正確,成功注冊新賬號。若信息不完整或格式錯誤。提示錯誤。收到的郵寄格式如圖 44所示: 圖 44 注冊驗證碼郵件 3) 點擊忘記密碼,填入郵箱地址,成功收到郵件,郵件內容包含用戶名和密碼。收到的郵件如圖 45 所示: 圖 45 找回密碼郵件 25 4) 點擊查看關注列表,顯示了本登錄用戶關注的微博用戶信 息。顯示結果如圖46所示: 圖 46 查看關注列表結果圖 雙擊列表框中的信息,彈出對話框如圖 47 所示: 圖 47 關注用戶詳細信息 26 5) 點擊根據(jù)標簽搜索用戶。選擇標簽類別和擬合度。成功顯示微博用戶信息,選擇的擬合度越高,顯示的數(shù)量越少。標簽選擇界面如圖 48所示 : 圖 48 標簽選擇界面 6) 當列表框中有數(shù)據(jù)時,單擊發(fā)布微博并 @按鈕,成功發(fā)布微博并實現(xiàn)批量 @。如圖 49和 410 所示: 圖 49 發(fā)布微博界面 圖 410 微博成功發(fā)布 27 從這兩個圖可以看出成功實現(xiàn)了提取列表框的前 5 個微博用戶,并 進行 @。 7) 單擊搜索按鈕,根據(jù)文本框內容進行了模糊搜索,并顯示微博用戶信息。如果輸入搜索“ zly”,可以獲得信息如圖 411 所示: 圖 411 模糊搜索結果圖 8) 雙擊列表框的數(shù)據(jù),成功顯示該微博用戶的頭像和最近五十條微博內容。如圖 412 所示: 28 圖 412 微博用戶詳細信息界面 29 5 結束語 通過這次畢業(yè)設計,不僅學到了很多專業(yè)知識,而且提高了動手能力和解決實際問題的能力,知道我要學的東西還有很多很多。深刻的知道了要想真正的完成一個系統(tǒng),比實現(xiàn)一個程序是難的多的,特別是對大數(shù) 據(jù)的處理,為了維護系統(tǒng)的穩(wěn)定性,需要對數(shù)據(jù)容器進行維護,并合理的添加相應的互斥鎖,這樣就可以保證數(shù)據(jù)在被訪問時不被修改,防止訪問內存錯誤的出現(xiàn)。 畢業(yè)設計給我留下的不僅僅是回憶,因為它使我受到了一次用專業(yè)知識、專業(yè)技能分析和解決問題的全面系統(tǒng)鍛煉,提高了我自身的價值。鞏固和運用我所學的理論知識,在項目中鍛煉,在項目中提高,遇到問題時,網(wǎng)上查找資料,一般都會解決的,然后將你解決問題的過程記錄下來,這也許將成為別人的學習資料,甚至,以后你也許還會遇到這個問題,而你已經(jīng)忘記了解決這個問題的方法。 當然需求總是會改 動的,需求改動的原因很多,可能是原本的設計不夠合理,也可能是因為,該需求實現(xiàn)的技術尚無法掌握,也可能是因為硬件設備無法保證該需求的正常運行。 當然,在開發(fā)過程中,我也看到了自己的欠缺,嚴謹?shù)墓ぷ鲬B(tài)度以及較高的分析問題和解決問題的能力,縝密的思維。深感計算機知識的浩如煙海,設計過程中單靠課堂上學習的知識是遠遠不夠的,還需要在有空的時候學習更多的計算機等方面知識。特別是網(wǎng)絡知識。比如 HTTP 報文格式,一開始我對 HTTP 報文格式是不太了解的,因此,解決如何獲取和解析數(shù)據(jù)花了較多的時間。熟悉了 HTTP 的實現(xiàn) 原理后,便可以實現(xiàn)從新浪微博的數(shù)據(jù)的獲取和解析。 30 參考文獻 [1] (美 )陳封能 ,(美) 斯坦巴赫 ,(美) 庫瑪爾 著, 范明 等譯 數(shù)據(jù)挖掘導論 人 民郵電出版社 ( 202011) [2] (美 )坎塔爾季奇 著 , 王曉海 吳志剛 譯 數(shù)據(jù)挖掘:概念、模型、方法和算 法 (第 2版 ) 清華大學出版社 ( 202011) [3] 羅劍鋒 Boost 程序庫完全開發(fā)指南 :深入 C++“ 準 ” 標準庫 (修訂版 ) 電子工業(yè)出 版社 (202005出版 ) [4] TCP/IP 指南 (卷 1):底層核心協(xié)議 人民郵電出版社 [5] 嚴蔚敏 , 吳偉民 數(shù)據(jù)結構( C語言版) 清華大學出版社 [6](美) 索爾特 等著, 侯普秀 等譯 C++高級編程 (第 2版 ) 清華大學出版社 [7] 金百東 , 劉德山 C++STL 基礎及應用 清華大學出版社 [8] 錢慎一 Oracle 11g 數(shù)據(jù)庫基礎與應用教程 清華大學出版社 [9] 孫鑫 、余安萍 VC++深入詳解 電子工業(yè)出版社 [10] Stanley ,Josee Lajoie Barbara C++ Primer 人民郵電出版 社 31 致謝 四年的大學的時光一下子就結束了,大學生活即將結束,我要感謝 ***大學,讓我體驗了大學的美好生活。 在制作畢業(yè)設計的過程中,雖然遇到了許多的困難,但在老師和同學的幫助下,都順利克服了這些困難,因此我要感謝所有的老師和同學們在學習過程中給予的幫助。 尤其要感謝我的論文指導老師, ***老師不厭其煩的幫助我進行論文的修改和改進。同時,感謝所有為信息技術發(fā)展而不斷努力的程序員和工程師們,在畢業(yè)設計中用到的許許多多的技術,都是他們日以繼夜不斷研究而得到的成果。并無私的公開他們的研究成果, 并在網(wǎng)上發(fā)布源代碼。而我們現(xiàn)在也就可以利用他們的研究成果,加入工程中,輕松的實現(xiàn)其功能。極大的提高了開發(fā)效率。 當然,由于我的水平還十分有限,論文還有許多不足之處,程序還有許多的 BUG。所以,懇請各位老師和同學們指正。
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1