【正文】
構(gòu)、系統(tǒng)模塊劃分、各自模塊具體功能,以及該系統(tǒng)數(shù)據(jù)庫表的確立,還設計好了查看微博、查看粉絲、查看關(guān)注、查看評論、查看轉(zhuǎn)發(fā)模塊的具體數(shù)據(jù)結(jié)構(gòu),當我們做好系統(tǒng)設計工作后,接下就該對系統(tǒng)做具體實現(xiàn)了。: 評論列表生成類類圖② ,該類主要用來調(diào)用新浪API獲取某條指定微博的所有評論列表,: 評論抓取類類圖③ ,他用來把某條具體微博的所有評論信息分頁顯,里面還帶有對Java列表界面的修改,生成美觀的外表。: 微博對象類圖 ② ,該類主要用來調(diào)用新浪API[15]獲取指定用戶的微博列表,: 抓取微博信息類類圖 ③ ,把這些數(shù)據(jù)生成列表視圖,并帶有分頁功能,里面還帶有對Java列表界面的修改,生成美觀的外表。里面主要包含轉(zhuǎn)發(fā)id、轉(zhuǎn)發(fā)內(nèi)容、轉(zhuǎn)發(fā)時間等字段,其中轉(zhuǎn)發(fā)id是主鍵,微博id關(guān)聯(lián)到微博表,用戶id關(guān)聯(lián)到用戶表,: 轉(zhuǎn)發(fā)表詳細字段表字段列名字段類型字段大小字段說明idvarchar50轉(zhuǎn)發(fā)微博idmidvarchar50轉(zhuǎn)發(fā)微博MIDtextvarchar5000轉(zhuǎn)發(fā)微博內(nèi)容createdAtvarchar100轉(zhuǎn)發(fā)時間weibo_idvarchar50被轉(zhuǎn)發(fā)的微博iduser_idvarchar50轉(zhuǎn)發(fā)者id第四節(jié) 系統(tǒng)各模塊設計既然分析好了各功能模塊的具體功能,又設計好了數(shù)據(jù)庫,接下來我們就來做每個功能模塊的詳細設計。包含用戶id、用戶昵稱、用戶注冊時間等字段,其中用戶id是主鍵。那么,該系統(tǒng)的數(shù)據(jù)庫[13]對象就可以主要分為:微博表、用戶表、關(guān)系表、評論表、轉(zhuǎn)發(fā)表。在確立了系統(tǒng)的總體功能后,便可以設計各個子模塊的功能。B/S模式即為瀏覽器/服務器(Browser/Server)模式,這種模式的優(yōu)點體現(xiàn)在平臺穩(wěn)定,業(yè)務擴展、系統(tǒng)升級簡單方便,開發(fā)成本低廉等。在概要設計的基礎上,開發(fā)者需要進行軟件系統(tǒng)的詳細設計。第三節(jié) 運行環(huán)境本系統(tǒng)對運行環(huán)境的要求如下: 硬件環(huán)境: ① CPU:Intel(R) Core(TM)2 ② 內(nèi)存:2G ③ 硬盤:100G ④ 顯卡:128MB獨立顯卡 軟件環(huán)境: ① 操作系統(tǒng):Windows XP、Windows Windows 8 ② 數(shù)據(jù)庫: ③ 相關(guān)應用軟件:JDK、Eclipse 第四節(jié) 系統(tǒng)用例圖系統(tǒng)用例圖[11]: 系統(tǒng)用例圖第五節(jié) 本章小結(jié)在本章中,主要是在開發(fā)網(wǎng)絡輿情數(shù)據(jù)采集系統(tǒng)之前對該系統(tǒng)進行了需求分析,其中主要介紹了該系統(tǒng)的開發(fā)目標、功能需求、系統(tǒng)的性能要求、運行環(huán)境、系統(tǒng)的層次結(jié)構(gòu)、系統(tǒng)的用例圖等。三、系統(tǒng)層次模塊圖本系統(tǒng)總的結(jié)構(gòu)模塊包括:用戶微博查看、用戶粉絲查看、用戶關(guān)注查看,每個模塊下面又包括具體的某些功能,:第二節(jié) 系統(tǒng)性能要求本系統(tǒng)的性能要求如下: ① 安全性。鑒于這種情況,本系統(tǒng)就特定做了一個關(guān)注搜索功能,搜索出包含用戶輸入的關(guān)鍵字的關(guān)注展示出來。③ 搜索指定用戶粉絲在查看用戶粉絲的時候,有些用戶粉絲可能特別多,分頁后就會存在很多頁,那么就會很難找某個具體的粉絲。二、功能分析開發(fā)軟件首先做的是開發(fā)過程中最主要的就是系統(tǒng)的需求分析[10],需求分析同時也是軟件生存周期中關(guān)鍵的一步。;⑧ 提供用于管理、檢查、優(yōu)化數(shù)據(jù)庫操作的管理工具;⑨ 可以處理擁有上千萬條記錄的大型數(shù)據(jù)庫;第四節(jié) 本章小結(jié)在本章中,主要對網(wǎng)絡輿情數(shù)據(jù)采集系統(tǒng)開發(fā)涉及到的技術(shù)理論知識進行了基本介紹,其中主要介紹了Java中的GUI圖形用戶界面的實現(xiàn)機制,JDBC數(shù)據(jù)庫連接原理和步驟、Java多線程的原理和實現(xiàn)方式、新浪微博Java SDK的概述和授權(quán)步驟,最后對MySQL數(shù)據(jù)庫進行了簡要的介紹。二、MySQL的特性MySQL作為一個小型關(guān)系型數(shù)據(jù)庫管理系統(tǒng),它有如下特性來讓用戶選擇它作為自己應用的數(shù)據(jù)庫:① 使用C和C++編寫,并使用了多種編譯器進行測試,保證源代碼的可移植性;② 支持AIX、FreeBSD、HPUX、Linux、Mac OS、Novell Netware、OpenBSD、OS/2 Wrap、Solaris、Windows等多種操作系統(tǒng)獲取到access_token后,表示我們的應用已經(jīng)授權(quán)成功,我們就可以通過access_token來訪問新浪微博API的接口。、client_SERCRET和redirect_URI三個參數(shù),他們分別填寫你的應用的App Key、App Secret和回調(diào)地址。要調(diào)用新浪微博API,就需要先到新浪微博開放平臺去注冊并創(chuàng)建一個應用,地址是:。 }}本論文作品主要通過MySQL數(shù)據(jù)庫來存儲獲取的微博、用戶等信息。④ 關(guān)閉JDBC對象 public void close() { try { if (rs != null) ()。ct = (url, user, password)。② 創(chuàng)建數(shù)據(jù)庫連接String url = jdbc:mysql://:3306/weibo_sina。本論文作品的多線程體現(xiàn)在給用戶良好的用戶體驗方面:當用戶點擊一項功能時,如果該功能是一項很費時的操作,那么程序就會單開一個線程去完成這個費時的操作,主線程彈出用戶等待提示框,當操作完成時,提示框自動消失。本論文作品主要用到了Swing庫中的JButton、JLable、JTextField、JTable、JScrollPanel、JFrame、JPanel等組件,用到了AWT庫中的BorderLayout、FlowLayout等布局管理器組件?,F(xiàn)在的用戶總希望我們開發(fā)的軟件功能豐富強大而又操作簡單,這就需要開發(fā)者注重界面的友好性,GUI就成了Java開發(fā)者不可或缺的重要課題。Java技術(shù)憑借著它的高效性、安全性、通用性和平臺移植性,目前被廣泛應用于個人PC、移動電話、科學超級計算機、游戲控制臺和互聯(lián)網(wǎng)等領(lǐng)域。第一章 系統(tǒng)相關(guān)技術(shù)概述第一節(jié) Java技術(shù)概述一、Java簡要介紹Java由Sun Microsystems公司于1995年5月推出的一門面向?qū)ο蟮某绦蛟O計語言,用它編寫的應用程序具有跨平臺的特征。 經(jīng)過這幾年發(fā)展,新浪微博[3]在國內(nèi)社交平臺市場的競爭中算是領(lǐng)先一步,他占據(jù)了大部分用戶群體。在我國,網(wǎng)民以往都是呈原子狀態(tài)的個體分散在全國各區(qū)域,而如今,一個由“網(wǎng)絡化用戶”構(gòu)成的“網(wǎng)眾”群體已悄然崛起,并以數(shù)以億計的龐大用戶群體構(gòu)成了一個“壓力集團”,截至目前,這個集團的數(shù)量與力量還呈現(xiàn)出上升的態(tài)勢[2]。我個人也比較認同王來華教授的觀點。s livelihood from the Internet which is a free and open media, network public opinion information collection and analysis, an important issue has been at all levels of government departments are currently facing.Internet as a new generation of media, the momentum of rapid development, the major portals have to enter the field of Internet to seize the market, petition is very fierce, and Sina in this petition performed very well, Sina microblog public information sharing platform of choice. This thesis is to design a specific Sina microblog public opinion data acquisition system, which includes the following functions: query specifies the user39。該系統(tǒng)是基于新浪官方提供的API來開發(fā)的,采用Java和MySQL實現(xiàn)軟件的開發(fā),Java實現(xiàn)軟件的界面和數(shù)據(jù)展示,MySQL實現(xiàn)數(shù)據(jù)的存儲。 重慶郵電大學畢業(yè)設計(論文)設計(論文)題目:網(wǎng)絡輿情數(shù)據(jù)采集系統(tǒng)開發(fā)學 院 名 稱 :計算機科學與技術(shù)學院學 生 姓 名 :專 業(yè) :信息安全班 級 :學 號 :指 導 教 師 :答辯組 負責人 :填表時間: 2013 年 6 月重慶郵電大學教務處制重慶郵電大學本科畢業(yè)設計(論文)摘 要互聯(lián)網(wǎng)發(fā)展至今,傳統(tǒng)媒體已經(jīng)日漸落寞,作為新生代媒體,網(wǎng)絡已經(jīng)在這一領(lǐng)域占據(jù)了越來越重要的地位,而且這種趨勢還在上漲。本論文就設計了一個專門針對新浪微博的輿情數(shù)據(jù)采集系統(tǒng),它包含如下幾個功能:查詢指定用戶的微博信息、查詢指定微博的評論信息和轉(zhuǎn)發(fā)信息、查詢指定用戶的所有粉絲和搜索該用戶的指定粉絲、查詢指定用戶的所有關(guān)注和搜索該用戶的指定關(guān)注以及將上述信息保存到本地數(shù)據(jù)庫中,供以后對數(shù)據(jù)進行分析?!娟P(guān)鍵詞】網(wǎng)絡輿情 新浪微博 Java MySQL 微博API 61 ABSTRACTSince the development of Internet, traditional media has already lonely, as a new generation of media, the network has bee more and more important in this field, and the trend is still rising. Nowadays, more and more people through the Internet to express themselves on the social status of the attitude and political appeal and so on, to understand the people39。而網(wǎng)絡輿情,則主要指使用網(wǎng)絡者或俗稱“網(wǎng)民”的社會政治態(tài)度[1]。網(wǎng)絡輿情表達快捷、信息多元,方式互動,具備傳統(tǒng)媒體無法比擬的優(yōu)勢。正是基于這樣的形式,網(wǎng)絡輿情數(shù)據(jù)采集分析成為各級政府部門面臨的不可或缺的重要課題。另外,對政府部門來說,他們可以通過研究這些輿情數(shù)據(jù),了解民眾的政治態(tài)度和需求,只有更徹底的了解民生,才能更好的制定政策為人民服務;對于商家來說,他們可以研究這些輿情數(shù)據(jù),了解消費者對他們產(chǎn)品的評價,就能有針對性的對產(chǎn)品進行改善,這樣既能提升產(chǎn)品的質(zhì)量,獲得消費者的信賴,又能增加收益,達到雙贏的目的;對于研究所來說,他們可以對這些數(shù)據(jù)進行數(shù)據(jù)挖掘,實現(xiàn)其相應的價值。 JavaME是一個用來為移動平臺提供的基于Java環(huán)境開發(fā)的技術(shù)規(guī)范的集合。而無論我們是采用 JavaSE、JavaEE 還是 JavaME開發(fā),圖形用戶界面都是我們不能逃避的問題。如果想要實現(xiàn)用戶與界面之間的交互,開發(fā)者還應為程序添加事件監(jiān)聽,讓事件處理來完成響應用戶動作。Java的多線程有兩種實現(xiàn)方式:繼承Thread類和實現(xiàn)Runnable接口。JDBC連接數(shù)據(jù)庫的步驟如下(以MySQL數(shù)據(jù)庫為例):① 加載JDBC驅(qū)動程序()。Connection ct = null。()。 } catch (Exception e) { ()。授權(quán)認證[7]的步驟如下: ① 注冊應用。 ② 填寫配置文件。 ④ 通過code換取access_token。但這些不足絲毫沒有減少它的受歡迎度,相反,這些不足反而成就了它小巧、查詢快捷、健壯易用的優(yōu)點,讓MySQL成為了目前大多數(shù)中小型企業(yè)的首選,由于MySQL是一款開源軟件,這個可以大大降低企業(yè)的開銷成本,這一特點也是MySQL如此受歡迎的原因之一。;⑦ 提供TCP/IP、ODBC和JDBC等多種數(shù)據(jù)庫連接途徑第一節(jié) 系統(tǒng)功能需求一、系統(tǒng)目標網(wǎng)絡輿情很客觀的反應民眾的需求與政治態(tài)度,政府迫切需要了解輿情,正式基于這樣的需求,本系統(tǒng)應運而生,完成微博信息的收集并實現(xiàn)數(shù)據(jù)的展示功能,為后面的輿情分析打下基礎。② 查看用戶的粉絲根據(jù)用戶輸入的微博用戶昵稱關(guān)鍵字,系統(tǒng)單開一個線程向新浪服務器發(fā)出用戶粉絲查詢請求,系統(tǒng)解析服務器返回的結(jié)果,然后系統(tǒng)將返回的粉絲信息分頁顯示。⑤ 搜索指定用戶關(guān)注在查看用戶關(guān)注的時候,有些用戶關(guān)注的人可能特別多,分頁后就會存在很多頁,那么就會很難找某個具體的關(guān)注。⑧ 存儲微博、用戶、關(guān)系、評論、轉(zhuǎn)發(fā)信息在上述功能中獲取到服務器返回的信息解析后就需要把這些信息存儲起來,本系統(tǒng)是采用MySQL數(shù)據(jù)庫來存儲這些信息。系統(tǒng)應該在一般情況下穩(wěn)定運行。包括劃分組成系統(tǒng)的模塊,模塊間的調(diào)用關(guān)系及模塊間的接口關(guān)系,軟件系統(tǒng)所用的數(shù)據(jù)結(jié)構(gòu)或者數(shù)據(jù)庫結(jié)構(gòu)。第一節(jié) 系統(tǒng)結(jié)構(gòu)分析 目前企業(yè)開發(fā)軟件主要采用兩種模式:B/S模式和C/S模式。一、系統(tǒng)結(jié)構(gòu)圖: 系統(tǒng)結(jié)構(gòu)圖第二節(jié) 系統(tǒng)功能模塊分析一、系統(tǒng)模塊設計: 系統(tǒng)模塊設計表功能名稱輸入項輸出項執(zhí)行方式功能描述查看微博用戶輸入的微博用戶昵稱該用戶的所有微博后臺運行查看指定用戶的所有微博信息查看粉絲用戶輸入的微博用戶昵稱該用戶的所有粉絲后臺運行查看指