freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于音樂網(wǎng)站的過濾式網(wǎng)絡爬蟲的研究畢業(yè)論文(編輯修改稿)

2024-07-24 20:53 本頁面
 

【文章內容簡介】 之間的耦合度得到降低,因此,降低了后期再次開發(fā)的成本,便于維護,可擴展性較強。然而,MVC框架并不總是好的,對于開發(fā)大型項目來說,自然采用MVC框架能夠極大的提高工作效率,降低后期維護的成本,但是對于一些小型的Web項目來說,本身功能比較簡單,若采用MVC框架,則會將一些簡單的代碼分割成復雜的三層,既增加了代碼的復雜度,也降低了代碼編寫的效率,并且小型web項目的維護也不像大型項目那么頻繁,所以,Model 1模式在小型項目中也是有用武之地的。 網(wǎng)絡爬蟲 網(wǎng)絡爬蟲的分類 網(wǎng)絡爬蟲通過技術和功能等不同角度有很多種分類。基于整個web的網(wǎng)絡爬蟲:簡稱全網(wǎng)爬蟲,是最基本的網(wǎng)絡爬蟲。這種網(wǎng)絡爬蟲指從某一個或某幾個初始種子 URL開始,對整個web的資源不斷進行爬取和分析,直到滿足一定的停止條件。這種網(wǎng)絡爬蟲消耗的資源非常大,需要抓取的頁面非常多,所以一般被用來為搜索引擎和大型網(wǎng)絡內容提供商提供數(shù)據(jù)采集服務;基于主題的網(wǎng)絡爬蟲(也被稱作聚集型網(wǎng)絡爬蟲):這種網(wǎng)絡爬蟲會定義一個主題范圍,然后有選擇性的爬取相關頁面。區(qū)別于全網(wǎng)爬蟲不加甄別的進行頁面爬取,聚集型網(wǎng)絡爬蟲需要爬取的頁面少,對于網(wǎng)絡和硬件資源的消耗也大為減少,可以在內容方面得到更快的更新,滿足人們對特定信息的需要。為了進行主題甄別,聚集型網(wǎng)絡爬蟲增加了兩個模塊,一個是鏈接評價模塊,另一個是內容評價模塊。通過對頁面內容和鏈接的重要性進行計算,來決定鏈接的訪問順序。聚焦爬蟲爬行策略實現(xiàn)的關鍵是評價頁面內容和鏈接的重要性,不同的方法計算出的重要性不同,由此導致鏈接的訪問順序也不同;增量式網(wǎng)絡爬蟲:爬取的是新增的和發(fā)生變化的頁面數(shù)據(jù)。傳統(tǒng)的網(wǎng)絡爬蟲在根據(jù)自己的設定爬取一定的數(shù)據(jù)后就會停止對數(shù)據(jù)的繼續(xù)抓取,在一定的周期以后,重新進行一輪數(shù)據(jù)抓取以替代以前的過時的數(shù)據(jù)。但是這樣做會爬取大量的重復資源,在時間和資源上的浪費比較大。增量式網(wǎng)絡爬蟲則較好地解決了這個問題,減少了重復和浪費。但是為了實現(xiàn)這種數(shù)據(jù)抓取方式,需要更高的算法復雜度和技術難度;其它類型的網(wǎng)絡爬蟲:在現(xiàn)實應用中,為了提高性能或者滿足用戶個性化需要,衍生出了一些其它類型的網(wǎng)絡爬蟲。例如,基于用戶個性化的網(wǎng)絡爬蟲:這種爬蟲根據(jù)用戶的興趣過通過與用戶的交互來為用戶提供個性化的數(shù)據(jù)信息,不同用戶搜索同一個關鍵詞會返回不同的結果;基于元搜索的網(wǎng)絡爬蟲:把用戶提交的關鍵字提交到多個搜索引擎,然后在分析整合所得結果后,再把內容返回給用戶。 網(wǎng)絡爬蟲常見搜索策略 由于工作量巨大,所以全網(wǎng)爬蟲通常會采用一些爬行策略來提高效率。常見的策略有如下三種:深度優(yōu)先策略,核心思想是訪問被搜索結構的葉子節(jié)點。從初始的頁面開始,進行深度優(yōu)先的搜索,不斷訪問下一級鏈接,直到不能繼續(xù)深入為止。因此只有當爬蟲爬完一個分支后才可以爬取其它分支。深度優(yōu)先搜索策略的優(yōu)點在于,對于深層嵌套的內容,可以被盡可能的遍歷。但是這種策略也有先天不足,即如果某鏈接形成一個死循環(huán)的話,這種爬行策略會做大量無用功,造成大量的資源損失。廣度優(yōu)先策略,這種搜索策略首先會將當前頁面的所有超鏈接搜索完成后,才會進行下一層頁面的爬行。廣度優(yōu)先策略避免了深度優(yōu)先策略的死循環(huán)問題,而且儲存比較方便,不需要消耗大量空間對中間節(jié)點進行儲存。但是這種搜索策略需要耗費一定時間來訪問到較深層的頁面,而且有很大可能會遺漏一些比較孤立的信息頁面。IP地址搜索策略,網(wǎng)絡爬蟲被賦予一個種子IP地址,繼而對這個初始的地址段后的每個地址中的文檔進行遍歷。并且忽略文檔文件中指向其他站點的鏈接地址。這種搜索策略只對于比較小規(guī)模的搜索比較適合,可以發(fā)現(xiàn)一些較少被引用的頁面的信息。3 音樂網(wǎng)站概要設計 概述 本章主要從需求分析,界面設計和核心功能等三個方面對系統(tǒng)的設計進行了討論。系統(tǒng)設計階段是軟件開發(fā)過程中極其重要的階段,因為它決定了軟件開發(fā)后續(xù)工作的方向,方向選擇方面如果出現(xiàn)錯誤,將對軟件開發(fā)工作造成致命性打擊。在這一階段,需要開發(fā)者從全局的角度進行思考,對系統(tǒng)的整體框架進行討論和設計。 用戶永遠是互聯(lián)網(wǎng)產(chǎn)品的根本,沒有用戶的產(chǎn)品也就失去了意義。所以評價一個互聯(lián)網(wǎng)產(chǎn)品的標準,最重要的就是它是否滿足了用戶的需求。進行需求分析時,首先要明確產(chǎn)品的目標人群,否則需求分析也就無從討論了。在需求分析階段,我們需要進行大量的調研,編寫許多的功能需求文檔,對其可行性做出評估,確立產(chǎn)品需要實現(xiàn)的功能,為后續(xù)的開發(fā)工作打下穩(wěn)定的基石。 面向人群 應當指出,本音樂電臺是為了區(qū)別于市面上大多數(shù)音樂軟件而進行開發(fā)的。開發(fā)的目的在于能夠提供一些市面上同類產(chǎn)品無法做到或者缺失的用戶功能,即根據(jù)用戶的情緒提供個性化的歌曲。一般對于此種功能有要求的用戶,都是追求極致的音樂發(fā)燒友或者對美和藝術有著較高要求的人群。這就對我們音樂電臺的歌曲推薦功能和界面設計方面提出了更高的要求。 功能性需求 需求功能劃分 目前市面上音樂軟件、音樂網(wǎng)站可以說是鱗次櫛比,但遺憾的是,這些音樂產(chǎn)品都沒有自己的特色,流于俗套。大多數(shù)網(wǎng)站只是互相模仿和對國外技術的照搬,同質化趨勢嚴重,忽視了一些用戶群體的需要。通過我們對音樂網(wǎng)站的調研,發(fā)現(xiàn)市面上的音樂產(chǎn)品存在著以下幾點缺陷:需要較長的時間才能適應用戶的口味,不能根據(jù)用戶的情緒來進行歌曲推薦,歌曲分類過于復雜,需找自己喜歡的音樂往往非常令人厭倦。據(jù)此我們開發(fā)出的電臺主要劃分為以下幾個功能模塊:情緒電臺切換,歌曲播放控制,歌曲收藏,音樂展示以及用戶管理。 功能描述音樂展示:在播放歌曲時通過圖形界面為用戶展示相關信息。一方面可以為用戶展示出歌曲專輯信息、演唱者信息、播放進度、所處情緒電臺信息,另一方面也可以為用戶帶來視覺上美的享受。歌曲播放控制:這是音樂電臺最基本的交互功能。本電臺以簡單、省心為出發(fā)點,只為用戶提供了三個播放控制交互,分別是播放/暫停,隨機播放,下一首。收藏:作為一個針對用戶的個性化電臺,收藏功能當然是必不可少的。當用戶對當前播放的歌曲非常喜歡時,可以通過點擊右下方的紅心按鈕進行收藏。 用戶管理:本電臺之所以可以幾乎不用花費時間來適應用戶的口味。使用本電臺。 情緒電臺選擇:本電臺從功能上講是一種情緒電臺。它的核心功能就是給用戶推薦適合用戶當前情緒下收聽的同時也適合用戶口味的歌曲。它可以通過一些算法計算當前應該播放的電臺的情緒,也可以通過用戶點擊情緒模塊中的up、down、low、high幾個情緒分類來自行決定要收聽哪類情緒電臺。 性能需求 流暢性:通過優(yōu)化代碼邏輯,界面邏輯和系統(tǒng)邏輯,提高系統(tǒng)的反應速度,優(yōu)化系統(tǒng)的性能,使得用戶體驗更加流暢。穩(wěn)定性:通過代碼的設計和系統(tǒng)的測試,來盡量消除系統(tǒng)存在的bug,增強系統(tǒng)的容錯能力,從而提高用戶體驗。易用性:實現(xiàn)設計的功能,滿足產(chǎn)品面向人群的需求,減少不必要的冗繁操作,讓用戶使用起來更加的方便、簡單??删S護性:軟件開發(fā)不是一件一勞永逸的事。再高明的設計也往往會存在一些意想不到的缺陷,或者有須要提升的空間。所以系統(tǒng)的設計應該為以后的維護提供便利,緊跟先進的技術和理念,不斷對系統(tǒng)進行更新?lián)Q代。 本系統(tǒng)基于mvc設計模式,采用了簡潔流行的Python編程語言,利用tornado框架,使用MySQL+Redis組成的高性能數(shù)據(jù)庫,進行系統(tǒng)的開發(fā)。 操作系統(tǒng)要求:windows xp以上,Mac OS,Linux。 編程工具:Sublime Text2 服務器需求:tornado web端服務器。 數(shù)據(jù)庫:MySQL;Redis。 界面設計 技術手段 本網(wǎng)站的前臺采用了目前最流行的CSS+ HTML5+JSP技術,界面美觀大方,代碼邏輯清晰。 設計風格 簡約:極簡的設計風格是一種趨勢。在這個越來越快節(jié)奏的現(xiàn)代社會,人們穿梭在鋼筋水泥之中,疲憊不堪。我們需要一個去偽存真,簡單純凈的地方來休憩心靈。例如ios從擬物化的設計到扁平化的設計,其實就是一個去除紛繁的細節(jié),突出本質的過程。 沉浸式:通過復雜的算法和簡潔的交互,讓用戶無需花費精力進行冗雜的播放控制,用戶可以全身心的投入到音樂的世界中,得到流暢的、沉浸式的音樂體驗。 統(tǒng)一性:不同界面之間有著統(tǒng)一的色彩與布局設計,整個音樂網(wǎng)站帶給用戶一種一致的視覺體驗。同一個界面之中不同模塊與動畫過度效果具有一致的設計,不會帶給用戶分裂的感覺。 界面設計方案 軟件框架設計本電臺的框架設計遵從簡潔至上的原則。在主要播放界面,絕大部分面積分配給電臺圖像展示模塊。電臺占據(jù)了屏幕左側和中間的位置。不同情緒的電臺,會配上相應的一些唯美圖像。當用戶在欣賞歌曲時,會在不經(jīng)意間被這些圖像吸引,陷入光和影的無限遐想之中。右側從上到下依次為專輯信息展示,歌曲播放控件,收藏按鈕。用戶所需的交互只在一個界面內就可以完成。 軟件啟動封面設計 一個軟件的啟動界面是非常重要的,因為用戶的第一影響往往就來自啟動界面。本電臺啟動界面采取的封面是一張典雅的高清晰度的老式收音機與一臺筆記本電腦組合的圖像,滿含懷舊的音樂風情又不失現(xiàn)代的科技感。位于界面中部偏上是本電臺的圖標,中下部是一枚精致的開啟電臺的按鈕。精心的圖形設計和美麗的動畫效果非常打動人心,給人以美的感受。軟件的按鈕設計借鑒了目前流行的扁平化設計。不同于擬物化設計,扁平化的設計能起到減輕視覺負擔的作用。大腦在處理扁平抽象的圖形時,會把注意力集中到圖形本身的功能上來,而不會去太多處理圖像細節(jié),這樣一來,起到了給人減壓放松的心里效果。本電臺的按鈕設計具有豐富的動態(tài)效果,例如靜態(tài)效果、點擊效果、鼠標放在上面未點擊的效果、獨立變化效果等等,是一套精致美麗的系統(tǒng)。 標簽設計 本電臺去掉了繁瑣的標簽。一方面是為了提高界面的美觀和簡潔,另一方面也是因為本電臺力求實現(xiàn)一鍵式收聽體驗,將復雜性隱藏在后臺之中,簡化去掉了一些繁瑣的功能和設置項。 圖標設計 對于一個互聯(lián)網(wǎng)產(chǎn)品來說,圖標的設計是非常重要的。一個美觀的圖標會大大提高用戶的觀感和喜愛程度。前一段時間很火的錘子系統(tǒng),它最為人稱道的一個特點就是針對市面上的安卓應用,盡量為每一個應用設計一個美觀的圖標,這使得它的界面與其他系統(tǒng)相比有了很大的提升。本電臺名為”mizar”,圖標使用銀白色半透明字體,給人以純潔,干凈的感覺,在暗色調背景的襯托下,更有一種出淤泥而不染的格調。, 上爬取用戶收聽的歌曲信息,通過一系列的分析和組織,轉化為程序需要的內容和樣式,存儲在數(shù)據(jù)庫中。 歌曲推薦功能爬蟲爬取的數(shù)據(jù),會保存到兩張表中,一張是用戶收聽記錄,另一張是推薦歌曲列表。根據(jù)這兩張表中的歌曲標簽信息,程序會通過一定的算法,得到一個推薦歌曲的播放隊列。在歌曲的播放過程中,程序會記錄用戶的歌曲切換次數(shù)。當切換次數(shù)達到一定的閾值后,程序將會改變推薦歌曲的風格,更新歌曲的播放隊列。4 數(shù)據(jù)庫設計 本電臺需要將爬蟲獲取的信息有效存儲在數(shù)據(jù)庫中,這部分信息包括兩部分,一個是用戶收聽歌曲記錄,另一個是推薦歌曲列表。
點擊復制文檔內容
外語相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1