freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進(jìn)畢業(yè)論文-資料下載頁

2025-08-19 17:21本頁面

【導(dǎo)讀】取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任。何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢。獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的。法律后果由本人承擔(dān)。本人授權(quán)大學(xué)可以將本學(xué)位論文的全部或。涉密論文按學(xué)校規(guī)定處理。然而,垃圾郵件的產(chǎn)生,影響了正常的電子郵件通信,占用了傳輸帶寬,對系。統(tǒng)安全造成了嚴(yán)重的威脅。因此,研究反垃圾郵件問題已經(jīng)成為全球性的具有重大現(xiàn)。術(shù)進(jìn)行處理,現(xiàn)已相繼出現(xiàn)了多種郵件過濾技術(shù)。常用的包括黑/白名單技術(shù)、基于內(nèi)。容的分析方法以及基于規(guī)則的方法等。于貝葉斯算法的垃圾郵件過濾模型。和誤判率分別達(dá)到了%和%。結(jié)果表明基于貝葉斯算法的垃圾郵件過濾系統(tǒng)對。攔截垃圾郵件有很好的作用。

  

【正文】 有兩種狀態(tài)碼,“確定”(“ +OK”)和“失敗”(“ ERR”)。 在 POP3 會話中,用戶首先激活一個 POP3 客戶,該客戶創(chuàng)建一個 TCP 連接,連到 有郵箱的計算機(jī)上的 POP3 服務(wù)器,一旦 POP3 服務(wù)器發(fā)送確認(rèn)信息,就進(jìn)入了“鑒別”狀態(tài)。在此狀態(tài)中用戶發(fā)送登錄名和口令,以鑒別會話。一旦接受鑒別,服務(wù)器就獲取與客戶郵件相關(guān)的資源,此時進(jìn)入“操作”狀態(tài),用戶可以發(fā)送命令,檢索郵件的副本,或從永久郵箱中刪除郵件。當(dāng)客戶發(fā)出 QUIT 命令時,此過程進(jìn)入“更新”長春工業(yè)大學(xué)碩士學(xué)位論文 12 狀態(tài)。在此狀態(tài)中, POP3 服務(wù)器釋放在“操作”狀態(tài)中取得的資源,并發(fā)送消息,終止連接。 (1) 基本的 POP3 命令: USER:郵箱登錄名,在“鑒別”狀態(tài)有效; PASS:郵箱口令; QUIT:斷開與服務(wù)器連接; STAT:返回服務(wù)器狀態(tài)信息,一般為兩個參數(shù),第一個是郵件總數(shù),第二個是郵件總大小,在“操作”狀態(tài)有效; LIST:列出郵件清單,返回郵件編號和大??; RETR:收取指定郵件全部內(nèi)容; DELE:標(biāo)記郵件刪除,直到執(zhí)行 QUIT 時才真正刪除; NOOP:用來檢查同服務(wù)器的連接; RSET:移除所有刪除標(biāo)記; QUIT:終止連接,在“更新”狀態(tài)有效。 (2) 可選的 POP3 命令: APOP:指定郵箱的用戶名及其 MD5 摘要串,在“鑒別”狀態(tài)有效; TOP:用來獲取郵件頭及被預(yù)定義的一塊字符串,在“操作”狀態(tài)有效; UIDL:返回郵件的唯一標(biāo)識符。 IMAP 協(xié)議 IMAP( Inter Message Access Protocol) [20]是與 POP3 對應(yīng)的另一種協(xié)議,為美國斯坦福大學(xué)在 1986 年開始研發(fā)的多重郵箱電子郵件系統(tǒng)。它能夠從郵件服務(wù)器上獲取有關(guān) Emai1 的信息或直接收取郵件,具有高性能和可擴(kuò)展的優(yōu)點。它可以決定客戶機(jī)程序請求郵件服務(wù)器提交所收到郵件的方式,請求郵件服務(wù)器只 下載所選中的郵件而不是全部郵件??蛻魴C(jī)可先閱讀郵件信息的標(biāo)題和發(fā)送者的名字再決定是否下載這個郵件。 IMAP 通過客戶機(jī)的電子郵件程序可在服務(wù)器上創(chuàng)建并管理郵件文件夾或郵箱、刪除郵件、查詢某一封信的一部分或全部內(nèi)容,完成所有這些工作時都不需要把郵件從服務(wù)器下載到個人計算機(jī)上。 IMAP 提供操作的三種模式: (1) 在線方式:郵件保留在 Mail 服務(wù)器端,客戶端可以對其進(jìn)行管理。其使用方式與 Web Mail 相類似。 (2) 離線方式:郵件保留在 Mail 服務(wù)器端,客戶端可以對其進(jìn)行管理。這與 POP協(xié)議一樣。 (3) 分離方式:郵件的一部分在 Mail 服務(wù)器端,一部分在客戶端。這與一些成熟的組件包應(yīng)用(如 Lotus Notes/Domino)的方式類似。 現(xiàn)在, IMAP 為很多客戶端電子郵件軟件所采納,如 Outlook Express、 Netscape 長春工業(yè)大學(xué)碩士學(xué)位論文 13 Messenger 等,支持 IMAP 的服務(wù)器端的軟件也越來越多,如 CriticalPath、 Eudora、Sendmail 等。 但是實現(xiàn) IMAP 也有不足。首先,在利用服務(wù)器磁盤資源方面 IMAP 不如 POP3,由于使用 POP 時服務(wù)器端的郵件被下載到客戶機(jī)的同時會刪除,因而不占用額外 空間用以存放舊的郵件。而 IMAP 服務(wù)器將保持舊的郵件,占用了額外空間,而且需要定期地刪除舊郵件。同時,由于用戶查閱信息標(biāo)題和決定下載哪些附件,也需要一定時間,因此連接時間也比 POP 方式長。在應(yīng)用方面,由于 IMAP 比較復(fù)雜,給開發(fā)者開發(fā)服務(wù)器和客戶機(jī)的軟件帶來一些難題。 非技術(shù)手段反垃圾郵件 垃圾郵件正以每年 5%的速度遞增。這意味著人們每周都會收到數(shù)千封不請自來的電子郵件,這些垃圾郵件不僅消耗了電子郵件網(wǎng)關(guān) 75%的處理能力,使垃圾郵件使得網(wǎng)絡(luò)線路繁忙 , 服務(wù)器性能大打折扣 ; 而且也浪費了員工的大量時間和精 力。 反垃圾郵件成為了當(dāng)前亟待解決的問題?,F(xiàn)在非技術(shù)手段有以下幾種: (1) 立法模式。立法模式是由國家和政府主導(dǎo)的模式,這種模式的基本做法是由國家通過立法的方法,從法律上確立網(wǎng)絡(luò)隱私保護(hù)的各項基本原則與各項具體的法律、規(guī)定和制度,并在此基礎(chǔ)上建立相應(yīng)的司法或者行政措施。例如,一旦確認(rèn)某個團(tuán)體或個人發(fā)送垃圾郵件,那他將面臨法律的制裁與處罰。針對目前的垃圾郵件泛濫的形勢,反垃圾郵件立法的呼聲越來越高,但是反垃圾郵件立法也面臨一系列的問題。如垃圾郵件的定義,即到底什么樣的郵件是垃圾郵件。其次就是法律的執(zhí)行問題, 即給予什么樣的處罰才是得當(dāng)?shù)模胰绻鄙賴H合作,即使發(fā)現(xiàn)來自境外的垃圾郵件,也無法制裁。 (2) 行業(yè)自律模式。行業(yè)控制方面主要是利用實時的黑名單服務(wù)來限制垃圾郵件的傳播。 (3) 利用垃圾郵件過濾技術(shù)。近年來,有關(guān)垃圾郵件過濾技術(shù)的研究開始逐步興起,相關(guān)的投入也越來越大,涌現(xiàn)了一大批相關(guān)產(chǎn)品,如果能從技術(shù)上解決垃圾郵件問題,那是最理想的垃圾郵件解決方法了 [21]。 常用反垃圾郵件技術(shù) 一般來說,反垃圾郵件的方法有服務(wù)器端和客戶端兩種。一般情況下,比較理想的方法是,在郵件服務(wù)器端直接將垃圾郵件 屏蔽掉,這樣不僅用戶不會受到垃圾郵件的騷擾,而且服務(wù)器可以減少郵件的處理量,節(jié)約處理器資源和帶寬流量。但是,相當(dāng)多的電子郵件服務(wù)提供商,并沒有把這件事做好,特別是一些不夠規(guī)范的免費電子郵件提供商 (有些免費的電子郵件服務(wù)提供商甚至向別的廠商和公司收取費用直接往長春工業(yè)大學(xué)碩士學(xué)位論文 14 自己的免費用戶郵箱里投放廣告郵件 )。如果是這樣,我們只能在客戶端這最后的一道防線上去抵擋垃圾郵件的進(jìn)攻了。 客戶端垃圾郵件過濾技術(shù) 在客戶端可以對以下幾種內(nèi)容進(jìn)行過濾 [22]: (1) 對發(fā)件人地址的過濾 這項技術(shù)就是依據(jù)發(fā)件人地址進(jìn)行判斷是否 是垃圾郵件, 例如不合法的郵件地址就會認(rèn)為是垃圾郵件,如 ????@163. ,和一些不合規(guī)范的郵件地址及空地址,如lakdjfhkiu}lkdfnehgugnuoi,lkjsfuiern}。這些郵件將被判斷為垃圾郵件。 (2) 對收件人地址的過濾 大家可能會說,收件地址不就 是 我的郵箱地址嗎 ?這還需要過濾 ?當(dāng)然,收件人地址也是可以用來發(fā)送垃圾郵件的。這種情況就是考慮到郵件列表了,因為郵件列表在發(fā)送的時候,收件人地址只是一個列表的名稱,所以,雖然有些郵件收件人不是你,但是,是以郵件 列表的形式發(fā)送的,所以,你還是會收到的。對于收件人地址的檢查和過濾也是必要的。 (3) 對郵件主題的過濾 這個應(yīng)該算是比較重要的一個過濾了,一般一些垃圾郵件的主題還是有一些共同的特性的。比如前一段時間鬧的比較兇的 SoBig. F 病毒,一共以 9 個主題來發(fā)送病毒郵件,發(fā)件人和收件人地址都不確定,只要你過濾掉這 9 個主題,你就不會受到 SoBig. F 病毒所發(fā)送的垃圾郵件騷擾了。 (4) 對郵件內(nèi)容關(guān)鍵字的過濾 郵件內(nèi)容的過濾一般以一個關(guān)鍵字詞或多個關(guān)鍵字詞為判斷依據(jù)。根據(jù)關(guān)鍵字詞的命中率來確認(rèn)這封郵件是否是垃圾郵件 。如果命中率超過了設(shè)置的 閾 值,就認(rèn)為是垃圾郵件。同時關(guān)鍵字詞還可以是短語和短句。 (5) 對郵件頭信息過濾 郵件頭信息是記錄郵件投遞過程的原始信息,這一點對垃圾郵件有著非常重要的意義 。雖然垃圾郵件發(fā)送者在發(fā)送垃圾郵件的時候,可以利用各種的工具隨機(jī)偽造不同的收發(fā)件人、主題和內(nèi)容,但是在郵件頭信息中,這些郵件還是有一些共同的信息的,主要是 IP、主機(jī)名、 X標(biāo)識。通過對這些信息的過濾,就可以把由同一地址發(fā)出的但收發(fā)信地址和主題隨機(jī)的垃圾郵件從眾多的郵件找出來。 服務(wù)器端垃圾郵件過濾技術(shù) 在服務(wù)器端有以 下幾種過濾技術(shù): (1) 基于黑 /白名單的過濾技術(shù) 黑名單技術(shù)的原理是管理員收集、歸納和整理垃圾郵件的發(fā)件人地址,并制作成一個地址列表,即所謂的黑名單。如果郵件的發(fā)件人與已知的垃圾郵件地址相同,就長春工業(yè)大學(xué)碩士學(xué)位論文 15 認(rèn)為該郵件是垃圾郵件,并拒收該郵件。該方法的缺點是垃圾郵件基本上都是采用了偽造和變換發(fā)件人地址的手段,單靠管理員的手工處理根本不可能構(gòu)造出一個及時有效的黑名單列表。 白名單技術(shù)的原理與黑名單正好相反,其中列出了可信的郵件地址,凡是發(fā)件人地址符合其中地址的郵件,都會被認(rèn)為是正常郵件而被放行。該方法的缺點是如果用戶希 望收到來自某一地址的電子郵件,用戶必須事先設(shè)置允許接收這一地址郵件的規(guī)則。如果以前獲得批準(zhǔn)的客戶改變了郵件地址,用戶必須將新地址寫入白名單,否則就收不到來自這位客戶的電子郵件。 (2) 實時黑名單技術(shù) 黑名單技術(shù) [23]是人們收集垃圾郵件的地址,組成一個列表后應(yīng)用到郵件服務(wù)器,郵件服務(wù)器在轉(zhuǎn)發(fā)過程中丟棄那些地址來自黑名單的郵件。黑名單技術(shù)的關(guān)鍵就是對黑名單列表的維護(hù)和更新?,F(xiàn)在垃圾郵件大量增加,如果靠使用者手動維護(hù)黑名單很難應(yīng)付,針對這種情況,實時黑名單 (簡稱 RBL)技術(shù)應(yīng)運而生,該技術(shù)結(jié)合 DNS 查詢實現(xiàn) 對黑名單的自動更新。具體來說一個使用 RBL 技術(shù)的軟件要確定某一 IP 地址是否應(yīng)該被列入黑名單,會向黑名單服務(wù)器發(fā)出 DNS 查詢,黑名單服務(wù)器查詢黑名單后會將結(jié)果反饋給查詢計算機(jī)。 目前國內(nèi)支持地址黑名單的服務(wù)器比較多,很多郵件服務(wù)器軟件都是默認(rèn)支持實時黑名單技術(shù),但從實際的角度來看,這種方式并不是非常有效。該技術(shù)手段太單一,致命的弱點在于被放入黑名單的少量可疑主機(jī)數(shù)目和大量的垃圾郵件發(fā)送者不成比例,即使郵件服務(wù)器支持實時黑名單技術(shù),依然會收到大量的垃圾郵件,無法全面封堵。 (3) 基于靜態(tài)內(nèi)容過濾 [24]技術(shù) 靜態(tài)內(nèi)容過濾實際上只對“規(guī)矩”的垃圾郵件有效,這些規(guī)矩的垃圾郵件常常是網(wǎng)絡(luò)營銷的廣告,有些更規(guī)矩的廣告在郵件主題上提示“ ADV:”,這種郵件其實反而不是最主要防范的郵件,如果用戶不想接收廣告郵件,只需簡單過濾郵件主題,發(fā)現(xiàn)ADV即拒收。例如一些詞匯“免費”被變成“免 … 費”或“免 費” ,令垃圾郵件過濾防不勝防,同時導(dǎo)致了正常郵件如果使用了這些詞匯也被拒絕。因此,基于關(guān)鍵詞的郵件內(nèi)容過濾技術(shù)在實用中會導(dǎo)致很高的誤判率。但在某些需要嚴(yán)格控制郵件內(nèi)容的場合,有一定的使用價值。 (4) 郵件掃描技術(shù) [25] 如果 郵件服務(wù)器能夠?qū)邮盏泥]件進(jìn)行掃描,并按照指定的規(guī)則對郵件進(jìn)行匹配,一旦接收的郵件和垃圾郵件匹配成功,就認(rèn)為本次接收的郵件是垃圾郵件并自動刪除該郵件。目前,郵件掃描檢查三個方面:郵件主題、郵件內(nèi)容、郵件附件。 郵件主題掃描的實現(xiàn)比較簡單,就是掃描接收的每一個郵件,對郵件主題的關(guān)鍵字進(jìn)行過濾,凡是符合預(yù)定義關(guān)鍵字值的就認(rèn)為是垃圾郵件。這種匹配一般都支持正長春工業(yè)大學(xué)碩士學(xué)位論文 16 則表達(dá)式的匹配方法,從而提高了掃描的執(zhí)行效率。 目前,市場上常用的反垃圾郵件軟件提供此郵件主題掃描和郵件附件掃描功能,支持郵件內(nèi)容掃描的反垃圾郵件軟件很少。在 實施中很難對付會自動變化主題的垃圾郵件,帶來了很高的誤判率。 (5) 基于貝葉斯分析垃圾郵件過濾技術(shù) 垃圾郵件的貝葉斯分析技術(shù),就是利用貝葉斯定理,以已知垃圾郵件和非垃圾郵件為樣本,通過對樣本郵件內(nèi)容的分析和統(tǒng)計,來計算下一封郵件可能是垃圾郵件的概率。由此可以構(gòu)造一種基于貝葉斯算法來實現(xiàn)垃圾郵件過濾 [26]。 可以根據(jù)特有的垃圾郵件和合法消息來進(jìn)行定制。由于貝葉斯算法預(yù)設(shè)的先驗概率是通過經(jīng)驗來確定的,由此其預(yù)設(shè)值未必是最合適的,所以應(yīng)增加自學(xué)習(xí)功能,通過不斷校正預(yù)設(shè)的先驗概率來提高郵件過濾的準(zhǔn)確率。 貝葉斯 技術(shù)克服了傳統(tǒng)內(nèi)容分析技術(shù)準(zhǔn)確性低、誤判率高的缺陷,不需要預(yù)先搜集和編制關(guān)鍵詞表,可以實現(xiàn)對樣本的自動采集和學(xué)習(xí),貝葉斯過濾器是目前比較好的過濾器,我們將在本文第 三 章對它進(jìn)行詳細(xì)闡述。 (6) 分布協(xié)作的內(nèi)容指紋分析技術(shù) 有些郵件使用假的郵件地址、偽造了郵件頭或利用了開放式轉(zhuǎn)發(fā)功能發(fā)送的。但每個收件人必須看了內(nèi)容以后才知道該郵件是垃圾郵件,利用分布協(xié)作的內(nèi)容指紋過濾方法對此類郵件有很好的過濾作用。 分布協(xié)作分析的主要原理:從郵件中提取出可以代表內(nèi)容的指紋數(shù)據(jù),不同的內(nèi)容會產(chǎn)生不同的指紋,用這些指紋代表郵件 ,全球的兼容用戶會提交郵件的指紋,從服務(wù)器得到響應(yīng),以知道有多好封相同的郵件在全球傳播,這樣來識別郵件是否為垃圾郵件。 (7) 反向域名驗證技術(shù) 對收到郵件的來源 IP 地址采用反向 DNS 查找驗證真實性,如果反向 DNS 查找提供的域與郵件上的來源 IP 地址相符合,該郵件被接受,如果不符合,系統(tǒng)認(rèn)定該郵件是垃圾郵件予以拒絕,但由于現(xiàn)在很多反向 DNS 目錄未被有效建立或無法正常建立,造成反向域名驗證產(chǎn)生不可接受的高誤報率。 (8) 質(zhì)詢-回應(yīng)技術(shù) 質(zhì)詢-回應(yīng)技術(shù)是一種傳統(tǒng)的身份識別技術(shù),這種技術(shù)就是識別方向被識別方問一些 只有這兩方才可能知道正確答案的問題,通過被識別方回答的正誤來判斷被識別方的身份。但這種技術(shù)要求反垃圾郵件系統(tǒng)預(yù)先和全部可能的發(fā)件人定下一個或多個秘密問題及答案。 很多系統(tǒng)會自動產(chǎn)生郵件,而這些自動產(chǎn)生郵件的系統(tǒng),絕大多數(shù)都不具備回應(yīng)質(zhì)詢的能力。這就會是反垃圾郵件系統(tǒng)認(rèn)為這些系統(tǒng)自動產(chǎn)生的郵件是偽裝過的郵件,被錯誤 的丟棄。而要讓這些系統(tǒng)增加回應(yīng)質(zhì)詢的能力,需要做大量額外的工作 。 長春
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1