freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進畢業(yè)論文(存儲版)

2024-10-07 17:21上一頁面

下一頁面
  

【正文】 IMAP 協(xié)議 IMAP( Inter Message Access Protocol) [20]是與 POP3 對應(yīng)的另一種協(xié)議,為美國斯坦福大學(xué)在 1986 年開始研發(fā)的多重郵箱電子郵件系統(tǒng)?,F(xiàn)在有兩種狀態(tài)碼,“確定”(“ +OK”)和“失敗”(“ ERR”)。 POP3 協(xié)議 第一個郵局協(xié)議 (POP)的 RFC 文檔是 1984 年發(fā)表的 RFC918,描述了一個基本的、試驗性的 POP 實現(xiàn)。這個缺陷導(dǎo)致的后果有兩點:假冒他人郵件和濫用別人的 SMTP 服務(wù)器。 長春工業(yè)大學(xué)碩士學(xué)位論文 10 下面是 SMTP 答復(fù)中用到的代碼和含義: 500 Syntax error,mand unrecognized [This may include errors such as mand line too long] 501 Syntax error in parameters or arguments 502 Command not implemented 503 Bad sequence of mands 504 Command parameter not implemented 211 System status,or system help reply 214 Help message [Information on how to use the receiver or the meaning of a particular nonstandard mand。 DATA:收件方把 改 命令之后的數(shù)據(jù)作為發(fā)送的數(shù)據(jù)。 MAIL:這個命令用來開始傳送郵件,它的后面跟隨發(fā)件方郵件地址 (返回郵件地址)。 為了保證回復(fù)命令的有效, SMTP 要求發(fā)件方必須提供接收方的服務(wù)器及郵箱。 SMTP 的一 個重要特點是可以在可交互的通信系統(tǒng)中轉(zhuǎn)發(fā)郵件。服務(wù)器在一個隊列中存儲到達的郵件,等待發(fā)送下一個目的地。對每一個外發(fā)的郵 件 MTA決定接收方的目的地。 在 RFC2822《 Inter 信息格式》 中規(guī)定了電子郵件的標(biāo)準(zhǔn)格式。 RFC821[11] 規(guī)定 SMTP(Simple Mail Transfer Protocol, 簡單郵件傳輸協(xié)議 ),定義發(fā)送郵件的機制。 Inter 問世后的最初應(yīng)用就是電子郵件。 (3) 本文采用互信息的方法 進行 特征 選取 , 計算每個 關(guān)鍵詞 的 RMI 值,利用 RMI值確定特征向量的分量詞條。 隨著我國政府電子政務(wù)的建設(shè),中國加入 WTO,越來越多的企事業(yè)單位會建設(shè)自己的郵件系統(tǒng) /自動化辦公系統(tǒng),提高無紙化辦公,實現(xiàn)電子商務(wù)。 2020 年 12 月成立了一個政府資助的反垃圾郵件聯(lián)盟,以應(yīng)對越來越嚴(yán)重的垃圾郵件問題 [8]。有些病毒利用瀏覽器的漏洞,以郵件的形式把自己偽裝成補丁和安全升級的電子郵件發(fā)送給用戶,只要用戶點擊該郵件,該病毒就會被激活。這樣做可以節(jié)省郵件發(fā)送者經(jīng)費,但是會給被盜用者帶來很多危險,如由于線路擁塞 ,造成系統(tǒng)的癱瘓。 (2) 垃圾郵件侵害了用戶的隱私權(quán)。大量的垃圾郵件在網(wǎng)絡(luò)上傳播,占用了網(wǎng)絡(luò)帶寬,導(dǎo)致網(wǎng)絡(luò)通信質(zhì)量下降,甚至是網(wǎng)絡(luò)發(fā)生擁塞,干擾郵件系統(tǒng)的正常運行,根據(jù) 2020 年的一份研究報告顯示,僅 2020 年垃圾郵件就給全球 ISP造成了至少 1000 萬美元的損失。 很多組織或機構(gòu)都給垃圾郵件下過定義。 1996 年的 1 月,第一個反垃圾郵件組織“自由 騎士”成立; 1996 年 7 月,著名的反垃圾郵件網(wǎng)站SpamHaus 成立,例如使用 的工具來過濾郵件地址。然而,電子郵件在為人們提供極其方便的同時也成為垃圾郵件、病毒、惡意程序或敏感內(nèi)容郵件傳播的重要載體,對系統(tǒng)安全造成了嚴(yán)重的威脅。 目前,應(yīng)對垃圾郵件的主要方法和手段 是 通過反垃圾郵件立法和使用郵件過濾技術(shù)進行處理,現(xiàn)已相繼出現(xiàn)了多種郵件過濾技術(shù)。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標(biāo)明。本人授權(quán) 大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。 本論文對中文垃圾郵件的特點進行了 比較系統(tǒng)的分析和研究,結(jié)合貝葉斯 ( Bayes)理論,構(gòu)造基于貝葉斯分類的垃圾郵件過濾模型,在特征提取方面,采用互信息值的方法 ,在分類方法上,引入了適合本文的分類方法 ,并采用了一種更加適合于貝葉斯計算的表示方法;本文作者采用中國教育科研網(wǎng) ( CERNET) 收集并維護的大量中文垃圾郵件和正常郵件樣本的標(biāo)準(zhǔn)數(shù)據(jù)集,對本文研究的方法進行了大量測試,準(zhǔn)確率和誤判率分別達到了 %和 %。這是第一次使用 Spam(垃圾郵件)一詞,用來描述新聞或電子郵件的主動性發(fā)布。 近幾年來,垃圾郵件的泛濫是由于專門發(fā)送垃圾郵件的服務(wù)器大批涌現(xiàn)。 長春工業(yè)大學(xué)碩士學(xué)位論文 2 (2) 批量性。調(diào)查報告指出企業(yè)雇員通常每日花費 10 分鐘的時間清理收件箱內(nèi)的垃圾郵件。尤其危害大的是,很多垃圾郵件的附件中帶有病毒,一旦收件人打開郵件,附件中的病毒就會對系統(tǒng)造成各種破壞。這些郵件服務(wù)器正是被西方垃圾郵件制造者用來轉(zhuǎn)發(fā)垃圾郵件,這就是所謂“瞎子式轉(zhuǎn)發(fā)”( Blind Relay) ,并被他們彼此以幾百美元的價格互相買賣這種服務(wù)器的地址,最終歐美的很多 ISP 服務(wù)提供商封鎖了中國的 IP 地址段。 國內(nèi)外反垃 圾郵件現(xiàn)狀 雖然垃圾郵件問題是最初從西方開始,以英文垃圾郵件為主,但是它越來越成為一個國際性的問題 [6],很多學(xué)者和技術(shù)人員也開展了反垃圾郵件的研究工作。 國內(nèi)外電子郵件系統(tǒng)相關(guān)各方都進行了大量的工作,包括在電子郵件系統(tǒng)中引入數(shù)字證書,建立各種加密郵件協(xié)議和標(biāo)準(zhǔn),研究郵件防病毒技術(shù)和垃圾郵件過濾技術(shù)等;同時,不少國家都出臺了電子郵件應(yīng)用相關(guān)的法律法規(guī),如電子簽名法、反垃圾郵件 立 法等,對其進行約束和規(guī)范。 研 究目標(biāo)與內(nèi)容 本文的研究目標(biāo)是基于貝葉斯 算法 ,構(gòu)造垃圾郵件過濾模型,并對相關(guān)算法進行分析、比較、驗證和測試,最后基于改進的貝葉斯算法,實現(xiàn)對垃圾郵件的過濾。 電子郵件工作原理簡介 電子郵件的概述 電子郵件( 簡稱 EMail)又稱電子信箱、電子郵政,它是 — 種用電子手段提供信息交換的通信方式。據(jù) 2020 年 3 月份 MessagingOnline 的一份數(shù)據(jù)顯示, Inter 上有 億個郵箱,平均每個 Inter 用戶有 個 。根據(jù)需要傳送各種非文本文件(例如圖像文件、 word 文件、 pdf 文件、zip 文件等),人們又定義了 MIME 標(biāo)準(zhǔn),作為 RFC822 的補充。 RFC 為信頭定義了 20 多個標(biāo)準(zhǔn)字段,包括 Date、 From、 To、 CC、 BCC 等一些必須和非必須的字段,另外,信頭在傳輸過程中并不是一成不變的,隨著郵件的傳輸, MUA 和 MTA 會在信頭上增加一些路徑信息,它們合在一起構(gòu)成收到的信件的信頭部分。 投遞代理 MDA 程序則從信件傳輸代理取得信件傳送至最終用戶的郵箱。 2020 年 4月, RFC2821[17]對該協(xié)議進行了更新。收件方服務(wù)器確認(rèn)可以建立連接后,雙 方 就可以開始通信。命令代碼是大小寫無關(guān)的,如 MAIL 和 mail、 mAIL 是等效的。這個命令會清空有關(guān)的緩沖區(qū),為新的郵件做準(zhǔn)備。如果傳送接受,接收方回復(fù) OK。please tryforwardpath 452 Requested action not taken:insufficient system storage 552 Requested mail action aborted:exceeded storage allocation 553 Requested action not taken:mailbox name not allowed [.,mailbox syntax incorrect] 354 Start mail input。 (4) Received 字段。所有命令以一個 CRLF 對結(jié)束。一旦接受鑒別,服務(wù)器就獲取與客戶郵件相關(guān)的資源,此時進入“操作”狀態(tài),用戶可以發(fā)送命令,檢索郵件的副本,或從永久郵箱中刪除郵件??蛻魴C可先閱讀郵件信息的標(biāo)題和發(fā)送者的名字再決定是否下載這個郵件。 現(xiàn)在, IMAP 為很多客戶端電子郵件軟件所采納,如 Outlook Express、 Netscape 長春工業(yè)大學(xué)碩士學(xué)位論文 13 Messenger 等,支持 IMAP 的服務(wù)器端的軟件也越來越多,如 CriticalPath、 Eudora、Sendmail 等。 反垃圾郵件成為了當(dāng)前亟待解決的問題。行業(yè)控制方面主要是利用實時的黑名單服務(wù)來限制垃圾郵件的傳播。這些郵件將被判斷為垃圾郵件。如果命中率超過了設(shè)置的 閾 值,就認(rèn)為是垃圾郵件。 白名單技術(shù)的原理與黑名單正好相反,其中列出了可信的郵件地址,凡是發(fā)件人地址符合其中地址的郵件,都會被認(rèn)為是正常郵件而被放行。該技術(shù)手段太單一,致命的弱點在于被放入黑名單的少量可疑主機數(shù)目和大量的垃圾郵件發(fā)送者不成比例,即使郵件服務(wù)器支持實時黑名單技術(shù),依然會收到大量的垃圾郵件,無法全面封堵。這種匹配一般都支持正長春工業(yè)大學(xué)碩士學(xué)位論文 16 則表達式的匹配方法,從而提高了掃描的執(zhí)行效率。 (6) 分布協(xié)作的內(nèi)容指紋分析技術(shù) 有些郵件使用假的郵件地址、偽造了郵件頭或利用了開放式轉(zhuǎn)發(fā)功能發(fā)送的。而要讓這些系統(tǒng)增加回應(yīng)質(zhì)詢的能力,需要做大量額外的工作 。 (8) 質(zhì)詢-回應(yīng)技術(shù) 質(zhì)詢-回應(yīng)技術(shù)是一種傳統(tǒng)的身份識別技術(shù),這種技術(shù)就是識別方向被識別方問一些 只有這兩方才可能知道正確答案的問題,通過被識別方回答的正誤來判斷被識別方的身份。由此可以構(gòu)造一種基于貝葉斯算法來實現(xiàn)垃圾郵件過濾 [26]。但在某些需要嚴(yán)格控制郵件內(nèi)容的場合,有一定的使用價值。黑名單技術(shù)的關(guān)鍵就是對黑名單列表的維護和更新。通過對這些信息的過濾,就可以把由同一地址發(fā)出的但收發(fā)信地址和主題隨機的垃圾郵件從眾多的郵件找出來。 (3) 對郵件主題的過濾 這個應(yīng)該算是比較重要的一個過濾了,一般一些垃圾郵件的主題還是有一些共同的特性的。一般情況下,比較理想的方法是,在郵件服務(wù)器端直接將垃圾郵件 屏蔽掉,這樣不僅用戶不會受到垃圾郵件的騷擾,而且服務(wù)器可以減少郵件的處理量,節(jié)約處理器資源和帶寬流量。針對目前的垃圾郵件泛濫的形勢,反垃圾郵件立法的呼聲越來越高,但是反垃圾郵件立法也面臨一系列的問題。同時,由于用戶查閱信息標(biāo)題和決定下載哪些附件,也需要一定時間,因此連接時間也比 POP 方式長。 (2) 離線方式:郵件保留在 Mail 服務(wù)器端,客戶端可以對其進行管理。 (2) 可選的 POP3 命令: APOP:指定郵箱的用戶名及其 MD5 摘要串,在“鑒別”狀態(tài)有效; TOP:用來獲取郵件頭及被預(yù)定義的一塊字符串,在“操作”狀態(tài)有效; UIDL:返回郵件的唯一標(biāo)識符。所有響應(yīng)也是由CRLF 對結(jié)束。 (6) 沒有規(guī)定如何加密傳輸?shù)奈谋?,文本?nèi)容以明文傳送,容易被竊聽。end withCRLF.CRLF S:Blah blah blah... S:.... S:CRLF.CRLF R:250 OK SMTP 協(xié)議本身是一個簡化的郵件遞交協(xié)議,在協(xié)議制定的時候,并未考慮安全方面的需要,因此其存在著幾個安全缺陷 [18]: (1) 缺乏足夠的驗證要求。發(fā)件方在發(fā)出這個 命令并收到 OK答復(fù)前,也不得中斷連接。如果服務(wù)器同意轉(zhuǎn)發(fā),它要更改郵件發(fā)送路徑,把最開始的目的地(該服務(wù)器)換成下一個服務(wù)器。問候和確認(rèn)過程表明兩臺機器可以進行通信,同時狀態(tài)參量被復(fù)位,緩沖區(qū)被清空。整個過程由發(fā)件方控制,有時需要確認(rèn)幾回才可以。在 TCP 上,它使用端口25 進行傳輸。 由于目前使用的 SMTP 協(xié)議是存儲轉(zhuǎn)發(fā)協(xié)議,意味著它允許郵件通過一系的服務(wù)器發(fā)送到最終目的地。 傳輸代理 MTA 軟件負(fù)責(zé)處理所有接收和發(fā)送的郵件。其中,域名由幾部分組成,每一部分稱為一個子域 (Subdomain),各子域之間用圓點“ .”分隔 ,每個子域都會告訴用戶一些有關(guān)這臺郵件服務(wù)器的信息。后來,郵件的協(xié)議和內(nèi)容格式也是由 RFC(Request or Comments)幾個文檔規(guī)定的。 到目前為止,可以說電子郵件是 Inter 資源使用最多的一種服務(wù),電子郵件不只局限于信件的傳遞,還可用來傳遞文件、聲音及圖形、圖 像 等不同類型的信息。計算每個分類向量在各類別中出現(xiàn)的概率,即得到特征向量。目前國際上有兩大類流行的郵件安全系統(tǒng)標(biāo)準(zhǔn):端到端安全郵件標(biāo)準(zhǔn)( PGP)和傳輸層安全郵件標(biāo)準(zhǔn) S/MIME。 我國反垃圾郵件的工作起步較晚,但發(fā)展迅速。 (4) 垃圾郵件成了計算機病毒新的、快速的傳播途徑。因為目前大部分的垃圾郵件是利用第三方服務(wù)器轉(zhuǎn)發(fā) ( OPEN RELAY) 。一項統(tǒng)計報告指出 ISP 業(yè)者為了對抗垃圾郵件,平均每個用戶必須花費 2 元 美金成本 ; 該項報告還 指出垃圾郵件將影響傳輸速度 30%以上。 垃圾郵件危害 [5] 垃圾郵件的泛濫給人們帶來的危害和損失主要體現(xiàn)在以下幾個方面: (1) 垃圾郵件給網(wǎng)絡(luò)運營商 ( ISP) 造成了嚴(yán)重的損失。 垃圾郵件的定義及其危害 垃圾郵件定義 垃圾郵件的英文名稱為 Spam或 Junk Mail,一般使用 Spam一詞。 隨著垃圾郵件的出現(xiàn)和泛濫,人們開始了反垃
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1