freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

本科畢業(yè)論文-互聯(lián)網(wǎng)垃圾郵件防御系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

2025-06-07 16:16本頁(yè)面
  

【正文】 .join(message[1])) 。) message = (mailNO) mail=(39。) mailNO, mailSize = (39。+fname, 39。 f = open(mailDir+39。+fname): fname = ()+39。 while (mailDir+39。+ for item in ()[1]: fname = ()+39。 try: s = (POP3SERVER) error=() error=() numMsgs, mboxSize=() except Exception, errmsg: return mailDir = 39。 圖 83 顯示郵件詳細(xì)內(nèi)容界面 代碼片段: def recvMail(self): 27 POP3SERVER=39。attachment39。ContentDisposition39。rb39。/39。application/octetstream39。39。To39。From39。Subject39。39。39。 圖 81 主窗體界面 25 2. 發(fā)送郵件 點(diǎn)擊工具欄上的新建郵件按鈕,在編輯郵件的窗體中輸入接收人的地址、郵件主題、郵件正文,點(diǎn)擊導(dǎo)入文本按鈕可以導(dǎo)入已經(jīng)備好的文本內(nèi)容,點(diǎn)擊發(fā)送按鈕發(fā)送郵件。 退 出準(zhǔn) 備登 錄 郵 箱接 收 郵 件移 至 垃 圾 箱存 入 收 件 箱是 否 為 垃 圾郵 件NY 圖 71 郵件接收流程圖 23 2. 郵件發(fā)送流程圖 用戶首先登陸到服務(wù)器,對(duì)郵件進(jìn)行編輯后發(fā)送郵件;如果發(fā)送成功,會(huì)提示發(fā)送成功;如果發(fā)送失敗,會(huì)顯示錯(cuò)誤信息。每次 收到郵件會(huì)通過(guò)黑白名單和規(guī)則過(guò)濾對(duì)郵件進(jìn)行識(shí)別。 垃圾郵件處理: 輸入:被標(biāo)記為“垃圾”的郵件; 輸出:無(wú); 描述:經(jīng)過(guò)識(shí)別算法識(shí)別之后的郵件,如果被標(biāo)記為垃圾郵件,直接放入到垃圾箱中。 分詞: 輸入:字符串; 輸出: 由詞構(gòu)成的列表; 描述:將輸入的連續(xù)的中文句子分割成一個(gè)個(gè)詞組,用來(lái)進(jìn)行進(jìn)一步的查找匹配。 5. 規(guī)則過(guò)濾 輸入:接收到的新郵件; 輸出:該郵件是否為垃圾郵件; 21 描述:對(duì)該郵件進(jìn)行分詞。 4. 黑白名單過(guò)濾 輸入:接收到的新郵件; 輸出:該郵件是否為垃圾郵件; 描述:解析郵件中的發(fā)件人信息,首先在白名單中查找,如果查找到匹配項(xiàng),將該郵件標(biāo)志為正常郵件;然后在黑名單中查找,如果查找到匹配項(xiàng)就標(biāo)志為垃圾郵件。 3. 郵件接收模塊 該模塊用于從服務(wù)器接收郵件。 編輯并發(fā)送郵件: 輸入:收件人地址、郵件內(nèi)容; 輸出:郵件發(fā)送狀態(tài); 描述:通過(guò)郵件服務(wù)器,將編輯好的郵件發(fā)送到指定的地址。登陸成功,提示用戶登陸成果;如 果登陸失敗,根據(jù)服務(wù)器的反饋信息提示用戶登陸失敗原因。 郵 件 系 統(tǒng)郵件接收模塊郵箱認(rèn)證模塊郵件發(fā)送模塊垃圾郵件識(shí)別模塊 圖 61 系統(tǒng)模塊功能圖 20 七 、系統(tǒng)詳細(xì) 設(shè)計(jì) (一)功能設(shè)計(jì) 1. 郵箱認(rèn)證模塊 該模塊用于客戶端和郵件服務(wù)器連接,并向服務(wù)器認(rèn)證。 另外,系統(tǒng)還應(yīng)該具備安裝簡(jiǎn)單,容易配置和使用,界面友好等特點(diǎn),對(duì) 用戶目前的使用習(xí)慣也充分考慮。 (2)垃圾郵件過(guò)濾功能 本系統(tǒng)具有過(guò)濾垃圾郵件功能,這是系統(tǒng)最關(guān)鍵的一項(xiàng)功能。系統(tǒng)應(yīng)具備的功能主要有: (1)接收郵件和發(fā)送郵件的功能 本系統(tǒng)提供友好的界面,可以使用本系統(tǒng)訪問(wèn)并讀取用戶郵箱中的電子郵件。 規(guī)則庫(kù):用戶可以查看、修改規(guī)則庫(kù),系統(tǒng)根據(jù)規(guī)則庫(kù)的內(nèi)容對(duì)垃圾郵件進(jìn)行識(shí)別。 2. 核心功能 為了能夠識(shí)別垃圾郵件 需要黑白名單和基于規(guī)則的識(shí)別機(jī)制,用戶可以自定義黑白名單和規(guī)則庫(kù),系統(tǒng)能夠根據(jù)用戶設(shè)置的規(guī)則來(lái)識(shí)別出垃圾郵件。點(diǎn)擊發(fā)送郵件按鈕,能夠?qū)⑧]件發(fā)送到目標(biāo)收件人中。鼠標(biāo)點(diǎn)擊郵件標(biāo)題,能夠顯示郵件的內(nèi)容,包括郵件發(fā)件人信息,郵件時(shí)間,郵件正文內(nèi)容等。 18 1. 基本功能 為了能夠查看郵件 需要一個(gè)圖形化的界面顯示收件箱中郵件列表。分析并確認(rèn)各個(gè)功能的權(quán)重以及工作量。 從當(dāng)前情況來(lái)看,本軟件的開(kāi)發(fā)是可行的。 4. 調(diào)度可行性 調(diào)度可行性指的是建議的計(jì)算機(jī)系統(tǒng)能否在規(guī)定的期限內(nèi)交付給用戶。 3. 操作可行性 操作可行性是指人員的手工操作而不是指計(jì)算機(jī)系統(tǒng)操作是否可行,也就是說(shuō)在實(shí)現(xiàn)了建議的計(jì)算機(jī)系統(tǒng)后,所需要的配合的手工操作是否可行。簡(jiǎn)單地說(shuō),經(jīng)濟(jì)可行性研究是確定得自新系統(tǒng)的節(jié)省和利益,將這些利益和系統(tǒng)的實(shí)現(xiàn)成本相比較,如果利益超過(guò)成本,則開(kāi)發(fā)新系統(tǒng)的決策是肯定的;否則的話,除非有其他特殊原因,這個(gè)決策將是否定的。 2. 經(jīng)濟(jì)可行性 這是經(jīng)典的并且是最常使用的評(píng)價(jià)計(jì)算機(jī)系統(tǒng)的方法?,F(xiàn)代計(jì)算機(jī)硬、軟件技術(shù)的飛速發(fā)展,為系統(tǒng)建設(shè)提供了技術(shù)條件。 1. 技術(shù)可行性 技術(shù)可行性的考慮集中在現(xiàn)存的計(jì)算機(jī)硬件能否支持被研究的系統(tǒng),首先關(guān)心的是該組織是否有相應(yīng)的軟件和硬件能夠支持處理建議的應(yīng)用程序。這里相對(duì)短和相對(duì)低是指和實(shí)現(xiàn)建議系統(tǒng)所需時(shí)間和成本相比較而 言。 本文針對(duì)切詞破壞,使用第三層過(guò)濾,定義敏感關(guān)鍵字表,將“免費(fèi)”、“色情”等敏感關(guān)鍵字存儲(chǔ)到敏感關(guān)鍵字表中,然后使用一種改進(jìn)的中文關(guān)鍵字匹配算法進(jìn)行第三層過(guò)濾。 切詞破壞是指垃圾郵件發(fā)送者經(jīng)常采用一些方法來(lái)掩蓋敏感關(guān)鍵字,發(fā) 動(dòng)針對(duì)內(nèi)容過(guò)濾器的攻擊,如把文本中規(guī)范的敏感關(guān)鍵字替換為經(jīng)過(guò)變換后的“詞”。 基于規(guī)則過(guò)濾效果與規(guī)則集密切相關(guān),而一些成熟的規(guī)則過(guò)濾器的規(guī)則集,大多針對(duì)英文郵件,在處理中文郵件時(shí),突出的問(wèn)題是存在某些規(guī)則的分值有些偏高,中文用戶使用前需要對(duì)規(guī)則分值進(jìn)行較大的調(diào)整。 ②客戶端用戶使用的訓(xùn)練集可能不適合其需求,造成過(guò)濾效果不理想。基于統(tǒng)計(jì)過(guò)濾的優(yōu)點(diǎn)是規(guī)則通過(guò)機(jī)器學(xué)習(xí)自動(dòng)產(chǎn)生,規(guī)則更新較及時(shí),但是在規(guī)則生成過(guò)程中,需要大量的郵件樣本作為過(guò)濾器的訓(xùn)練集。如一些發(fā)送廣告郵件的服務(wù)器,被列入了黑名單,如果采用 黑名單過(guò)濾,則對(duì)需要廣告郵件的用戶,就意味著正常郵件的丟失。黑白名單過(guò)濾技術(shù)的特點(diǎn)是簡(jiǎn)單高效,系統(tǒng)資源消耗小,易于實(shí)施。 表 41 垃圾郵件的信頭特征 Xi xi 的具體內(nèi)容 權(quán)值 X1 Received 字段個(gè)數(shù)大于等于 3 個(gè) X2 對(duì)郵件發(fā)送服務(wù)器做反 DNS查詢(xún),發(fā)送服務(wù)器的域名與 IP不匹配 X3 發(fā)件人地址在黑名單中 查詢(xún)黑名單表 X4 發(fā)件人地址在白名單中 查詢(xún)白名單表 X5 郵件 的發(fā)件人和收件人地址相同 X6 郵件發(fā)送服務(wù)器的域名與郵件發(fā)件人的域名不同 X7 10 分鐘內(nèi)同一個(gè)發(fā)件人發(fā)送的郵件個(gè)數(shù)超過(guò)可接受值 3 對(duì)于一封郵件,根據(jù)表 41,查詢(xún)對(duì)應(yīng)的權(quán)值,計(jì)算這一層的分值 S1,并累計(jì)入總的分值 M 中。經(jīng)過(guò)三層過(guò)濾后,得到總的分值 M,系統(tǒng)根據(jù)設(shè)定的下限閾值 Wl和上限閾值 W2(本文設(shè)定 W1=0. 5, W2=3),來(lái)對(duì)郵件類(lèi)別進(jìn)行判斷。第二層過(guò)濾采用基于規(guī)則過(guò)濾,依據(jù)權(quán)值和過(guò)濾算法對(duì)郵件的分值進(jìn)行計(jì)算。本文研究的系統(tǒng)運(yùn)行在客戶端,不必?fù)?dān)心過(guò)濾系統(tǒng)會(huì)造成服務(wù)器的處理瓶頸,因此本文采用多層過(guò)濾策略,對(duì)電子郵件的進(jìn)行完全地過(guò)濾檢測(cè)。 本文在對(duì)垃圾郵件進(jìn)行定量描述的基礎(chǔ)上,研究多層過(guò)濾,對(duì)黑白名單過(guò)濾和一種中文關(guān)鍵字匹配算法進(jìn)行了改進(jìn),并研究了用戶反饋機(jī)制,設(shè)計(jì)了一種基于客戶端的郵件過(guò)濾系統(tǒng),該系統(tǒng)能接收用戶反饋信息,體現(xiàn)用戶的個(gè)性化需求,可以較好 解決郵件判定標(biāo)準(zhǔn)問(wèn)題。 (二)過(guò)濾模式 1. 客戶端過(guò)濾模式 基于客戶端的過(guò)濾模式不必?fù)?dān)心過(guò)濾會(huì)形成郵件服務(wù)器的瓶頸,可以真正對(duì)郵件進(jìn)行內(nèi)容過(guò)濾,從而提高郵件過(guò)濾的精確度。 特征項(xiàng)選取是文本自動(dòng)分類(lèi)系統(tǒng)中的一個(gè)關(guān)鍵步驟。構(gòu)成文本的特征項(xiàng)越多,分類(lèi)算法的代價(jià)就越高,過(guò)多的特征項(xiàng)還會(huì)導(dǎo)致無(wú)法準(zhǔn)確地提取文檔的類(lèi)別信息,造成分類(lèi)效果不佳。 ( 3)特征項(xiàng)的提取 特征項(xiàng)選取的任務(wù)就是要將信息量小、“不重要 的詞匯從特征項(xiàng)空間中刪除,從而減少特征項(xiàng)的個(gè)數(shù)。中文停用詞與英文停用詞有一定差別,因?yàn)橹形牡墓δ茉~在語(yǔ)言結(jié)構(gòu)中可能有多重角色,多重含義。這種方法能夠有效地提取出詞典中不存在的詞,可以作為基于詞典分詞方法的有效補(bǔ)充。 ( 2)基于詞頻的統(tǒng)計(jì)方法 統(tǒng)計(jì)方法一般不依賴(lài)于詞典,而是將原文中任意前后緊鄰的兩個(gè)字作為一個(gè)詞進(jìn)行出現(xiàn) 14 頻率的統(tǒng)計(jì),出現(xiàn)的次數(shù)越高,成為一個(gè)詞的可能性也就越大。 RMM 法的基本原理與 FMM 法相同,不同的是分詞的掃描方向,它是從右至左取子串進(jìn)行匹配。正向最大匹配法的原理較簡(jiǎn)單,易于在計(jì)算機(jī)上實(shí)現(xiàn),時(shí)間復(fù)雜度比較低。若長(zhǎng)度為 2 的子串仍不能在詞典中找到,則取當(dāng)前漢字為詞,完成一輪匹配過(guò)程,指針后移一個(gè)漢字繼續(xù)匹配。常用的幾種字符串分詞方法如下: ①正向最大匹配法 (Forward Maximum Matching Method) 通常簡(jiǎn)稱(chēng)為 FMM 法。 ( 1)機(jī)械分詞方法 這種方法又叫做基于字符串匹配的分詞方法,其主要思想是對(duì)待分詞的漢字字串 S,按照某種確定的原則切取 S 的子串,若該子串與詞庫(kù)中的某詞條相匹配,則該子串是詞,繼續(xù)分割剩余的部分,直到剩余部分為空;否則,該子串不是詞,轉(zhuǎn)向重新切取 S 的子串進(jìn)行匹配。所以,在處理電子郵件這種半結(jié)構(gòu)化文本,進(jìn)行特征提取時(shí),必須使用分詞方法將郵件句子中的詞劃定邊界,以方便計(jì)算機(jī)識(shí)別和處理。詞是自然語(yǔ)言中最小的有意義的構(gòu)成單位。發(fā)送垃圾郵件的行為特征主要有 IP 固定性、發(fā)送頻率大、時(shí)間集中、借用郵件服務(wù)器漏洞、發(fā)信地址不明、路由地址不明、服務(wù)器不明和 TCP 會(huì)話異常等,通過(guò)分析其特征,建立基于行為識(shí)別的反垃圾郵件模型,進(jìn)行垃圾郵件識(shí)別。 ④基于行為模式識(shí)別 基于行為模式識(shí)別的基本思想是分析發(fā)送垃圾郵件的行為特征,從而識(shí)別垃圾郵件。第三,對(duì)于那些在線訂 閱的訂單和時(shí)事通訊,這種方法經(jīng)常會(huì)給它們帶來(lái)麻煩。 但是這種方法也存在幾個(gè)缺點(diǎn):第一,郵件發(fā)送方需要付出一些額外的精力去應(yīng)對(duì)接收方的挑戰(zhàn),發(fā)送方只有通過(guò)了挑戰(zhàn)才能成功的發(fā)送郵件,如果萬(wàn)一發(fā)送方?jīng)]有響應(yīng)該挑戰(zhàn),則該郵件就會(huì)被丟棄。 電子郵件認(rèn)證技術(shù)要求發(fā)送者對(duì)接收方的挑戰(zhàn) 進(jìn)行回應(yīng),這種回應(yīng)對(duì)正常郵件的發(fā)送方影響很小,而對(duì)于垃圾郵件發(fā)送者,他需要發(fā)送大量的垃圾郵件,很難有那么多的精力進(jìn)行回應(yīng),這就有效地鑒別出了垃圾郵件。如果發(fā)送方能夠成功的響應(yīng)該認(rèn)證請(qǐng)求,則該郵件通過(guò)過(guò)濾器,且所有由這個(gè)發(fā)送者發(fā)送的郵件都被允許通過(guò)。 ③電子郵件認(rèn)證 電子郵件認(rèn)證是指采用挑戰(zhàn) —— 回應(yīng)的機(jī)制對(duì)郵件發(fā)送方進(jìn)行認(rèn)證。 ( 3)基于行為的過(guò)濾 ①過(guò)濾群發(fā)軟件所發(fā)送的郵件 其基本思想是根據(jù)郵件頭信息進(jìn)行判斷,如果該郵件為群發(fā)軟件所發(fā),則判定其為垃圾郵件。 這是一種智能化垃圾郵件識(shí)別技術(shù),并且已經(jīng)在垃圾郵件識(shí)別中取得了較好的效果。 有很多文獻(xiàn)都提到了通過(guò)機(jī)器學(xué)習(xí)和文本統(tǒng)計(jì)的方法,來(lái)進(jìn)行內(nèi)容的學(xué)習(xí)和分類(lèi)。這條規(guī)則的含義是:如果信體中含有“ Dear Friend”(忽略大小寫(xiě))則匹配成功,該郵件被加的分值為 。 當(dāng) Spam Assassin 處理一封郵件時(shí),它會(huì)對(duì)這封信件應(yīng)用各項(xiàng)規(guī)則,生成一個(gè)總的分值來(lái)表示其為垃圾郵件的可能性。它通過(guò)分析郵件信息,并統(tǒng)計(jì)垃圾郵件相似度對(duì)郵件進(jìn)行分類(lèi)。一個(gè)人寫(xiě)出的規(guī)則可以提供給多個(gè)人使用,因此它的推廣性很強(qiáng)。規(guī)則是由人設(shè)定的, 因而它可以非常復(fù)雜,也可以比較簡(jiǎn)單。簡(jiǎn)單的規(guī)則有拒絕主題中包含某個(gè)關(guān)鍵詞的郵件,或創(chuàng)建拒收郵件地址列表等,復(fù)雜的規(guī)則支持正則表達(dá)式匹配。如果所有的規(guī)則匹配完以后,總分超過(guò)了一個(gè)預(yù)定義的閾值,則該郵件被判定為垃圾郵件。目前,通常使用基于規(guī)則或基于統(tǒng)計(jì)的過(guò)濾技術(shù)。 David Mertz 在文章“ Spare filtering techniques中,用了很簡(jiǎn)單的幾條規(guī)則便過(guò)濾了 80%的垃圾郵件,但是他也說(shuō)“很不幸的是,這種簡(jiǎn)單的方法同樣會(huì)帶來(lái)比較高的誤判率”。 ( 2)基于內(nèi)容的過(guò)濾 簡(jiǎn)單的模式匹配是指系統(tǒng)預(yù)定義一些規(guī)則,對(duì)于一封郵件,系統(tǒng)根據(jù)匹配情況將其分類(lèi)。 Domain Keys 技術(shù)的安全認(rèn)證體系,要求發(fā) 送方服務(wù)器和接收方服務(wù)器都支持 Domain Keys 技術(shù)。發(fā)件服務(wù)器對(duì)每一封電子郵件使用該服務(wù)器的私匙進(jìn)行簽名,收件服務(wù)器則使用公鑰驗(yàn)證發(fā)件服務(wù)器的簽名是否有效。 ③安全認(rèn)證技術(shù) 安全認(rèn)證技術(shù)是指通過(guò)簽名技術(shù),來(lái)對(duì)發(fā)送方服務(wù)器身份進(jìn)行驗(yàn)證。一個(gè)電子郵件從一臺(tái)服務(wù)器發(fā)送到另外一臺(tái)服務(wù)器,兩臺(tái)服務(wù)器之間需要建立一個(gè) TCP/ IP 連接。 但是,及時(shí)地更新黑白名單很困難,在實(shí)際應(yīng)用中,它很難取得很好的效果,通常作為其他技術(shù)的補(bǔ)充。 實(shí)時(shí)黑名單 (Realtime Black hole List,簡(jiǎn)稱(chēng) RBL)是目前最流行的黑白名單技術(shù),也被稱(chēng)為 DNS. RBL。 黑白名單過(guò)濾技術(shù)簡(jiǎn)單,效率很高,系統(tǒng)資源消耗小,易于實(shí)施。
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1