freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

本科畢業(yè)論文-互聯(lián)網(wǎng)垃圾郵件防御系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

2025-01-19 16:42本頁面
  

【正文】 att。ContentDisposition39。rb39。/39。application/octetstream39。39。To39。From39。Subject39。39。39。 圖 81 主窗體界面 25 2. 發(fā)送郵件 點(diǎn)擊工具欄上的新建郵件按鈕,在編輯郵件的窗體中輸入接收人的地址、郵件主題、郵件正文,點(diǎn)擊導(dǎo)入文本按鈕可以導(dǎo)入已經(jīng)備好的文本內(nèi)容,點(diǎn)擊發(fā)送按鈕發(fā)送郵件。 退 出準(zhǔn) 備登 錄 郵 箱接 收 郵 件移 至 垃 圾 箱存 入 收 件 箱是 否 為 垃 圾郵 件NY 圖 71 郵件接收流程圖 23 2. 郵件發(fā)送流程圖 用戶首先登陸到服務(wù)器,對郵件進(jìn)行編輯后發(fā)送郵件;如果發(fā)送成功,會提示發(fā)送成功;如果發(fā)送失敗,會顯示錯誤信息。每次收到郵件會通過黑白名單和規(guī)則過濾對郵件進(jìn)行識別。 垃圾郵件處理: 輸入:被標(biāo)記為“垃圾”的郵件; 輸出:無; 描述:經(jīng)過識別算法識別之后的郵件,如果被標(biāo)記為垃圾郵件,直接放入到垃圾箱中。 分詞: 輸入:字符串; 輸出:由詞構(gòu)成的列表; 描述:將輸入的連續(xù)的中文句子分 割成一個個詞組,用來進(jìn)行進(jìn)一步的查找匹配。 5. 規(guī)則過濾 輸入:接收到的新郵件; 輸出:該郵件是否為垃圾郵件; 21 描述:對該郵件進(jìn)行分詞。 4. 黑白名單過濾 輸入:接收到的新郵件; 輸出 :該郵件是否為垃圾郵件; 描述:解析郵件中的發(fā)件人信息,首先在白名單中查找,如果查找到匹配項(xiàng),將該郵件標(biāo)志為正常郵件;然后在黑名單中查找,如果查找到匹配項(xiàng)就標(biāo)志為垃圾郵件。 3. 郵件接收模塊 該模塊用于從服務(wù)器接收郵件。 編輯并發(fā)送郵件: 輸入:收件人地址、郵件內(nèi)容; 輸出:郵件發(fā)送狀態(tài); 描述:通過郵件服務(wù)器,將編輯好的郵件發(fā)送到指定的地址。登陸成功,提示用戶登陸成果;如果登陸失敗,根據(jù)服務(wù)器的反饋信息提示用戶登陸失敗 原因。 郵 件 系 統(tǒng)郵件接收模塊郵箱認(rèn)證模塊郵件發(fā)送模塊垃圾郵件識別模塊 圖 61 系統(tǒng)模塊功能圖 20 七 、系統(tǒng)詳細(xì) 設(shè)計(jì) (一)功能設(shè)計(jì) 1. 郵箱認(rèn)證模塊 該模塊用于客戶端和郵件服務(wù)器連接,并向服務(wù)器認(rèn)證。 另外,系統(tǒng)還應(yīng)該具備安裝簡單,容易配置和使用,界面友好等特點(diǎn),對 用戶目前的使用習(xí)慣也充分考慮。 (2)垃圾郵件過濾功能 本系統(tǒng)具有過濾垃圾郵件功能,這是系統(tǒng)最關(guān)鍵的一項(xiàng)功能。系統(tǒng)應(yīng)具備的功能主要有: (1)接收郵件和發(fā)送郵件的功能 本系統(tǒng)提供友好的界面,可以使用本系統(tǒng)訪問并讀取用戶郵箱中的電子郵件。 規(guī)則庫:用戶可 以查看、修改規(guī)則庫,系統(tǒng)根據(jù)規(guī)則庫的內(nèi)容對垃圾郵件進(jìn)行識別。 2. 核心功能 為了能夠識別垃圾郵件 需要黑白名單和基于規(guī)則的識別機(jī)制,用戶可以自定義黑白名單和規(guī)則庫,系統(tǒng)能夠根據(jù)用戶設(shè)置的規(guī)則來識別出垃圾郵件。點(diǎn)擊發(fā)送郵件按鈕,能夠?qū)⑧]件發(fā)送到目標(biāo)收件人中。鼠標(biāo)點(diǎn)擊郵件標(biāo)題 ,能夠顯示郵件的內(nèi)容,包括郵件發(fā)件人信息,郵件時間,郵件正文內(nèi)容等。 18 1. 基本功能 為了能夠查看郵件 需要一個圖形化的界面顯示收件箱中郵件列表。分析并確認(rèn)各個功能的權(quán)重以及工作量。 從當(dāng)前情況來看,本軟件的開發(fā)是可行的。 4. 調(diào)度可行性 調(diào)度可行性指的是建議的計(jì)算機(jī)系統(tǒng)能否在規(guī)定的期限內(nèi)交付給用戶。 3. 操作可行性 操作可行性是指人員的手工操作而不是指計(jì)算機(jī)系統(tǒng)操作是否可行,也就是說在實(shí)現(xiàn)了建議的計(jì)算機(jī)系統(tǒng)后,所需要的配合的手工操作是否可行。簡單地說,經(jīng)濟(jì)可行性研究是確定得自新系統(tǒng)的節(jié)省和利益,將這些利益和系統(tǒng)的實(shí)現(xiàn)成本相比較,如果利益超過成本,則開發(fā)新系統(tǒng)的決策是肯定的;否則的話,除非有其他特殊原因,這個決策將是否定的。 2. 經(jīng)濟(jì)可行性 這是經(jīng)典的并且是最常使用的評價計(jì)算機(jī)系統(tǒng)的方法?,F(xiàn)代計(jì)算機(jī)硬、軟件技術(shù)的飛速發(fā)展,為系統(tǒng)建設(shè)提供了技術(shù)條件。 1. 技術(shù)可行性 技術(shù)可行性的考慮集中在現(xiàn)存的計(jì)算機(jī)硬件能否支持被研究的系統(tǒng),首先關(guān)心的是該組織是否有相應(yīng)的軟件和硬件能夠支持處理建議的應(yīng)用程序。這里相對短和相對低是指和實(shí)現(xiàn)建議系統(tǒng)所需時間和成本相比較而言。 本文針對切詞破壞,使用第三層過濾,定義敏感關(guān)鍵字表,將“免費(fèi)”、“色情”等敏感關(guān)鍵字存儲到敏感關(guān)鍵字表中,然后使用一種改進(jìn)的中文關(guān)鍵字匹配算法進(jìn)行第三層過濾。 切詞破壞是指垃圾郵件發(fā)送者經(jīng)常采用一些方法來掩蓋敏感關(guān)鍵字,發(fā)動針對內(nèi)容過濾器的攻 擊,如把文本中規(guī)范的敏感關(guān)鍵字替換為經(jīng)過變換后的“詞”。 基于規(guī)則過濾效果與規(guī)則集密切相關(guān),而一些成熟的規(guī)則過濾器的規(guī)則集,大多針對英文郵件,在處理中文郵件時,突出的問題是存在某些規(guī)則的分值有些偏高,中文用戶使用前需要對規(guī)則分值進(jìn)行較大的調(diào)整。 ②客戶端用戶使用的訓(xùn)練集可能不適合其需求,造成過濾效果不理想?;诮y(tǒng)計(jì)過濾的優(yōu)點(diǎn)是規(guī)則通過機(jī)器學(xué)習(xí)自動產(chǎn)生,規(guī)則更新較及時,但是在規(guī)則生成過程中,需要大量的郵件樣本作為過濾器的訓(xùn)練集。如一些發(fā)送廣告郵件的服務(wù)器,被列入了黑名單,如果采用黑名單過濾,則對需要 廣告郵件的用戶,就意味著正常郵件的丟失。黑白名單過濾技術(shù)的特點(diǎn)是簡單高效,系統(tǒng)資源消耗小,易于實(shí)施。 表 41 垃圾郵件的信頭特征 Xi xi 的具體內(nèi)容 權(quán)值 X1 Received 字段個數(shù)大于等于 3 個 X2 對郵件發(fā)送服務(wù)器做反 DNS 查詢,發(fā)送服務(wù)器的域名與 IP不匹配 X3 發(fā)件人地址在黑名單中 查詢黑名單表 X4 發(fā)件人地址在白名單中 查詢白名單表 X5 郵件的發(fā)件人和收件人地址 相同 X6 郵件發(fā)送服務(wù)器的域名與郵件發(fā)件人的域名不同 X7 10 分鐘內(nèi)同一個發(fā)件人發(fā)送的郵件個數(shù)超過可接受值 3 對于一封郵件,根據(jù)表 41,查詢對應(yīng)的權(quán)值,計(jì)算這一層的分值 S1,并累計(jì)入總的分值 M 中。經(jīng)過三層過濾后,得到總的分值 M,系統(tǒng)根據(jù)設(shè)定的下限閾值 Wl和上限閾值 W2(本文設(shè)定 W1=0. 5, W2=3),來對 郵件類別進(jìn)行判斷。第二層過濾采用基于規(guī)則過濾,依據(jù)權(quán)值和過濾算法對郵件的分值進(jìn)行計(jì)算。本文研究的系統(tǒng)運(yùn)行在客戶端,不必?fù)?dān)心過濾系統(tǒng)會造成服務(wù)器的處理瓶頸,因此本文采用多層過濾策略,對電子郵件的進(jìn)行完全地過濾檢測。 本文在對垃圾郵件進(jìn)行定量描述的基礎(chǔ)上,研究多層過濾,對黑白名單過濾和一種中文關(guān)鍵字匹配算法進(jìn)行了改進(jìn),并研究了用戶反饋機(jī)制,設(shè)計(jì)了一種基于客戶端的郵件過濾系統(tǒng),該系統(tǒng)能接收用戶反饋信息,體現(xiàn)用戶的個性化需求,可以較好解決郵件判定標(biāo)準(zhǔn)問題 。 ( 二)過濾模式 1. 客戶端過濾模式 基于客戶端的過濾模式不必?fù)?dān)心過濾會形成郵件服務(wù)器的瓶頸,可以真正對郵件進(jìn)行內(nèi)容過濾,從而提高郵件過濾的精確度。 特征項(xiàng)選取是文本自動分類系統(tǒng)中的一個關(guān)鍵步驟。構(gòu)成文 本的特征項(xiàng)越多,分類算法的代價就越高,過多的特征項(xiàng)還會導(dǎo)致無法準(zhǔn)確地提取文檔的類別信息,造成分類效果不佳。 ( 3)特征項(xiàng)的提取 特征項(xiàng)選取的任務(wù)就是要將信息量小、“不重要 的詞匯從特征項(xiàng)空間中刪除,從而減少特征項(xiàng)的個數(shù)。中文停用詞與英文停用詞有一定差別,因?yàn)橹形牡墓δ茉~在語言結(jié)構(gòu)中可能有多重角色,多重含義。這種方法能夠有效地提取出詞典中不存在的詞,可以作為基于詞典分詞方法的有效補(bǔ)充。 ( 2)基于詞頻的統(tǒng)計(jì)方法 統(tǒng)計(jì)方法一般不依賴于詞典,而是將原文中任意前后緊鄰的兩個字作為一個詞進(jìn)行出現(xiàn) 14 頻率的統(tǒng)計(jì),出現(xiàn)的次數(shù)越高,成為一個詞的可能性也就越大。 RMM 法的基本原理與 FMM 法相同,不同的是分詞的掃描方向,它是從右至左取子串進(jìn)行匹配。正向 最大匹配法的原理較簡單,易于在計(jì)算機(jī)上實(shí)現(xiàn),時間復(fù)雜度比較低。若長度為 2 的子串仍不能在詞典中找到,則取當(dāng)前漢字為詞,完成一輪匹配過程,指針后移一個漢字繼續(xù)匹配。常用 的幾種字符串分詞方法如下: ①正向最大匹配法 (Forward Maximum Matching Method) 通常簡稱為 FMM 法。 ( 1)機(jī)械分詞方法 這種方法又叫做基于字符串匹配的分詞方法,其主要思想是對待分詞的漢字字串 S,按照某種確定的原則切取 S 的子串,若該子串與詞庫中的某詞條相匹配,則該子串是詞,繼續(xù)分割剩余的部分,直到剩余部分為空;否則,該子串不是詞,轉(zhuǎn)向重新切取 S 的子串進(jìn)行匹配。所以,在處理電子郵件這種半結(jié)構(gòu)化文本,進(jìn)行特征提取時,必須使用分詞方法將郵件句子中的詞劃定邊界,以方便計(jì)算機(jī)識別和處理。詞是自然語言中最小的有意義的構(gòu)成單位。發(fā)送垃圾郵件的行為特征主要有 IP 固定性、發(fā)送頻率大、時間集中、借用郵件服務(wù)器漏洞、發(fā)信地址不明、路由地址不明、服務(wù)器不明和 TCP 會話異常等,通過分析其特征,建立基于行為識別的反垃圾郵件模型,進(jìn)行垃圾郵件識別。 ④基于行為模式識別 基于行為模式識別的基本思想是分析發(fā)送垃圾郵件的行為特征,從而識別垃圾郵件。第三,對于那些在線訂閱的訂單和時事通訊, 這種方法經(jīng)常會給它們帶來麻煩。 但是這種方法也存在幾個缺點(diǎn):第一,郵件發(fā)送方需要付出一些額外的精力去應(yīng)對接收方的挑戰(zhàn),發(fā)送方只有通過了挑戰(zhàn)才能成功的發(fā)送郵件,如果萬一發(fā)送方?jīng)]有響應(yīng)該挑戰(zhàn),則該郵件就會被丟棄。 電子郵件認(rèn)證技術(shù)要求發(fā)送者對接收方的挑戰(zhàn)進(jìn)行回應(yīng),這種回應(yīng)對 正常郵件的發(fā)送方影響很小,而對于垃圾郵件發(fā)送者,他需要發(fā)送大量的垃圾郵件,很難有那么多的精力進(jìn)行回應(yīng),這就有效地鑒別出了垃圾郵件。如果發(fā)送方能夠成功的響應(yīng)該認(rèn)證請求,則該郵件通過過濾器,且所有由這個發(fā)送者發(fā)送的郵件都被允許通過。 ③電子郵件認(rèn)證 電子郵件認(rèn)證是指采用挑戰(zhàn) —— 回應(yīng)的機(jī)制對郵件發(fā)送方進(jìn)行認(rèn)證。 ( 3)基于行為的過濾 ①過濾群發(fā)軟件所發(fā)送的郵件 其基本思想是根據(jù)郵件頭信息進(jìn)行判斷,如果該郵件為群發(fā)軟件所發(fā),則判定其為垃圾郵件。 這是一種智能化垃圾郵件識別技術(shù),并且已經(jīng)在垃圾郵件識別中取得了較好的效果。 有很多文獻(xiàn)都提到了通過機(jī)器學(xué)習(xí)和文本統(tǒng)計(jì)的方法,來進(jìn)行內(nèi)容的學(xué)習(xí)和分類。這條規(guī)則的含義是:如果信體中含有“ Dear Friend”(忽略大小寫)則匹配成功,該郵件被加的分值為 。 當(dāng) Spam Assassin 處理一封郵件時,它會對這封信件應(yīng)用各項(xiàng)規(guī)則,生成一個總的分值來表示其為垃圾郵件的可能性。它通過分析郵件信息,并統(tǒng)計(jì)垃圾郵件相似度對郵件進(jìn)行分類。一個人寫出的規(guī)則可以提供給多個人使用,因此它的推廣性很強(qiáng)。規(guī)則是由人設(shè)定的,因而它可以非常復(fù)雜, 也可以比較簡單。簡單的規(guī)則有拒絕主題中包含某個關(guān)鍵詞的郵件,或創(chuàng)建拒收郵件地址列表等,復(fù)雜的規(guī)則支持正則表達(dá)式匹配。如果所有的規(guī)則匹配完以后,總分超過了一個預(yù)定義的閾值,則該郵件被判定為垃圾郵件。目 前,通常使用基于規(guī)則或基于統(tǒng)計(jì)的過濾技術(shù)。 David Mertz 在文章“ Spare filtering techniques中,用了很簡單的幾條規(guī)則便過濾了 80%的垃圾郵件,但是他也說“很不幸的是,這種簡單的方法同樣會帶來比較高的誤判率”。 ( 2)基于內(nèi)容的過濾 簡單的模式匹配是指系統(tǒng)預(yù)定義一些規(guī)則,對于一封郵件,系統(tǒng)根據(jù)匹配情況將其分類。 Domain Keys 技術(shù)的安全認(rèn)證體系,要求發(fā)送方服務(wù)器和接收方服 務(wù)器都支持 Domain Keys 技術(shù)。發(fā)件服務(wù)器對每一封電子郵件使用該服務(wù)器的私匙進(jìn)行簽名,收件服務(wù)器則使用公鑰驗(yàn)證發(fā)件服務(wù)器的簽名是否有效。 ③ 安全認(rèn)證技術(shù) 安全認(rèn)證技術(shù)是指通過簽名技術(shù),來對發(fā)送方服務(wù)器身份進(jìn)行驗(yàn)證。一個電子郵件從一臺服務(wù)器發(fā)送到另外一臺服務(wù)器,兩臺服務(wù)器之間需要建立一個 TCP/ IP 連接。 但是,及時地更新黑白名單很困難,在實(shí)際應(yīng)用中,它很難取得很好的效果,通常作為其他技術(shù)的補(bǔ)充。 實(shí)時黑名單 (Realtime Black hole List,簡稱 RBL)是目前最流行的黑白名單技術(shù),也被稱為 DNS. RBL。 黑白名單過濾技術(shù)簡單,效率很高,系統(tǒng)資源消耗小,易于實(shí)施。 ( 1)基于 IP地址、域名和路由的過濾技術(shù) ①白名單、黑名單技術(shù) 黑名單 (Black List)是指已知的垃圾郵件發(fā)送者地址 ,而白名單 (White List)是指可信任的郵件發(fā)送者的地址。例如,電子郵票的費(fèi)用由誰收取,怎么對這些費(fèi)用征稅,還有誰被授權(quán)出售這種電子郵票。這樣,垃圾郵件發(fā)送者將無利可圖,他們就不會熱衷于發(fā)送垃圾郵件了。 電子郵票類似于普通郵票,是指通過某種方式向電子郵件的發(fā)送者收取一定費(fèi)用。 但是,在網(wǎng)絡(luò)環(huán)境下確定垃圾郵件發(fā)送者身份很困難,另外,對垃圾郵件發(fā)送者的懲罰,不同國家的法律規(guī)定也不同,這些使得法律手段收效不大。 2022 年 12 月,美國總統(tǒng)簽署了 CAN. SPAM 法案,該法案禁止在商業(yè)郵件中偽造郵件頭信息,并要求商業(yè)郵件必須包含明確的身份標(biāo)志,違反該法案將被罰款。下面我們簡單介紹一下這兩個方面的研究工作。 1995 年 7 月, spam 被用來專門指代垃圾郵件,這說明反垃圾郵件的研究正式成為一個的重要研究課題。 垃圾郵件發(fā)送者采用以上技術(shù),使得垃圾郵件發(fā)送的方式越來越隱蔽,其特點(diǎn)主要表現(xiàn)在:發(fā)件人地址隨機(jī)變化、郵件主
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1