freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

本科畢業(yè)論文-互聯(lián)網(wǎng)垃圾郵件防御系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(存儲(chǔ)版)

  

【正文】 是建議的計(jì)算機(jī)系統(tǒng)能否在規(guī)定的期限內(nèi)交付給用戶。現(xiàn)代計(jì)算機(jī)硬、軟件技術(shù)的飛速發(fā)展,為系統(tǒng)建設(shè)提供了技術(shù)條件。 切詞破壞是指垃圾郵件發(fā)送者經(jīng)常采用一些方法來(lái)掩蓋敏感關(guān)鍵字,發(fā) 動(dòng)針對(duì)內(nèi)容過(guò)濾器的攻擊,如把文本中規(guī)范的敏感關(guān)鍵字替換為經(jīng)過(guò)變換后的“詞”。如一些發(fā)送廣告郵件的服務(wù)器,被列入了黑名單,如果采用 黑名單過(guò)濾,則對(duì)需要廣告郵件的用戶,就意味著正常郵件的丟失。第二層過(guò)濾采用基于規(guī)則過(guò)濾,依據(jù)權(quán)值和過(guò)濾算法對(duì)郵件的分值進(jìn)行計(jì)算。 特征項(xiàng)選取是文本自動(dòng)分類系統(tǒng)中的一個(gè)關(guān)鍵步驟。這種方法能夠有效地提取出詞典中不存在的詞,可以作為基于詞典分詞方法的有效補(bǔ)充。若長(zhǎng)度為 2 的子串仍不能在詞典中找到,則取當(dāng)前漢字為詞,完成一輪匹配過(guò)程,指針后移一個(gè)漢字繼續(xù)匹配。詞是自然語(yǔ)言中最小的有意義的構(gòu)成單位。 但是這種方法也存在幾個(gè)缺點(diǎn):第一,郵件發(fā)送方需要付出一些額外的精力去應(yīng)對(duì)接收方的挑戰(zhàn),發(fā)送方只有通過(guò)了挑戰(zhàn)才能成功的發(fā)送郵件,如果萬(wàn)一發(fā)送方?jīng)]有響應(yīng)該挑戰(zhàn),則該郵件就會(huì)被丟棄。 ( 3)基于行為的過(guò)濾 ①過(guò)濾群發(fā)軟件所發(fā)送的郵件 其基本思想是根據(jù)郵件頭信息進(jìn)行判斷,如果該郵件為群發(fā)軟件所發(fā),則判定其為垃圾郵件。 當(dāng) Spam Assassin 處理一封郵件時(shí),它會(huì)對(duì)這封信件應(yīng)用各項(xiàng)規(guī)則,生成一個(gè)總的分值來(lái)表示其為垃圾郵件的可能性。簡(jiǎn)單的規(guī)則有拒絕主題中包含某個(gè)關(guān)鍵詞的郵件,或創(chuàng)建拒收郵件地址列表等,復(fù)雜的規(guī)則支持正則表達(dá)式匹配。 ( 2)基于內(nèi)容的過(guò)濾 簡(jiǎn)單的模式匹配是指系統(tǒng)預(yù)定義一些規(guī)則,對(duì)于一封郵件,系統(tǒng)根據(jù)匹配情況將其分類。一個(gè)電子郵件從一臺(tái)服務(wù)器發(fā)送到另外一臺(tái)服務(wù)器,兩臺(tái)服務(wù)器之間需要建立一個(gè) TCP/ IP 連接。 ( 1)基于 IP地址、域名和路由的過(guò)濾技術(shù) ①白名單、黑名單技術(shù) 黑名單 (Black List)是指已知 的垃圾郵件發(fā)送者地址,而白名單 (White List)是指可信任的郵件發(fā)送者的地址。 但是,在網(wǎng)絡(luò)環(huán)境下確定垃圾郵件發(fā)送者身份很困難,另外,對(duì)垃圾郵件發(fā)送者的懲罰,不同國(guó)家的法律規(guī)定也不同,這些使得法律手段收效不大。 垃圾郵件發(fā)送者采用以上技術(shù),使得垃圾郵件發(fā)送的方式越來(lái)越隱蔽,其特點(diǎn)主要表現(xiàn)在:發(fā)件人地址隨機(jī)變化、郵件主題隨機(jī)變化、偽造郵件頭干擾信息、信件主體內(nèi)容隨機(jī)變化、正文以圖片方式顯示等,造成了垃圾信息難以識(shí)別。我們?cè)诘诙聦?duì)其進(jìn)行了一些分析。目前使用更多的是使用第三方服務(wù)器轉(zhuǎn)發(fā)。垃圾郵件還可以被病毒利用,成為它們的傳播途徑。另外,當(dāng)一些用戶利用郵件服務(wù)器對(duì)外發(fā)送垃圾郵件時(shí),該服務(wù)器會(huì)被列入黑名單而遭到封殺。 ( 3)隱藏發(fā)件人身份、地址、標(biāo) 題等信息的電子郵件。 MessageID: msgid 信件標(biāo)識(shí)字段。 其它的信頭字段 Date: datetime 日期字段: Date字段含有電子郵件創(chuàng)建的日期和時(shí)間。 與收信方有關(guān)的信頭字段 TO: mailbox list 收信人字段。說(shuō)明信件的原始創(chuàng)建者,給出他的電子信箱地址。存儲(chǔ)空間包含存放所收信件、編輯信件以及信件存盤三部分空間,用戶使用口令開啟自己的信箱,并進(jìn)行發(fā)信、讀信、編輯、轉(zhuǎn)發(fā)、存檔等各種操作。因?yàn)殡娮余]件是通過(guò)郵件服務(wù)器 (mai1 server)來(lái)傳遞檔的。這種非交互式的通信,加速了信息的交流及數(shù)據(jù)傳送,它是 — 個(gè)簡(jiǎn)易、快速的方法。 QtSvg 提供了顯示 SVG 文件內(nèi)容的方法。 圖 21 python 安裝成功測(cè)試圖 (三) pyqt 簡(jiǎn)介 PyQt 是一個(gè) GUI 庫(kù),是將 Python 和 Qt 結(jié)合在一起的產(chǎn)物。例如麻省理工學(xué)院的計(jì)算機(jī)科學(xué)及編程導(dǎo)論課程就使用 Python語(yǔ)言講授。 Python 是從 ABC發(fā)展起來(lái),主要受到了 Modula3(另一種相當(dāng)優(yōu)美且強(qiáng)大的語(yǔ)言,為小型團(tuán)體所設(shè)計(jì)的)的影響。而對(duì)垃圾郵件過(guò)濾,垃圾郵件類別是和用戶密切相關(guān)的,如一個(gè)產(chǎn)品宣傳廣告,有人認(rèn)為是垃圾郵件,但有人則認(rèn)為是正常郵件,因此郵件的分類需更注重個(gè)性化。英文垃圾郵件的過(guò)濾己經(jīng)達(dá)到了比較高的準(zhǔn)確率,但受中文分詞的影響,對(duì)于中文垃圾郵件過(guò)濾,往往效果并不理想。網(wǎng)民對(duì)互聯(lián)網(wǎng)中垃圾郵件的反感度達(dá) %,垃圾郵件已成為繼電腦病毒之后的主要網(wǎng)絡(luò)安全問題。 本課題正是在這樣的背景下展開,借此來(lái)減少垃圾郵件的傳播,改善網(wǎng)絡(luò)環(huán)境。 關(guān)鍵詞 :垃圾郵件 反垃圾郵件 黑名單 舉報(bào) 開放轉(zhuǎn)發(fā) AntiSpam system Abstract Recently, the traditional mail service is largely replaced by service which is provided by Inter. Email is being a more and more important means in interactions among people. However, the inherent defect of s that they are easily copied and transmitted leads to the flooding of spam s, which take the precious band width, and waste much of people39。過(guò)濾技術(shù)不能完全識(shí)別垃圾郵件,甚至?xí)钄嗾`]件的傳遞,這對(duì)于廣大用戶來(lái)說(shuō)是無(wú)法接受的,一些關(guān)鍵領(lǐng)域會(huì)因一封正常郵件的丟失而帶來(lái)巨大損失。由于中文的多義性, 而且目前還沒有統(tǒng)一的中文垃圾郵件語(yǔ)料庫(kù),研究者都是自己用自己的語(yǔ)料,缺乏可比性,所以中文郵件的預(yù)處理顯得更加困難。 3 二、開發(fā)環(huán)境簡(jiǎn)介 (一) python 簡(jiǎn)介 Python 是一種解釋型、面向?qū)ο?、?dòng)態(tài)數(shù)據(jù)類型的高級(jí)程序設(shè)計(jì)語(yǔ)言。 Python的設(shè)計(jì)哲學(xué)是 “ 優(yōu)雅 ” 、 “ 明確 ” 、 “ 簡(jiǎn)單 ” 。因此 Python語(yǔ)言及其眾多的擴(kuò)展庫(kù)所構(gòu)成的開發(fā)環(huán)境十分適合工程技術(shù)、科研人員處理實(shí)驗(yàn)數(shù)據(jù)、制作圖表,甚至開發(fā)科學(xué)計(jì)算應(yīng)用程序。 PyQt 的模塊管理: QtCore、 QtGui、 QtNetwork、 QtXml、 QtSvg、 QtOpenGL、 QtSql。 QtSql 提供了訪問數(shù)據(jù)庫(kù)的方法。 電子郵件不是一種“終端到終端”的服務(wù),是被稱為“存貯轉(zhuǎn)發(fā)式”服務(wù)。 電子郵件的傳輸是通過(guò)電子郵件簡(jiǎn)單傳輸協(xié)議 (Simple Mail Transfer Protocol,簡(jiǎn)稱 SMTP)這一系統(tǒng)軟件來(lái)完成的,它是 Inter 下的一種電子郵件通信協(xié)議。用戶首先開啟自己的信箱,然后 通過(guò)鍵入命令的方式將需要發(fā)送的郵件發(fā)到對(duì)方的信箱中。說(shuō)明實(shí)際提交發(fā)送這 個(gè)信件的人,給出他的電子信箱地址。指定此信件要同時(shí)發(fā)給哪些人,也稱為抄送。當(dāng)回復(fù)信件時(shí),通常在主題前面增加“ Re:”前綴,標(biāo)記為該信件為回復(fù)信件:當(dāng)信件被轉(zhuǎn)發(fā)時(shí),通常在主題文字前面加上“ Fw:”,“ Fwd:”這樣的前綴。通常左邊是標(biāo)識(shí)符,右邊指定電腦名 7 圖中列出了一些在因特網(wǎng)電子郵件中可以找到的普通關(guān)鍵字,以及使用它們的目的。然而,對(duì)電子郵件服務(wù)提供商和用戶而言,垃圾郵件卻給他們帶來(lái)很大的危害和損失。 ( 3)增加用戶處理時(shí)間 8 垃圾郵件增加了用戶對(duì)郵件的處理時(shí)間,浪費(fèi)了用戶的精力。 3. 垃圾郵件的分類 垃圾郵件從內(nèi)容上看,主要是商業(yè)廣告性質(zhì)的郵件;另外,由少量政治,團(tuán)體組織的宣傳郵件。對(duì)于這種垃圾郵件,只要關(guān)閉有關(guān)服務(wù)器的轉(zhuǎn)發(fā)功能就可以了。發(fā)送 9 者可以使用一臺(tái)簡(jiǎn)單的 PC 機(jī)借用你的強(qiáng)大的服務(wù)器一次發(fā)送幾十萬(wàn)封信。 反垃圾郵件的主要研究工作集中在以下兩個(gè)方面:一方面是研究如 何應(yīng)用非技術(shù)手段來(lái)防治垃圾郵件,另一方面是研究新的反垃圾郵件技術(shù)來(lái)過(guò)濾和阻斷垃圾郵件的傳播。對(duì)于正常的電子郵件使用者,他們發(fā)送郵件的數(shù)量不是很大,電子郵票的費(fèi)用是很少的,但是對(duì)于垃圾郵件發(fā)送者,他們會(huì)大量發(fā)送垃圾郵件,所收取 的費(fèi)用也隨之增加很多。但是,黑白名單技術(shù)需要手動(dòng)維護(hù)地址清單 (即黑白名單 ),并且,一些正常郵件,可能因?yàn)榘l(fā)送方地址在黑名單中而被拒絕,從而造成某些郵件不能正常投遞。 Domain Keys 技術(shù)是 Yahoo 和 Microsoft 提出的典型的安全認(rèn)證技術(shù),該技術(shù)的核心思想是,每個(gè)域名 (Domain name)都申請(qǐng)一個(gè) PKI證書,然后把公匙存儲(chǔ)在 DNS 服務(wù)器中。因此,盡管這種方法簡(jiǎn)單、高效,但是 因此分類性能不佳。 基于規(guī)則方法的另一優(yōu)點(diǎn)是規(guī)則可以共享。 ②基于統(tǒng)計(jì)的過(guò)濾器 該技術(shù)源自機(jī)器學(xué)習(xí),采用機(jī)器學(xué)習(xí)、文本分類技術(shù)自動(dòng)進(jìn)行郵件分類。當(dāng)收到一封郵件時(shí),該系統(tǒng)自動(dòng)發(fā)出一個(gè)一次性的認(rèn)證郵件給發(fā)送方。第四,認(rèn)證的消息也造成了網(wǎng)絡(luò)流量的增大。 1. 中文分詞的常用方法 中文分詞方法主要有三類:第一類是基于詞典的字符串匹配分詞方法,第二類是基于詞的頻度統(tǒng)計(jì)分詞方法,這兩類方法實(shí)用、具體,比較容易實(shí)現(xiàn):第三類方法是基于理解的分詞,對(duì)句法、 語(yǔ)法進(jìn)行分析,并結(jié)合語(yǔ)義分析,通過(guò)對(duì)上下文內(nèi)容所提供信息的分析對(duì)詞進(jìn)行定界,這類方法試圖讓機(jī)器具有人類的理解能力,一般不易實(shí)現(xiàn)。 ②逆向最大匹配法 (Reverse Maximum Matching Method) 通常簡(jiǎn)稱為 RMM法。然而,去除停用詞也是必要的。 客戶端模式可以幫助過(guò)濾系統(tǒng)實(shí)時(shí)地接受用戶的反饋,體現(xiàn)特定用戶的個(gè)性化需求,提高郵件過(guò)濾的精確度,本文采用基于客戶端的過(guò)濾模式。 ( 1)基于信頭特征的過(guò)濾 根據(jù)垃圾郵件的定量描述,設(shè)垃圾郵件的信頭特征為 X,將它包含的元素分別設(shè)為 xi, 15 i=l, 2,.., 11,根據(jù)不同的 xi設(shè)定的權(quán)值如表 41 所示。本文設(shè)計(jì)的過(guò)濾系統(tǒng)是基于客戶端的,如果采用基于統(tǒng)計(jì)過(guò)濾技術(shù),存在兩個(gè)問題: ①客戶端用戶可能無(wú)法得到大量的的訓(xùn)練集,使得過(guò)濾系統(tǒng)訓(xùn)練不充分,影響過(guò)濾效果。 17 五、系統(tǒng)分析 (一)可行性分析 可行性研究是以相對(duì)短的時(shí)間和相對(duì)低的成本來(lái)確定給定的問題是否有解。這個(gè)評(píng)價(jià) 的結(jié)果稱為成本/效益分析。 (二) 功能需求分析 功能需求分析旨在研發(fā)開始階段對(duì)系統(tǒng)應(yīng)該具備的哪些功能進(jìn)行充分的研究,確認(rèn)哪些功能需要,哪些功能不需要,哪些功能是核心功能。如果收件人地址錯(cuò)誤或者發(fā)送失敗,提示相關(guān)的發(fā)送失敗信息。在接 收郵件時(shí),系統(tǒng)應(yīng)有對(duì)郵件進(jìn)行分析并識(shí)別垃圾郵件的功能。如果發(fā)送成功,提示用戶發(fā)送成功;如果發(fā)送失敗,根據(jù)服務(wù)器反饋的信息提示用戶發(fā)送失敗的原因。 6. 郵件處理 正常郵件處理: 輸入:被標(biāo)記為“正?!钡泥]件; 輸出:郵件的主題,正文,發(fā)件人; 描述:經(jīng)過(guò)識(shí)別算法識(shí)別之后的郵件,如果被標(biāo)記為正常郵件,就存入收件箱,并將郵件中的內(nèi)容通過(guò)界面顯示給用戶。 圖 82 發(fā)送郵件界面 代碼片段: def sendMail(self, to, subject, content, fileName=None): mailList=[to] host = extractSerAddr(to) mailFrom = +39。] = mailFrom message[39。, 1) attachment = MIMEImage((lambda f:((), () ))(open(fileName, 39。39。.eml39。\n39。wb39。.eml39。, 39。.join(mailList) if fileName!=None and (fileName): ctype, encoding = (fileName) if ctype is None or encoding is not None: ctype=39。 try: message=MIMEMultipart() ( MIMEText(content) ) message[39。如果郵件為正常郵件,就保存在收件箱中;如果郵件為垃圾郵件,就移動(dòng)到垃圾箱中。如果兩個(gè)名單中都未查找到匹配項(xiàng),則繼續(xù)進(jìn)行規(guī)則過(guò)濾。 登陸信息錄入: 輸入:用戶名,密碼; 輸出:無(wú); 描述:輸入用戶名,密碼,為登陸郵箱服務(wù)器做準(zhǔn)備工作。 19 六、系統(tǒng)總體 設(shè)計(jì) (一)系統(tǒng)功能規(guī)劃 該系統(tǒng)采用客戶端過(guò)濾模式,使用多層過(guò)濾,采用關(guān)鍵字權(quán)值過(guò)濾方法,再配合使用黑白名單過(guò)濾技術(shù),有較好的過(guò)濾效果。當(dāng)收到新郵件時(shí),郵件列表中會(huì)增加新郵件項(xiàng)。作為新時(shí)代的學(xué)生,幾乎人人都具備計(jì)算機(jī)的基本操作能力,而本軟件的使用又十分簡(jiǎn)單方便,所以 具備操作可行性。其次考慮在規(guī)定平臺(tái)之上,利用現(xiàn)有的成熟技術(shù)是否能夠?qū)崿F(xiàn)這個(gè)應(yīng)用。 ( 3)敏感關(guān)鍵字過(guò)濾 16 基于內(nèi)容郵件過(guò)濾器進(jìn)行攻擊的方法主要有 5 種:切詞破壞、單詞沙拉、 URL 欺騙和隱藏攻擊、稀疏數(shù)據(jù)攻擊、干擾過(guò)濾器再學(xué)習(xí)。 但是,黑白名單過(guò)濾并不適合所有用戶,來(lái)自黑名單中地址的郵件,對(duì)于某些用戶來(lái)說(shuō)可能是正常郵件。第一層為基于信頭特征過(guò)濾,根據(jù)信頭特征進(jìn)行過(guò)濾。因此,需要在不犧牲分類質(zhì)量的前提下,盡可能的降低特征項(xiàng)的個(gè)數(shù)。在頻率超過(guò)某個(gè)預(yù) 先設(shè)定得閾值時(shí),就
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1