freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)采集自動化處理與數(shù)據(jù)挖掘(編輯修改稿)

2024-07-16 12:28 本頁面
 

【文章內(nèi)容簡介】 源訪問請求,服務(wù)器端將結(jié)果返回客戶端。但 Client/Server 結(jié)構(gòu)存在著很多體系結(jié)構(gòu)上的問題,比如:當(dāng)客戶端數(shù)目激增時,服務(wù)器端的性能會因為負載過重而大大衰減;一旦應(yīng)用的需求發(fā)生變化,客戶端和服務(wù)器端的應(yīng)用程序都需要進行修改,給應(yīng)用維護和升級帶來了極大的不便;大量的數(shù)據(jù)傳輸增加了網(wǎng)絡(luò)的負載等等。 三層結(jié)構(gòu)簡介所謂三層體系結(jié)構(gòu),是在客戶端與數(shù)據(jù)庫之間加入了一個“中間層” ,也叫組件層。這里所說的三層體系,不是指物理上的三層,不是簡單地放置三臺機器就是三層體系結(jié)構(gòu),也不僅僅有 B/S 應(yīng)用才是三層體系結(jié)構(gòu),三層是指邏輯上的三層,即使這三個層放置到一臺機器上。三層體系的應(yīng)用程序?qū)I(yè)務(wù)規(guī)則、數(shù)據(jù)訪問、合法性校驗等工作放到了中間層進行處理。通常情況下,客戶端不直接與數(shù)據(jù)庫進行交互,而是通過COM/DCOM 通訊與中間層建立連接,再經(jīng)由中間層與數(shù)據(jù)庫進行交互 [5]。隨著分布式對象技術(shù)的逐漸成熟,多層分布式應(yīng)用體系結(jié)構(gòu)得到了越來越多的應(yīng)用。應(yīng)用系統(tǒng)只有向多層分布式轉(zhuǎn)變,才能最終解決 Client/Server 結(jié)構(gòu)存在的問題。在多層架構(gòu)下,應(yīng)用可以分布在不同的系統(tǒng)平臺上,通過分布式技術(shù)實現(xiàn)異構(gòu)平臺間對象的相互通信。將應(yīng)用系統(tǒng)集成于分布式系統(tǒng)之上,能極大地提高系統(tǒng)的可擴展性。在多層分布式應(yīng)用中,在客戶端和服務(wù)器之間加入了一層或多層應(yīng)用服務(wù)程序,這種程序稱為“應(yīng)用服務(wù)器” 。開發(fā)人員可以將應(yīng)用的商業(yè)邏輯放在中間層應(yīng)用服務(wù)器上,把應(yīng)用的業(yè)務(wù)邏輯與用戶界面分開。在保證客戶端功能的前提下,為用戶提供一個簡潔的界面。這意味著如果需要修改應(yīng)用程序12 / 49代碼,只需要對中間層應(yīng)用服務(wù)器進行修改,而不用修改成千上萬的客戶端應(yīng)用程序。從而使開發(fā)人員可以專注于應(yīng)用系統(tǒng)核心業(yè)務(wù)邏輯的分析、設(shè)計和開發(fā),簡化了應(yīng)用系統(tǒng)的開發(fā)、更新和升級工作。因此,本系統(tǒng)將選擇三層體系結(jié)構(gòu),圖 是系統(tǒng)高層邏輯體系結(jié)構(gòu)圖:圖 高層邏輯體系結(jié)構(gòu) 用 部署三層架構(gòu)就 B/S 模式的系統(tǒng)的開發(fā),具體技術(shù)又有多種選擇:JSP + J2EE, ASP+IIS, + Microsoft .NET Framework + IIS,PHP + Apache,就這幾門技術(shù),可以說各有其優(yōu)缺點,分析如下: JSP 技術(shù):具有良好的跨平臺性,加上 J2EE 功能十分強大,但是 J2EE的布置使開發(fā)成本顯得略高,而且沒有良好的安裝界面。 PHP 技術(shù):是早期動態(tài)網(wǎng)頁技術(shù)中的強手,但隨著 JSP 技術(shù)與 ASP 技術(shù)的不斷更新,使得 PHP 技術(shù)稍微比較落后。 ASP 技術(shù):類似于 PHP 技術(shù),開發(fā)簡便,快速,加上 IIS 的功能支持,是比較簡易快速的開發(fā)技術(shù)。:可以說是 ASP 技術(shù)的替代技術(shù),是 ASP 的一大進步,在Microsoft .NET Framework 的強大支持下,可以使用 C、VB、JavaScript 等數(shù)十種語言來編寫代碼,采用預(yù)先編譯技術(shù),使得代碼安全性加強。邏輯層 數(shù)據(jù)層表示層CodeBehind后臺代碼顯示頁面BusinessLayerDataLayer DataBase13 / 49Microsoft .NET Framework 是微軟推出的一套下一代開發(fā)平臺。從開發(fā)人員的角度來看,.NET 是一個公共平臺的類庫 (FCL),包括一個公共語言運行庫(CLR) 。 的公共運行規(guī)范(CLS 的語言都可以使用它提供的強大的類,并編譯為微軟的中間語言(MSIL) ,在其他的應(yīng)用中就可以當(dāng)作一個組件來調(diào)用。同時享受公共語言運行庫帶來的一切好處:垃圾自動回收(GC) 、實時編譯(JIT)、跨語言互動、跨平臺。 .NET 可比喻是操作系統(tǒng)提供給開發(fā)人員的面向?qū)ο竦?API(應(yīng)用程序編程接口)。 中的一部分。它除了是編譯執(zhí)行速度快外,最大的優(yōu)點是頁面和代碼分離的編寫方式,對慣使 RAD 工具的人來說是個福音。再加 運行庫提供的支持事件的各種 WEB 控件,和以前編寫網(wǎng)頁方式相比可謂是一場革命。 平臺快速方便的部署三層架構(gòu)。 .NET 中可以方便的實現(xiàn)組件的裝配,后臺代碼通過命名空間可以方便的使用自己定義的組件。表示層放在 頁面中,數(shù)據(jù)庫操作和邏輯層用組件來實現(xiàn),這樣就很方便的實現(xiàn)了三層架構(gòu)。 IISIIS 是 InterInformationServer 的縮寫,它是微軟公司主推的服務(wù)器,最新的版本是 Windows2022 里面包含的 IIS 6, IIS 與 WindowNT Server 完全集成在一起,因而用戶能夠利用 Windows NT Server 和 NTFS (NT File System,NT 的文件系統(tǒng))內(nèi)置的安全特性,建立強大,靈活而安全的 Inter和 Intra 站 點。 IIS 支持 HTTP(HypertextTransferProtocol,超文本傳輸協(xié)議),F(xiàn)TP(Fe1eTransfer Protocol,文件傳輸協(xié)議) 以及 SMTP(Simple Mail Transfer Protocol, 簡單郵件傳輸協(xié)議),通過使用 CGI 和 ISAPI,IIS 可以得到高度的擴展。IIS 支 持 與語言無關(guān)的腳本編寫和組件,通過 IIS,開發(fā)人員就可以開發(fā)新一代動態(tài)的,富有魅力的 Web 站點。IIS 不需要開發(fā)人員學(xué)習(xí)新的腳本語言或者編譯應(yīng)用程序,IIS 完全支持 VBScript, JScript 開發(fā)軟件以及 Java,14 / 49它也支持以工和 WinCGI,以及 ISAPI 擴展和過濾器。IIS 的設(shè)計目的是建立一套集成的服務(wù)器服務(wù),用以支持 HTTP, FTP和 SMTP,它能夠提供快速且集成了現(xiàn)有產(chǎn)品,同時可擴展的 Inter 服務(wù)器。IIS 相應(yīng)性極高,同時系統(tǒng)資源的消耗也是最少, IIS 的安裝,管理和配置都相當(dāng)簡單,這是因為 IIS 與 Windows NT Server 網(wǎng)絡(luò)操作系統(tǒng)緊密的集成在一起,另外,IIS 還使用與 Windows NT Server 相同的 SAM(Security Accounts Manager,安全性賬號管理器),對于管理員來說, IIS 使用諸如 Performance Monitor 和 SNMP (Simple Nerwork Management Protocol,簡單網(wǎng)絡(luò)管理協(xié)議)之類的 NT 已有管理工具。IIS 支持 ISAPI,使用 ISAPI 可以擴展服務(wù)器功能,而使用 ISAPI 過濾器可以預(yù)先處理和事后處理儲存在 IIS 上的數(shù)據(jù)。用于 32 位 Windows 應(yīng)用程序的 Inter 擴展可以把 FTP,SMTP 和 HTTP 協(xié)議置于容易使用且任務(wù)集中的界面中,這些界面將 Inter 應(yīng)用程序的使用大大簡化,IIS 也支持MIME(MultipurposeInter Mail Extensions,多用于 Inter 郵件擴展),它可以為 Inter 應(yīng)用程序的訪問提供一個簡單的注冊項。 體系結(jié)構(gòu)建立的幾個原則 體系結(jié)構(gòu)的選擇上,基于以下幾個原則:1.盡量創(chuàng)建可重用代碼在確認體系結(jié)構(gòu)和基礎(chǔ)代碼將要提供什么樣的服務(wù)時,最重要的任務(wù)就是找出那些通用的、可重用的任務(wù),這些任務(wù)將被不同的程序模塊調(diào)用。構(gòu)建 HWMPS 的體系結(jié)構(gòu)和基礎(chǔ)框架也必須是可擴展的,應(yīng)該支持功能的增加與擴展而不影響原有的功能模塊。2.加強設(shè)計模式與最佳實踐在設(shè)計 HWMPS 體系架構(gòu)時,應(yīng)自底向上的設(shè)計每一步。進行底層的最佳模式設(shè)計。3.提供通用功能15 / 49提供一個健壯的體系結(jié)構(gòu)另一種益處就是能夠發(fā)布被其他組件共享的有用功能,比如定義一些異常類、日志類、頁面類,所有的基頁面都繼承自這些類。4.提供開發(fā)基礎(chǔ)除了加強設(shè)計模式和提供通過功能外,自下而上的建立體系結(jié)構(gòu)還有另外的好處,許多開發(fā)團隊會遇到一個問題,那就是每個人會按自己獨特的方式去完成任務(wù),由于 規(guī)模大并且對每一個問題可以提供多種解決辦法,這個問題會變得特別突出。通過建立一個強壯的體系結(jié)構(gòu),可以向開發(fā)者明確的描述如何去完成不同的任務(wù),可以提供標(biāo)準(zhǔn)化的代碼,用開發(fā)者用來處理緩存、調(diào)用上下文、數(shù)據(jù)訪問等。當(dāng)開發(fā)者圍繞該體系結(jié)構(gòu)執(zhí)行各種不同的任務(wù)時,就可以告訴他們?nèi)绾问褂谩?數(shù)據(jù)挖掘 什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining),又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database, KDD),就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單的說,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識。 并非所有的信息發(fā)現(xiàn)任務(wù)都被視為數(shù)據(jù)挖掘。例如,使用數(shù)據(jù)庫管理系統(tǒng)查找個別的記錄,或通過因特網(wǎng)的搜索引擎查找特定的 Web 頁面,則是信息檢索(information retrieval)領(lǐng)域的任務(wù)。雖然這些任務(wù)是重要的,可能涉及使用復(fù)雜的算法和數(shù)據(jù)結(jié)構(gòu),但是它們主要依賴傳統(tǒng)的計算機科學(xué)技術(shù)和數(shù)據(jù)的明顯特征來創(chuàng)建索引結(jié)構(gòu),從而有效地組織和檢索信息。盡管如此,數(shù)據(jù)挖掘技術(shù)也已用來增強信息檢索系統(tǒng)的能力。16 / 49 數(shù)據(jù)挖掘能做什么數(shù)據(jù)挖掘能做以下六種不同事情(分析方法): 1. 分類 (Classification) 首先從數(shù)據(jù)中選出已經(jīng)分好類的訓(xùn)練集,在該訓(xùn)練集上運用數(shù)據(jù)挖掘分類的技術(shù),建立分類模型,對于沒有分類的數(shù)據(jù)進行分類。例子:(1) 信用卡申請者,分類為低、中、高風(fēng)險 (2) 分配客戶到預(yù)先定義的客戶分片 注意: 類的個數(shù)是確定的,預(yù)先定義好的2. 估值(Estimation)估值與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續(xù)值的輸出;分類的類別是確定數(shù)目的,估值的量是不確定的。例子: (1) 根據(jù)購買模式,估計一個家庭的孩子個數(shù) (2) 根據(jù)購買模式,估計一個家庭的收入 (3) 估計 real estate 的價值 一般來說,估值可以作為分類的前一步工作。給定一些輸入數(shù)據(jù),通過估值,得到未知的連續(xù)變量的值,然后,根據(jù)預(yù)先設(shè)定的閾值,進行分類。例如:銀行對家庭貸款業(yè)務(wù),運用估值,給各個客戶記分(Score 0~1) 。然后,根據(jù)閾值,將貸款級別分類。3. 預(yù)言(Prediction ) 通常,預(yù)言是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用于對未知變量的預(yù)言。從這種意義上說,預(yù)言其實沒有必要分為一個單獨的類。預(yù)言其目的是對未來未知變量的預(yù)測,這種預(yù)測是需要時間來驗證的,即必須經(jīng)過一定時間后,才知道預(yù)言準(zhǔn)確性是多少。4. 相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinity grouping or association rules)17 / 49決定哪些事情將一起發(fā)生。 例子:(1) 超市中客戶在購買 A 的同時,經(jīng)常會購買 B,即 A = B(關(guān)聯(lián)規(guī)則) (2) 客戶在購買 A 后,隔一段時間,會購買 B (序列分析) 5. 聚集(Clustering) 聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區(qū)別是聚集不依賴于預(yù)先定義好的類,不需要訓(xùn)練集。 例子:(1) 一些特定癥狀的聚集可能預(yù)示了一個特定的疾病(2) 租 VCD 類型不相似的客戶聚集,可能暗示成員屬于不同的亞文化群 聚集通常作為數(shù)據(jù)挖掘的第一步。例如,哪一種類的促銷對客戶響應(yīng)最好?,對于這一 類問題,首先對整個客戶做聚集,將客戶分組在各自的聚集里,然后對每個不同的聚集,回答問題,可能效果更好。6.描述和可視化(Des cription and Visualization) 是對數(shù)據(jù)挖掘結(jié)果的表示方式。 數(shù)據(jù)挖掘的實現(xiàn) 在技術(shù)上可以根據(jù)它的工作過程分為:數(shù)據(jù)的抽取、數(shù)據(jù)的存儲和管理、數(shù)據(jù)的展現(xiàn)等關(guān)鍵技術(shù)。 1. 數(shù)據(jù)的抽取 數(shù)據(jù)的抽取是數(shù)據(jù)進入倉庫的入口。由于數(shù)據(jù)倉庫是一個獨立的數(shù)據(jù)環(huán)境,它需要通過抽取過程將數(shù)據(jù)從聯(lián)機事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機的數(shù)據(jù)存儲介質(zhì)中導(dǎo)入數(shù)據(jù)倉庫。數(shù)據(jù)抽取在技術(shù)上主要涉及互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控等幾個方面的處理。在數(shù)據(jù)抽取方面,未來的技術(shù)發(fā)展將集中在系統(tǒng)功能集成化方面,以適應(yīng)數(shù)據(jù)倉庫本身或數(shù)據(jù)源的變化,使系統(tǒng)更便于管理和維護。 2. 數(shù)據(jù)的存儲和管理 18 / 49數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫的特性,也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。數(shù)據(jù)倉庫管理所涉及的數(shù)據(jù)量比傳統(tǒng)事務(wù)處理大得多,且隨時間的推移而快速累積。在數(shù)據(jù)倉庫的數(shù)據(jù)存儲和管理中需要解決的是如何管理大量的數(shù)據(jù)、如何并行處理大量的數(shù)據(jù)、如何優(yōu)化查詢等。目前,許多數(shù)據(jù)庫廠家提供的技術(shù)解決方案是擴展關(guān)系型數(shù)據(jù)庫的功能,將普通關(guān)系數(shù)據(jù)庫改造成適合擔(dān)當(dāng)數(shù)據(jù)倉庫的服務(wù)器。 3. 數(shù)據(jù)的展現(xiàn) 在數(shù)據(jù)展現(xiàn)方面主要的方式有: 查詢:實現(xiàn)預(yù)定義查詢、動態(tài)查詢、OLAP 查詢與決策支持智能查詢;報表:產(chǎn)生關(guān)系數(shù)據(jù)表格、復(fù)雜表格、OLAP 表格、報告以及各種綜合報表;可視化:用易于理解的點線圖、直方圖、餅圖、網(wǎng)狀圖、交互式可視化、動態(tài)模擬、計算機動畫技術(shù)表現(xiàn)復(fù)雜數(shù)據(jù)及其相互關(guān)系;統(tǒng)計:進行平均值、最大值、最小值、期望、方差、匯總、排序等各種統(tǒng)計分析;挖掘:利用數(shù)據(jù)挖掘等方法,從數(shù)據(jù)中得到關(guān)于數(shù)據(jù)關(guān)系和模式的知識。3系統(tǒng)功能設(shè)計 概要說明系統(tǒng)主要由 3 部分組成,分別 Downloader,Parser,部分有不同的責(zé)任,而每兩個部分之間都是相互關(guān)聯(lián)的。 Downloader 負責(zé)把文件從不同的服務(wù)器上下在下來。而 Parser
點擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1