freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

外文文獻(xiàn)翻譯---數(shù)據(jù)挖掘技術(shù)簡介-其他專業(yè)(已修改)

2025-02-04 09:01 本頁面
 

【正文】 畢業(yè)設(shè)計 (論文 ) 外文文獻(xiàn)翻譯 專業(yè) 計算機(jī)科學(xué)與技術(shù) 學(xué) 生 姓 名 班級 學(xué)號 指 導(dǎo) 教 師 博雅 學(xué)院 1 中文譯文 數(shù)據(jù)挖掘技術(shù)簡介 摘要 :微軟 174。 SQL Server?2021 中 提供用 于創(chuàng)建和使用數(shù)據(jù)挖掘模型的集成環(huán)境的工作。本教程使用的四種情況: 有針對性的郵件 預(yù)測; 順序分析和聚 類;演示如何使用挖掘模型算法; 挖掘模型查看器和數(shù)據(jù)挖掘工具。 介紹 數(shù)據(jù)挖掘教程旨在通過創(chuàng)建走在 Microsoft SQL Server 2021的 數(shù)據(jù)挖掘 模型的過程。數(shù)據(jù)挖掘算法,并在 SQL Server 2021工具 可以很容易地建立一個項目,包括市場購物籃分析各種全面的解決方案,預(yù)測分析,有針對性的郵件分析。這些解決方案的情景更詳細(xì)的解釋在后面的教程。 SQL Server 2021最明顯的部分是用來創(chuàng)建和處理數(shù)據(jù)挖掘模型的工作室。在線分析處理( OLAP )和數(shù)據(jù)挖掘工具被統(tǒng)一為兩個工作環(huán)境:商業(yè)智能開發(fā)工作室和 SQL Server 管理工作室。通過商業(yè)智能開發(fā)工作室,您可以在與服務(wù)器斷開連接的情況下建立一個服務(wù)項目分析。當(dāng)項目已經(jīng)準(zhǔn)備就緒,您可以發(fā)布到 服務(wù)器上。您也可以直接面向服務(wù)器工作。 SQL Server 管理工作室的主要職能是管理服務(wù)器。之后將有針對每一個環(huán)境的詳細(xì)說明。欲了解更多關(guān)于從兩個環(huán)境中選擇的信息,請參看 SQL Server聯(lián)機(jī)叢書中的“在 SQL Server 工作室和商業(yè)智能開發(fā)工作室中選擇”。 數(shù)據(jù)挖掘工具都存在于數(shù)據(jù)挖掘的編輯。使用編輯器,您可以管理挖掘模型,創(chuàng)造新模式,查看模型,比較模型,并建立在現(xiàn)有模型的預(yù)測。 當(dāng)你創(chuàng)建一個挖掘模型,你會想要去探索它,尋找有趣的模式和規(guī)則。在編輯器中的每個挖掘模型查看器是自定義進(jìn)行探討,以特定的 算法建立的模型。如需觀眾的信息,請參看 SQL Server聯(lián)機(jī)叢書中的“查看數(shù)據(jù)挖掘模型”。 您的項目往往會包含多個挖掘模型,所以才能使用的模式創(chuàng)建的預(yù)測,你要能夠確定哪些模式是最準(zhǔn)確的。出于這個原因,編輯包含一個模型比較工具挖掘精度的圖表標(biāo)簽。使用此工具,您可以比較準(zhǔn)確的預(yù)測模型和您確定最佳模式。 為了建立數(shù)據(jù)預(yù)期,你將使用一種 DME語言, DMX擴(kuò)展了傳統(tǒng)的 SQL語法,包含了一些創(chuàng)建修改和建立數(shù)據(jù)預(yù)期的命令,關(guān)于 DMX的詳細(xì)信息,請參考 SQL BOL中的 “ Data Mining Extensions (DMX) Reference”章節(jié)。因為建立一個數(shù)據(jù)預(yù)期可能比較復(fù)雜,所以數(shù)據(jù)挖掘編輯器包含了一個工具叫做 “ Prediction Query Builder”, 該工具可以讓你在一個圖形化的界面下編輯 DMX查詢語句,你也可以在該工具中可以查看自動生成的 DMX語句。 了解了前面介紹的實現(xiàn)數(shù)據(jù)挖掘的工具之外,同等重要的是了解數(shù)據(jù)挖掘模型的結(jié)構(gòu)本身,建立一個數(shù)據(jù)模型的關(guān)鍵是數(shù)據(jù)挖掘算法,該算法在你操作的數(shù)2 據(jù)中尋找我們需要的部分,并且轉(zhuǎn)換這些數(shù)據(jù)成為一個可操作的數(shù)據(jù)模型。 一些很重要的建立數(shù)據(jù)挖掘解決方案的 步驟是用來整理準(zhǔn)備那些用于建立數(shù)據(jù)模型的數(shù)據(jù), SQL2021包含一個 DTS的工作環(huán)境以及一些 DTS的工具用于清理驗證準(zhǔn)備數(shù)據(jù),關(guān)于 DTS的更多信息請查看 SQL BOL中的 ‘ DTS Data Mining Tasks and Transformations’ 章節(jié)。 Adventure 數(shù)據(jù)庫 AdventureWorksDW 數(shù)據(jù)庫是基于一個虛構(gòu)的自行車制造公司而建立,公司的名稱叫做 “ Adventure Works Cycles”(簡稱 AW公司)。 AW公司生產(chǎn)并向北美,歐洲和亞洲的商業(yè)市場銷售金屬和復(fù)合材 料的自行車,主要的工作都在華盛頓 Bothell完成,那里擁有 500 員工,以及一些地區(qū)銷售部門遍及各地。 AW公司通過 INTERNET批發(fā)和零售他們的產(chǎn)品,本教程中的數(shù)據(jù)模型實例需要你使用這些網(wǎng)絡(luò)銷售數(shù)據(jù)作為數(shù)據(jù)模型。 關(guān)于 AW公司數(shù)據(jù)庫的更多信息請參考 SQL Server聯(lián)機(jī)叢書中的如下章節(jié):‘ Sample Databases and Business Scenarios’ 。 數(shù)據(jù)庫詳細(xì)信息 網(wǎng)絡(luò)銷售數(shù)據(jù)構(gòu)架包含 9242個客戶的信息,這些客戶分布在 6個國家,并被合并為 3個區(qū)域: 南美 (83%) 歐洲 (12%) 澳大利亞 (7%) 該數(shù)據(jù)庫包含三個財政年度的數(shù)據(jù): 2021年, 2021年和 2021年。數(shù)據(jù)庫中的產(chǎn)品根據(jù)子類別,型號和產(chǎn)品來分類。 商業(yè)智能開發(fā)工作室 商業(yè)智能開發(fā)工作室是一套用于創(chuàng)建商務(wù)智能項目的工具。由于商業(yè)智能開發(fā)工作室是創(chuàng)建于 IDE環(huán)境中的,在該環(huán)境中,你可以在脫機(jī)狀態(tài)下創(chuàng)建一個完整地解決方案。你可以想改多少數(shù)據(jù)挖掘?qū)ο缶透亩嗌?,但是在你發(fā)布該項目前,這些改變將不會反映在服務(wù)器上。 一個 SSAS數(shù)據(jù)庫用于集成多種技術(shù),這個數(shù)據(jù)庫作為數(shù)據(jù)挖掘模型以及OLAP等技術(shù)的基礎(chǔ)。你可以 使用商業(yè)智能 建立和修改一個 SSAS項目并部署這個項目到一個或多個 SSAS服務(wù)如果你在開發(fā)一個 SSAS項目你也可以使用商業(yè)智能開發(fā)工作室直接連接數(shù)據(jù)庫,這樣你所作的改動可以立刻影響到數(shù)據(jù)庫中。 SQL Server 管理工作室 SQL Server管理工作室是一個行政和腳本工具與 Microsoft SQL Server組件工作的集合。此工作區(qū)的不同之處,你是在互聯(lián)環(huán)境中工作的行動是在傳播到服務(wù)器只要您保存您的工作從商務(wù)智能開發(fā)工作室中。 在數(shù)據(jù)被清理并為數(shù)據(jù)挖掘準(zhǔn)備好后,大多數(shù)和創(chuàng)建蘇局挖掘解決方 案相關(guān)聯(lián)的工作都在商業(yè)智能開發(fā)工作室中工作。通過使用商業(yè)智能開發(fā)工作室,你可3 以利用迭代過程確定的給定情況下的最佳模式來發(fā)布和測試數(shù)據(jù)挖掘解決方案。一旦開發(fā)商對解決方案滿意,就可以將其發(fā)布到分析服務(wù)服務(wù)器。 從這點來看,重點從 SQL Server管理工作室的開發(fā)轉(zhuǎn)移到了維護(hù)和應(yīng)用。在SQL Server管理工作室中,您可以管理您的數(shù)據(jù)庫和執(zhí)行一些在商業(yè)智能開發(fā)工作室中的相同的職能,比如在挖掘模式中查看、創(chuàng)建預(yù)測。 數(shù)據(jù)轉(zhuǎn)換服務(wù) 在 SQL Server 2021中數(shù)據(jù)轉(zhuǎn)換服務(wù)( DTS )包括抽取,轉(zhuǎn)換和加載( 簡稱ETL )工具 。這些工具可用于執(zhí)行一些數(shù)據(jù)挖掘中最重要的任務(wù),為數(shù)據(jù)模型的建立清理和準(zhǔn)備數(shù)據(jù)。在數(shù)據(jù)挖掘,您通??梢詧?zhí)行重復(fù)數(shù)據(jù)轉(zhuǎn)換清理數(shù)據(jù),然后利用這些數(shù)據(jù)組成挖掘模型。利用 DTS中的任務(wù)和轉(zhuǎn)移,您可以把數(shù)據(jù)準(zhǔn)備和模型建立結(jié)合為一個單一的 DTS包。 DTS公司還提供了 DTS設(shè)計器,以幫助您輕松地建立和運(yùn)行的包含了所有的任務(wù)和轉(zhuǎn)變的軟件包。利用 DTS設(shè)計器,您可以將包發(fā)布到服務(wù)器上并定期的運(yùn)行他們。這是非常有用例如,你每周收集數(shù)據(jù)資料,并向要每次自動執(zhí)行相同的清潔轉(zhuǎn)換工作。 你可以通過向商業(yè)智能開發(fā)式 的解決方案中分別增加項目來將數(shù)據(jù)轉(zhuǎn)換項目和分析服務(wù)項目結(jié)合起來工作,作為商務(wù)智能解決方案的一部分。 挖掘模式算法 數(shù)據(jù)挖掘算法是挖掘模型的創(chuàng)建的基礎(chǔ)。 SQL Server 2021中各種各樣的算法可以讓你執(zhí)行多種類型的執(zhí)行。欲了解更多有關(guān)算法及其參數(shù)調(diào)整的信息,請參看 SQL Server聯(lián)機(jī)叢書中的“數(shù)據(jù)挖掘算法”。 決策樹 決策樹算法支持分類與回歸并且對預(yù)測模型也行之有效。利用該算法,你可以預(yù)測離散和連續(xù)這兩個屬性。 在建立模型時,該算法檢查每個數(shù)據(jù)集的輸入屬性是怎樣的影響預(yù)測屬性的結(jié)果,以及使用最強(qiáng)的關(guān) 系的輸入屬性制造了一系列的分裂,稱為節(jié)點。隨著新節(jié)點添加到模型中,樹狀結(jié)構(gòu)開始形成。頂端節(jié)點樹描述了大多數(shù)預(yù)測屬性的統(tǒng)計分析。每個節(jié)點建立把預(yù)測屬性比作投入的屬性的分布情況上。如果輸入的屬性被視為導(dǎo)致預(yù)測屬性有利于促成比另一個更好的狀態(tài),于是一個新的節(jié)點添加到模型。該模型繼續(xù)增長,直到?jīng)]有剩余的屬性制造分裂提供了一個更好的預(yù)測在現(xiàn)有節(jié)點。該模型力圖找到一個結(jié)合的屬性和引起在預(yù)測屬性不成比例分配的狀態(tài),因此,您可以預(yù)測預(yù)測屬性的結(jié)果。 簇 簇算法采用迭代技術(shù)組從包含相似特性的數(shù)據(jù)及中進(jìn)行分類。利用這些組合,您 可以探討的數(shù)據(jù),更多地了解存在的關(guān)系,這在理論上可能不容易通過偶然的觀察獲得。此外,您也可以從算法創(chuàng)建的簇建立預(yù)測模型。例如,考慮那些4 住在同一社區(qū),驅(qū)動器相同的車,吃同樣的食物,買了類似的版本的產(chǎn)品的那一個群體的人。這是一組數(shù)據(jù)。另一組可能包括去相同的餐廳,也有類似的薪金,休假和每年兩次以外的地區(qū)的人。觀測這些集合是如何的分布,可以更好地了解預(yù)測屬性的結(jié)果是如何相互影響的。 傳統(tǒng)貝葉斯 在傳統(tǒng)貝葉斯算法快速生成挖掘,可用于分類和預(yù)測的模型。它計算的每個輸入屬性的國家給予每個可預(yù)測屬性,它可以用來預(yù)測以后的預(yù) 測屬性上已知的結(jié)果輸入屬性狀態(tài),概率。用于生成該模型的概率計算,并在立方體的處理中。該算法只支持離散或離散化的屬性,它認(rèn)為所有輸入屬性是獨立的。在傳統(tǒng)貝葉斯算法產(chǎn)生一個簡單的挖掘模型可以被認(rèn)為是在數(shù)據(jù)挖掘過程的起點。由于在建立模型中使用的計算大多是在加工過程中產(chǎn)生的立方體,迅速返回結(jié)果。這使得該模型的一個探索發(fā)現(xiàn)的數(shù)據(jù)和
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1