【正文】
12 。 11 邏輯回歸 邏輯回歸算法是神經(jīng)網(wǎng)絡(luò)算法的一種特殊的構(gòu)造,得到了消除隱蔽層。 線性回歸 線性回歸算法是決策樹算法的一種特殊的構(gòu)造,獲得了無效的分裂(整個回歸公式是建立在一個單一根節(jié)點)。該算法之間和 Microsoft決策樹算法的 主要區(qū)別之一,但是,是其學(xué)習(xí)的過程是朝著減少錯誤,而 Microsoft決策樹算法拆分規(guī)則,以最大限度地獲取信息,優(yōu)化網(wǎng)絡(luò)參數(shù)。從整個案件的第一次迭代的初始設(shè)置分類的錯誤是反饋到網(wǎng)絡(luò),并用于修改為下一次迭代網(wǎng)絡(luò)的性能,等等。類似 Microsoft決策樹算法提供程序,那么每一個可預(yù)測屬性的狀態(tài),該算法計算出的每個輸入屬性可能狀態(tài)的概率。例如,在一家商店前的銷售可能會在其他商店的預(yù)測目前的銷售非常有用。 一個案件可能含有一組變量(例如,在不同的商店銷售)。您只能有一個為每個模型病例。例如,您可以使用 Microsoft時序算法來預(yù)測銷售和在一個立方體的歷史數(shù)據(jù)為基礎(chǔ)的利潤。這使得該模型的一個探索發(fā)現(xiàn)的數(shù)據(jù)和如何在不同的輸入屬性的預(yù)測屬性的不同分布狀態(tài)不錯的選擇。在傳統(tǒng)貝葉斯算法產(chǎn)生一個簡單的挖掘模型可以被認為是在數(shù)據(jù)挖掘過程的起點。用于生成該模型的概率計算,并在立方體的處理中。 傳統(tǒng)貝葉斯 在傳統(tǒng)貝葉斯算法快速生成挖掘,可用于分類和預(yù)測的模型。另一組可能包括去相同的餐廳,也有類似的薪金,休假和每年兩次以外的地區(qū)的人。例如,考慮那些10 住在同一社區(qū),驅(qū)動器相同的車,吃同樣的食物,買了類似的版本的產(chǎn)品的那一個群體的人。利用這些組合,您可以探討的數(shù)據(jù),更多地了解存在的關(guān)系,這在理論上可能不容易通過偶然的觀察獲得。該模型力圖找到一個結(jié)合的屬性和引起在預(yù)測屬性不成比例分配的狀態(tài),因此,您可以預(yù)測預(yù)測屬性的結(jié)果。如果輸入的屬性被視為導(dǎo)致預(yù)測屬性有利于促成比另一個更好的狀態(tài),于是一個新的節(jié)點添加到模型。頂端節(jié)點樹描述了大多數(shù)預(yù)測屬性的統(tǒng)計分析。 在建立模型時,該算法檢查 每個數(shù)據(jù)集的輸入屬性是怎樣的影響預(yù)測屬性的結(jié)果,以及使用最強的關(guān)系的輸入屬性制造了一系列的分裂,稱為節(jié)點。 決策樹 決策樹算法支持分類與回歸并且對預(yù)測模型也行之有效。 SQL Server 2021中各種各樣的算法可以讓你執(zhí)行多種類型的執(zhí)行。 你可以通過向商業(yè)智能開發(fā)式的解決方案中分別增加項目來將數(shù)據(jù)轉(zhuǎn)換項目和分析服務(wù)項目結(jié)合起來工作,作為商務(wù)智能解決方案的一部分。利用 DTS設(shè)計器,您可以將包發(fā)布到服務(wù)器上并定期的運行他們。利用 DTS中的任務(wù)和轉(zhuǎn)移,您可以把數(shù)據(jù)準備和模型建立結(jié)合為一個單一的 DTS包。這些工具可用于執(zhí)行一些數(shù)據(jù)挖掘中最重要的任務(wù),為數(shù)據(jù)模型的建立清理和準備數(shù)據(jù)。在SQL Server管理工作室中,您可以管理您的數(shù)據(jù)庫和執(zhí)行一些在商業(yè)智能開發(fā)工作室中的相同的職能,比如在挖掘模式中查看、創(chuàng)建預(yù)測。一旦開發(fā)商對解決方案滿意,就可以將其發(fā)布到分析服務(wù)服務(wù)器。 在數(shù)據(jù)被清理并為數(shù)據(jù)挖掘準備好后,大多數(shù)和創(chuàng)建蘇局挖掘解決方案相關(guān)聯(lián)的工作都在商業(yè)智能開發(fā)工作室中工作。 SQL Server 管理工作室 SQL Server管理工作室是一個行政和腳本工具與 Microsoft SQL Server組件工作的集合。 一個 SSAS數(shù)據(jù)庫用于集成多種 技術(shù),這個數(shù)據(jù)庫作為數(shù)據(jù)挖掘模型以及OLAP等技術(shù)的基礎(chǔ)。由于商業(yè)智能開發(fā)工作室是創(chuàng)建于 IDE環(huán)境中的,在該環(huán)境中,你可以在脫機狀態(tài)下創(chuàng)建一個完整地解決方案。數(shù)據(jù)庫中的產(chǎn)品根據(jù)子類別,型號和產(chǎn)品來分類。 關(guān)于 AW公司數(shù)據(jù)庫的更多信息請參考 SQL Server聯(lián)機叢書中的如下章節(jié):‘ Sample Databases and Business Scenarios’。 AW公司生產(chǎn)并向北美,歐洲和亞洲的商業(yè)市場銷售金屬和復(fù)合材料的自行車,主要的工作都在華盛頓 Bothell完成,那里擁有 500 員工,以及一些地區(qū)銷售部門遍及各地。 一些很重要的建立數(shù)據(jù)挖掘解決方案的步驟是用來整理準備那些用于建立數(shù)據(jù)模型的數(shù)據(jù), SQL2021包含一個 DTS的工作環(huán)境以及一些 DTS的工具用于清理驗證準備數(shù)據(jù),關(guān)于 DTS的更多信息請查看 SQL BOL中的‘ DTS Data Mining Tasks and Transformations’ 章節(jié)。因為建立一個數(shù)據(jù)預(yù)期可能比較復(fù)雜,所以數(shù)據(jù)挖掘編輯器包含了一個工具叫做 “ Prediction Query Builder”, 該工具可以讓你在一個圖形化的界面下編輯 DMX查詢語句,你也可以在該工具中可以查看自動生成的 DMX語句。使用此工具,您可以比較準確的預(yù)測模型和您確定最佳模式。 您的項目往往會包含多個挖掘模型,所以才能使用的模式創(chuàng)建的預(yù)測,你要能夠確定哪些模式是最準確的。在編輯器中的每個挖掘模型查看器是自定義進行探討,以特定的算法建立的模型。使用編輯器,您可以管理挖掘模型,創(chuàng)造新模式,查看模型,比較模型,并建立在現(xiàn)有模型的預(yù)測。欲了解更多關(guān)于從兩個環(huán)境中選擇的信息,請參看 SQL Server聯(lián)機叢書中的“在 SQL Server 工作室和商業(yè)智能開發(fā)工作室中選擇”。 SQL Server 管理工作室的主要職能是管理服務(wù)器。當(dāng)項目已經(jīng)準備就緒,您可以發(fā)布到服務(wù)器上。在線分析處理( OLAP )和數(shù)據(jù)挖掘工具被統(tǒng)一為兩個工作環(huán)境:商業(yè)智能開發(fā)工作室和 SQL Server 管理工作室。這些解決方案的情景更詳細的解釋在后面的教程。 介紹 數(shù)據(jù)挖掘教程旨在通過創(chuàng)建 走在 Microsoft SQL Server 2021的 數(shù)據(jù)挖掘模型的過程。 SQL Server?2021 中提供用于創(chuàng)建和使用數(shù)據(jù)挖掘模型的集成環(huán)境的工作。ve Bayes algorithm produces a simple mining model that can be considered a starting point in the data mining process. Because most of the calculations used in creating the model are generated during cube processing, results are returned quickly. This makes the model a good option for exploring the data and for discovering how various input attributes are distributed in the different states of the predicted attribute. Microsoft Time Series The Microsoft Time Series algorithm creates models that can be used to predict continuous variables over time from both OLAP and relational data sources. For example, you can use the Microsoft Time Series algorithm to predict sales and profits based on the historical data in a cube. Using the algorithm, you can choose one or more variables to predict, but they must be continuous. You can have only one case series for each model. The case series identifies the location in a series, such as the date when looking at sales over a length of several months or years. A case may contain a set of variables (for example, sales at different stores). The Microsoft Time Series algorithm can use crossvariable correlations in its predictions. For example, prior sales at one store may be useful in predicting current sales at another store. Microsoft Neural Network In Microsoft SQL Server 2021 Analysis Services, the Microsoft Neural Network algorithm creates classification and regression mining models by constructing a multilayer perceptron work of neurons. Similar to the Micro