freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

microsoftsqlserver20xxr2數(shù)據(jù)挖掘算法-挖掘模型內(nèi)容-資料下載頁

2025-08-12 20:48本頁面

【導(dǎo)讀】聚類分析模型的挖掘模型內(nèi)容................23. 模型內(nèi)容可能包括回歸公式、規(guī)則和項(xiàng)集的定義或權(quán)重和其他統(tǒng)計(jì)信息,不論使用的是哪種算法,挖掘模型內(nèi)容都是以標(biāo)準(zhǔn)結(jié)構(gòu)呈現(xiàn)的。構(gòu)行集的任意客戶端創(chuàng)建針對該挖掘模型內(nèi)容的查詢。有關(guān)詳細(xì)信息,請參閱使。容所通用的節(jié)點(diǎn)類型,并提供了關(guān)于如何解釋這些信息的指南。每個(gè)模型的內(nèi)容均顯示為一系列“節(jié)點(diǎn)”。節(jié)點(diǎn)是挖掘模型內(nèi)的對象,包含該模。型某一部分的元數(shù)據(jù)或信息。層次結(jié)構(gòu)中節(jié)點(diǎn)的準(zhǔn)確排列。同的含義,包含不同的內(nèi)容,具體取決于算法以及數(shù)據(jù)的深度和復(fù)雜性。的ID以及該節(jié)點(diǎn)具有的子節(jié)點(diǎn)數(shù)量。支持特定的預(yù)測值的定型數(shù)據(jù)中的事例計(jì)數(shù)。統(tǒng)計(jì)信息,如平均值、標(biāo)準(zhǔn)偏差或方差。息的方式不同,因此每個(gè)模型僅生成幾種特定類型的節(jié)點(diǎn)。3Interior樹中的內(nèi)部拆分節(jié)點(diǎn)。4Distribution樹的終端節(jié)點(diǎn)。有關(guān)輸入屬性狀態(tài)的統(tǒng)計(jì)信息。序列分類的Markov模型組件的頂端節(jié)點(diǎn)。對應(yīng)于可預(yù)測時(shí)序的時(shí)序樹的根節(jié)點(diǎn)。適用于神經(jīng)網(wǎng)絡(luò)模型。

  

【正文】 MSOLAP_NODE_SHORT_CAPTION 用于顯示的標(biāo)簽。 注釋 決策 樹模型沒有用于存儲(chǔ)整個(gè)模型的統(tǒng)計(jì)信息的單獨(dú)節(jié)點(diǎn),這與 Naive Bayes 或神經(jīng)網(wǎng)絡(luò)模型中的邊際統(tǒng)計(jì)信息節(jié)點(diǎn)不同。 該模型為每個(gè)可預(yù)測屬性創(chuàng)建一個(gè)單獨(dú)的樹,樹的頂部為 “( 全部 )” 節(jié)點(diǎn)。 每個(gè)樹獨(dú)立于其他樹。 如果模型僅包含一個(gè)可預(yù)測屬性,則只有一個(gè)樹,因此只有一個(gè) “( 全部 )” 節(jié)點(diǎn)。 表示輸出屬性的每個(gè)樹還進(jìn)一步細(xì)分為表示拆分的內(nèi)部分支 (NODE_TYPE = 3)。 其中的每個(gè)樹都包含有關(guān)目標(biāo)屬性的分布的統(tǒng)計(jì)信息。 此外,每個(gè)葉節(jié)點(diǎn) (NODE_TYPE = 4) 包含說明輸入屬性及其值以及支持每個(gè)屬 性值對的事例數(shù)目的統(tǒng)計(jì)信息。 因此,在決策樹的任何分支中,可以方便地查看數(shù)據(jù)的概率或分布,而不需要查詢源數(shù)據(jù)。 樹的每個(gè)級別必須表示其直接子節(jié)點(diǎn)的總和。 有關(guān)如何檢索這些統(tǒng)計(jì)信息的示例,請參閱 查詢決策樹模型( Analysis Services 數(shù)據(jù)挖掘) 4。 33 決策樹結(jié)構(gòu)示例: 若要了解決策樹的工作原理,請?jiān)O(shè)想一個(gè)示例,例如 AdventureWorks 自行車購買者方案。 假定可預(yù)測屬性是客戶購買情況,決策樹算法嘗試在提供的所有輸入中找出一列數(shù)據(jù),該列數(shù)據(jù)可最有效地檢測出可能購買和不可能購買自行車的客戶。 例如,該模型可能會(huì)發(fā)現(xiàn)年齡是購買行為的最佳指標(biāo)。 具體來說, 30 歲以上的客戶很可能購買自行車,而所有其他客戶則不大可能購買自行車。 在這種情況下,該模型在 Age 屬性上創(chuàng)建一個(gè) “ 拆分 ” 。 這表示樹將劃分成兩個(gè)分支,其中 一個(gè)分支包含 30 歲以上的客戶,而另一個(gè)分支包含 30 歲以下的客戶。 新分支在模型結(jié)構(gòu)中表示為兩個(gè)新的內(nèi)部樹 (NODE_TYPE = 3)。 對于每個(gè)分支,該模型繼續(xù)查找用于區(qū)分客戶的其他屬性。 如果數(shù)據(jù)中的證據(jù)不足以對客戶繼續(xù)創(chuàng)建子組,該模型則停止生成樹。 當(dāng)節(jié)點(diǎn)中的事例數(shù)太少而無法繼續(xù)生成樹時(shí),該模型也會(huì)停止生成樹,而不管拆分是如何的好,或者值是否為 Null 或 missing。 通過盡早地停止樹的生長,可以防止模型被定型的與特定數(shù)據(jù)集的過度接近。 每個(gè)內(nèi)部樹節(jié)點(diǎn)都包含葉節(jié)點(diǎn),這些葉節(jié)點(diǎn)根據(jù)當(dāng) 前分類結(jié)果提供結(jié)果明細(xì)。 例如,您可能具有表示 Age = 30 且 Gender = Male 的內(nèi)部節(jié)點(diǎn)。 該組的節(jié)點(diǎn)顯示該類別中有多少客戶已購買或尚未購買產(chǎn)品。 例如,分類可能包含以下樹拆分: 內(nèi)部樹 拆分 Age = 30 Age = 30 且 Gender = Male Age = 30 且 Gender = Female Age 30 Age 30 且 Gender = Male Age 30 且 Gender = Female 當(dāng)使用決策樹模型進(jìn)行預(yù)測時(shí),該模 型將為其提供的屬性用作參數(shù),并沿著屬性的路徑向下通過整個(gè)樹。 通常,所有預(yù)測都轉(zhuǎn)到葉,而內(nèi)部節(jié)點(diǎn)僅用于分類。 34 葉節(jié)點(diǎn)的 NODE_TYPE 始終為 4(分布),并包含一個(gè)直方圖,指示基于提供的屬性的每個(gè)結(jié)果(購買或不購買)的概率。 例如,如果您要求對一名 60 歲以上的新男性客戶進(jìn)行預(yù)測,該模型將查找對應(yīng)的節(jié)點(diǎn)( Age 30 且 Gender = Male),然后返回指定結(jié)果的概率。 這些概率存儲(chǔ)在節(jié)點(diǎn)的 NODE_DISTRIBUTION 表中。 如果可預(yù)測屬性是連續(xù)數(shù)字,該算法則嘗試創(chuàng)建對可預(yù)測屬性和輸入之間的關(guān)系進(jìn)行建模的回歸公式。 節(jié)點(diǎn)標(biāo)題和節(jié)點(diǎn)說明 在決策樹模型中,節(jié)點(diǎn)標(biāo)題和節(jié)點(diǎn)說明包含類似信息。 但是,越接近葉節(jié)點(diǎn),節(jié)點(diǎn)說明越完整,并且包含的信息越多。 節(jié)點(diǎn)標(biāo)題和節(jié)點(diǎn)說明是已本地化的字符串。 NODE_CAPTION 顯示區(qū)分相對于父節(jié)點(diǎn)的特定節(jié)點(diǎn)的屬性。 節(jié)點(diǎn)標(biāo)題基于拆分條件定義總體 的子段。 例如,如果拆分基于 [Age] 且是三向拆分,這三個(gè)子節(jié)點(diǎn)的節(jié)點(diǎn)標(biāo)題可能為 “[Age] 40” 、 “40 = [Age] 50” 和 “[Age] = 50” 。 NODE_DESCRIPTION 包含將該節(jié)點(diǎn)與其他節(jié)點(diǎn)(從模型父節(jié)點(diǎn)開始)區(qū)分開來的屬性的完整列表。 例如, Product name = Apple 且 Color = Red。 節(jié)點(diǎn)規(guī)則和邊際規(guī)則 NODE_RULE 和 MARGINAL_RULE 列包含的信息與 NODE_CAPTION 和 NODE_DESCRIPTION 列相同,但將這些信息表示為 XML 片段。 節(jié)點(diǎn)規(guī)則是 XML 版本的完整路徑,而邊際規(guī)則指示最新拆分。 XML 片段可以表示簡單或復(fù)雜的屬性。 簡單屬性包含模型列的名稱以及屬性的值。 如果模型列包含嵌套表,嵌套表屬性則表示為串聯(lián)在一起的表名稱、鍵值和屬性。 注意 SQL ServerAnalysis Services 支持 版本的 PMML 標(biāo)準(zhǔn),并帶有支持使用嵌套表的擴(kuò)展插件。 如果數(shù)據(jù)包含嵌套表,并且生成 PMML 版本的模型,則模型中包括謂詞的所有元素均被標(biāo)記為擴(kuò)展。 35 離 散屬性的節(jié)點(diǎn)分布 在決策樹模型中, NODE_DISTRIBUTION 表包含有用的統(tǒng)計(jì)信息。 但是,統(tǒng)計(jì)信息的類型取決于樹是預(yù)測離散屬性還是預(yù)測連續(xù)屬性。 此部分說明離散屬性的節(jié)點(diǎn)分布統(tǒng)計(jì)信息的含義。 屬性名稱和屬性值 在分類樹中,屬性名稱始終包含可預(yù)測列的名稱。 該值指示樹預(yù)測的內(nèi)容。 由于單個(gè)樹始終表示單個(gè)可預(yù)測屬性,因此該值在整個(gè)樹中重復(fù)。 對于離散數(shù)據(jù)類型,屬性值字段列出可預(yù)測列的可能值以及 Missing 值。 支持 每個(gè)節(jié)點(diǎn)的支持值指示該節(jié)點(diǎn)包括的事例數(shù)。 在 “( 全部 )” 級別,將顯示用于定型模型 的事例的完整計(jì)數(shù)。 對于樹中的每個(gè)拆分,支持值是分組到樹的該節(jié)點(diǎn)中的事例計(jì)數(shù)。 葉節(jié)點(diǎn)中的事例總和必須等于樹的父節(jié)點(diǎn)中的事例計(jì)數(shù)。 對于表示連續(xù)屬性的節(jié)點(diǎn),數(shù)據(jù)中存在 Null 值可能產(chǎn)生某些不夠直觀的結(jié)果。 例如,如果存在 m 個(gè)事例,平均值則計(jì)為 sum(all cases)/n,其中 n 是小于 m 的數(shù)字, mn 則為 Missing 值的事例的計(jì)數(shù)。 支持也表示為 n。 概率 與每個(gè)節(jié)點(diǎn)關(guān)聯(lián)的概率指示整個(gè)數(shù)據(jù)集中的任一事例終結(jié)于該特定節(jié)點(diǎn)的概率。 將針對整個(gè)樹和直接拆分計(jì)算概率分?jǐn)?shù)。 例如,下 表顯示了一個(gè)具有 100 個(gè)事例的非常簡單的模型。 內(nèi)部樹 事例 葉節(jié)點(diǎn) 事例 相對于父節(jié)點(diǎn)的概率 相對于頂端節(jié)點(diǎn)的概率 Age = 30 60 Age = 30 且 Gender = Male 50 50/60 = .83 50/100 = .5 Age = 30 且 Gender = Female 10 10/60 = .16 10/100 = .10 Age 30 40 Age 30 且 Gender = Male 30 30/40 = .75 30/100 = .30 Age 30 且 Gender = Female 10 10/40 = .25 10/100 = .10 36 在所有模型中進(jìn)行小幅調(diào)整,以便將可能的 Missing 值的情況考慮在內(nèi)。 對于連續(xù)屬性,每個(gè)值或值范圍均以狀態(tài)(例如, Age Age = 30 和 Age 30)表示,并且概率的計(jì)算方法如下:狀態(tài)存在(值 = 1)、存在某些其他狀態(tài)(值 = 0)、狀態(tài)為 Missing。 有關(guān)如何調(diào)整概率以表示 Missing 值的詳細(xì)信息,請參閱 缺少值( Analysis Services – 數(shù)據(jù)挖掘) 5。 每個(gè)節(jié)點(diǎn)的概率幾乎是通過分布情況直接計(jì)算出的,如下所示: 概率 =(對狀態(tài)的支持 + 對先前狀態(tài)的支持) /(節(jié)點(diǎn)支持加上對先前節(jié)點(diǎn)的支持) Analysis Services 使用每個(gè)節(jié)點(diǎn)的概率比較存儲(chǔ)概率和以前的概率,以便確定從父節(jié)點(diǎn)到子節(jié)點(diǎn)的路徑是否指示較強(qiáng)的推斷。 作出預(yù)測時(shí),必須使用節(jié)點(diǎn)的概率平衡分布的概率,從而使概率平滑。 例如,如果樹中的 拆分按 9000/1000 的比率分隔事例,則該樹很不平衡。 這會(huì)導(dǎo)致來自較小分支的預(yù)測和來自含有多個(gè)事例的分支的預(yù)測具有不同的權(quán)重。 方差 方差是在給定預(yù)期分布中,示例中的值的偏離程度的度量值。 對于離散值,根據(jù)定義方差為 0。 有關(guān)如何計(jì)算連續(xù)值的方差的詳細(xì)信息,請參閱 線性回歸模型的挖掘模型內(nèi)容( Analysis Services 數(shù)據(jù)挖掘) 6。 值類型 值類型列提供在 NODE_DISTRIBUTION 表的其他列中提供的數(shù)值的含義的相關(guān)信息。 您可以在查詢中使用值類型,以便檢索嵌套表的特定行。 例如,請參閱 查詢決策樹模型( Analysis Services 數(shù)據(jù)挖掘) 4。 在分類樹中使用 MiningValueType7 枚舉中的以下類型。 值類型 說明 1 (Missing) 指示與 Missing 值相關(guān)的計(jì)數(shù)、概率或其他統(tǒng)計(jì)信息。 4(離散) 指示與離散或離散化值相關(guān)的計(jì)數(shù)、概率或其他統(tǒng)計(jì)信息。 37 如果該模型包含連續(xù)可預(yù)測屬性,樹還可以包含回歸公式獨(dú)有的值類型。 有關(guān)在回歸樹中使用的值類型的列表,請參閱 線性回歸模型的挖掘模型內(nèi)容( Analysis Services 數(shù)據(jù)挖掘) 6。 節(jié)點(diǎn)分?jǐn)?shù) 節(jié)點(diǎn)分?jǐn)?shù)表示樹的每個(gè)級別的稍有不同的信息。 通常,分?jǐn)?shù)是指示基于條件進(jìn)行拆分的拆分性能的數(shù)值。 該值表示為一個(gè)雙精度值,值越大,性能越好。 根據(jù)定義,模型節(jié)點(diǎn)和所有葉節(jié)點(diǎn)的節(jié)點(diǎn)分?jǐn)?shù)為 0。 對于表示每個(gè)樹的頂部的 “( 全部 )” 節(jié)點(diǎn), MSOLAP_NODE_SCORE 列包含整個(gè)樹中的最佳拆分分?jǐn)?shù)。 對于樹中的所有其他節(jié)點(diǎn)(葉節(jié)點(diǎn)除外), 每個(gè)節(jié)點(diǎn)的分?jǐn)?shù)表示當(dāng)前節(jié)點(diǎn)的最佳拆分分?jǐn)?shù)減去父節(jié)點(diǎn)的拆分分?jǐn)?shù)。 通常,父節(jié)點(diǎn)的拆分分?jǐn)?shù)應(yīng)始終優(yōu)于其任一子節(jié)點(diǎn)的拆分分?jǐn)?shù)。 這是因?yàn)樵诶硐肭闆r下,決策樹模型首先在最重要的屬性上拆分。 有多種方式計(jì)算拆分分?jǐn)?shù),具體選擇哪種方式取決于您選擇的算法參數(shù)。 有關(guān)如何針對每種評分方法計(jì)算分?jǐn)?shù)的討論不屬于本主題的討論范圍。 有關(guān)詳細(xì)信息,請參閱 Microsoft 研究網(wǎng)站上的 “ Learning Bayesian Networks: The Combination of Knowledge and Statistical Data8” (了解 Bayesian 網(wǎng)絡(luò):知識(shí)與統(tǒng)計(jì)數(shù)據(jù)的組合)。 注意 如果創(chuàng)建的決策樹模型同時(shí)具有連續(xù)可預(yù)測屬性和離散可預(yù)測屬性,表示每個(gè)樹類型的 “( 全部 )” 節(jié)點(diǎn)中將顯示完全不同的分?jǐn)?shù)。 應(yīng)單獨(dú)考慮每個(gè)模型,并且對回歸評分所使用的方法完全不同于對分類評分所使用的方法。 無法比較節(jié)點(diǎn)分?jǐn)?shù)值。 決 策樹模型中的回歸節(jié)點(diǎn) 如果決策樹模型包含帶有連續(xù)數(shù)值數(shù)據(jù)的可預(yù)測屬性,則 Microsoft 決策樹算法查找被預(yù)測狀態(tài)和輸入變量之間存在線性關(guān)系的區(qū)域。 如果算法成功找到線性關(guān)系,則將創(chuàng)建表示線性回歸的特殊樹 (NODE_TYPE = 25)。 這些回歸樹節(jié)點(diǎn)比表示離散值的節(jié)點(diǎn)更復(fù)雜。 38 通常,回歸映射連續(xù)依賴項(xiàng)(可預(yù)測變量)中的更改作為輸入中的更改函數(shù)。 如果依賴變量具有任何連續(xù)輸入,并且輸入和預(yù)測值之間的關(guān)系非常穩(wěn)定,足以將其作為線形圖計(jì)算,那么, 回歸節(jié)點(diǎn)則包含一個(gè)公式。 但是,如果輸入和預(yù)測值之間是 “ 非線性 ” 關(guān)系,則轉(zhuǎn)而創(chuàng)建拆分,這與標(biāo)準(zhǔn)決策樹類似。 例如,假定 A 是可預(yù)測屬性, B 和 C 是輸入,其中 C 是連續(xù)值類型。 如果 A 和 C 之間的關(guān)系在部分?jǐn)?shù)據(jù)中相當(dāng)穩(wěn)定,而在其他數(shù)據(jù)中不穩(wěn)定,該算法將創(chuàng)建拆分以便表示數(shù)據(jù)的不同區(qū)域。 拆分條件 節(jié)點(diǎn)結(jié)果 如果 n 5 關(guān)系可以以公式 1 表示 如果 n 介于 5 和 10 之間 無公式 如果 n 10 關(guān)系可以以公式 2 表示 有關(guān)回歸節(jié)點(diǎn)的詳細(xì)信息,請參閱 線性回歸模型的挖掘模型內(nèi)容( Analysis Services 數(shù)據(jù)挖掘) 6。 請參閱 概念 挖掘模 型內(nèi)容( Analysis Services 數(shù)據(jù)挖掘) 1 查詢數(shù)據(jù)挖掘模型( Analysis Services – 數(shù)據(jù)挖掘) 9 Microsoft 決策樹算法 10 其他資源 查看數(shù)據(jù)挖掘模型 11 39 線性回歸模型的挖掘模型內(nèi)容( Analysis Services 數(shù)據(jù)挖掘) SQL Server 2020 R2 本主題講述使用 Microsoft 線性回歸算法的模型特有的挖掘模型內(nèi)容。 有關(guān)所有模型類型的挖掘模型內(nèi)容的一般說明,請參閱 挖掘 模型內(nèi)容( Analysis Services 數(shù)據(jù)挖掘) 1。 了解線性回歸模型的結(jié)構(gòu) 線性回歸模型的結(jié)構(gòu)非常簡單。 每個(gè)模型均具有表示該模型及其元數(shù)據(jù)的單
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1