freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

建構(gòu)整合決策樹與關(guān)連規(guī)則之資料挖礦架構(gòu)及實(shí)證研究(已改無(wú)錯(cuò)字)

2023-01-20 16:11:56 本頁(yè)面
  

【正文】 n44 三、 研究架構(gòu) _ KW法 ? (a)當(dāng) k=3, 時(shí),可查詢 KT test檢定附 ? 表,決定機(jī)率值 Pvalue, 如果 Pvalue 則拒絕虛無(wú) 假設(shè) , 表示 k可能不ㄧ致 。 (b) 當(dāng) ,則表示這 K個(gè)處理中某些處理會(huì)產(chǎn)生 較其他處理為大的觀測(cè)值,可有效檢定在資料 非常態(tài)分佈時(shí)不同處理是有造成差異的原因。 5 , , 21 nn3n le vel?5?in45 三、 研究架構(gòu) _資料挖礦與決策樹 ? 資料挖礦 ? 對(duì)於不同的資料賀企業(yè)問(wèn)題,不同的模式和演算法將可能產(chǎn)出最好的結(jié)果。 ? 決策樹 ? 決策樹會(huì)根據(jù)目標(biāo)變數(shù),將資料進(jìn)行適當(dāng)?shù)姆诸?,並以樹枝狀架構(gòu)呈現(xiàn)其分類結(jié)果。由分類結(jié)果亦可萃取出其分類的特徵規(guī)則。 46 三、 研究架構(gòu) _關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則主要是從龐大資料中,探索資料間欄位的相關(guān)性,這些規(guī)則展示了屬性值。在大量資料中找出有趣的規(guī)則,以便幫助使用者制定決策的依據(jù)。 ? 關(guān)聯(lián)規(guī)則步驟 ? ? ? ? ? ? Y為目標(biāo)變數(shù)之規(guī)則 47 三、 研究架構(gòu) _整合決策樹與關(guān)聯(lián)規(guī)則 工具 決策樹 關(guān)聯(lián)規(guī)則 優(yōu)點(diǎn) ※ 明白指出最佳變數(shù)的能力 ※ 產(chǎn)生易於了解的規(guī)則 ※ 節(jié)省分類時(shí)的計(jì)算時(shí)間 ※ 可處理連續(xù)與類別變數(shù) ※ 能完整的呈現(xiàn)各變數(shù)之影 響,與變數(shù)組合 ※ 能產(chǎn)生簡(jiǎn)單明瞭的結(jié)論 ※ 適用不同形式的原始資料 ※ 計(jì)算模式簡(jiǎn)單易懂 缺點(diǎn) ※ 當(dāng)類別太多時(shí),資料量小, 錯(cuò)誤會(huì)增加的比較快。無(wú)法 全面的看到各種變數(shù)的影響 程度 ※ 對(duì)有時(shí)間順序的資料,需要 很多欲處理的工作 ※ 結(jié)果多且凌亂,難已決定哪 一變數(shù)較重要與適當(dāng)?shù)慕M合 ※ 當(dāng)問(wèn)題變大時(shí),運(yùn)算量會(huì)成 幾何級(jí)數(shù)增加 ※ 對(duì)於資料的個(gè)別資訊不甚重 視 ※ 容易剷除罕見變數(shù) 48 三、 研究架構(gòu) _解釋與評(píng)估 ? 挖礦的結(jié)果對(duì)於工程師而言是否有提供幫助,整個(gè)挖掘的過(guò)程是否有效率,皆是透過(guò)結(jié)果解釋與討論重複循環(huán),才可使得研究模式與結(jié)果更加完備。 ? 若挖掘出的樣形式有價(jià)值的,之後便可將相同屬性、類別的規(guī)則儲(chǔ)存至規(guī)則庫(kù),以建立自動(dòng)化的製程監(jiān)控的事故偵測(cè)與分類機(jī)制或是事故排除的決策支援系統(tǒng)。 49 四 、實(shí)證研究 ? 本章針對(duì)於兩種不同類型之產(chǎn)業(yè)資料,以前述所提之研究方法進(jìn)行事故定位與事故診斷,以驗(yàn)證整合決策樹與關(guān)聯(lián)規(guī)則資料挖礦架構(gòu)之效度。 50 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 問(wèn)題定義 ? 配電事故為影響電力系統(tǒng)安全性、可靠性以及供電品質(zhì)的重要因素。但這樣一連串的試驗(yàn)將對(duì)於線路造成損害,且也無(wú)法在短時(shí)間內(nèi)使供電恢復(fù),因此為提高供電品質(zhì),如何發(fā)展一個(gè)可以快速找到事故發(fā)生地點(diǎn)的方法,即成為電力公司所關(guān)心的議題。 51 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料選擇 ? 本研究所採(cǎi)用之資料為臺(tái)電公司於 1995~1997 年間,針對(duì)臺(tái)北市區(qū)每次配電事故所記錄之配電事故紀(jì)錄表,共有 1649 筆資料,每筆配電事故資料皆記錄 23 項(xiàng)變數(shù)資料(如 表 )。 ? 首先針對(duì)「損壞部位」資料屬性進(jìn)行統(tǒng)計(jì)與圖表分析,以初步檢視資料之分佈樣型,其分佈如 圖 所示。 52 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料前置處理 ? 本案例為推導(dǎo)事故之損壞設(shè)備與特殊的事故資料樣型,以快速的找到事故發(fā)生地點(diǎn)為目標(biāo),因此「損壞部位」屬性為本研究模式之目標(biāo)項(xiàng)。 ? 最後本實(shí)證研究的輸入與目標(biāo)屬性如 表 所示。 53 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 目標(biāo)與顯著變數(shù)的選取 ? 為推導(dǎo)事故之損壞設(shè)備與特殊的事故資料樣型,以快速的找到事故發(fā)生地點(diǎn)為目標(biāo),因此「損壞部位」為模式之目標(biāo)變數(shù),共 60 項(xiàng)變數(shù)值。由於輸入變數(shù)已刪除在找出事故地點(diǎn)之前並無(wú)法獲得資料,剩 8 個(gè)輸入變數(shù),經(jīng)由與工程師討論後,並不需刪減多餘變數(shù),因此,直接將表 中的變數(shù)丟入模式中。 54 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料挖礦 以關(guān)聯(lián)規(guī)則推導(dǎo)顯著事故定位規(guī)則 ? 經(jīng)由資料的前置處理( 圖 )後,將資料格式轉(zhuǎn)換為能以挖礦模式建構(gòu)分析的資料格式,設(shè)定參數(shù)後,推導(dǎo)顯著關(guān)聯(lián)規(guī)則。 ? 研究設(shè)定最小支持度為 %,最小信賴度為 50%,而增益則需大於 1,參數(shù)設(shè)定依據(jù)如下。 ? 支持度 ? 信賴度 ? 增益 55 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料挖礦 以關(guān)聯(lián)規(guī)則推導(dǎo)顯著事故定位規(guī)則 ? 評(píng)估規(guī)則好壞的參數(shù) ─錯(cuò)分率( FP),希望所推導(dǎo)之規(guī)則,皆在所能容忍之決策風(fēng)險(xiǎn)下,因在此加入 ROC Curve 的觀念,隨著不同的臨界值條件下,TP比率與 FP比率變化所構(gòu)成的特徵曲線,如 圖 所示。 ? 關(guān)聯(lián)規(guī)則若有較大的 TP與較小的 FP,則此規(guī)則是較佳的。 ? 在此驗(yàn)證中,錯(cuò)分率小於 。 56 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料挖礦 以關(guān)聯(lián)規(guī)則推導(dǎo)顯著事故定位規(guī)則 ? 由 表 可知,關(guān)聯(lián)規(guī)則結(jié)果僅與「高壓電纜」、「用戶設(shè)備」、「高壓電纜直線接頭」以及「熔絲鏈開關(guān)」四種損壞設(shè)備有關(guān)。 ? 在損壞設(shè)備為「高壓電纜直線接頭」與「熔絲鏈開關(guān)」所找出之規(guī)則,雖其信賴度只介於 50%~70%,但其規(guī)則之錯(cuò)分率相當(dāng)?shù)?,仍可容忍決策風(fēng)險(xiǎn)之內(nèi)( ),因此,所找出之顯著規(guī)則是好的,可藉由此規(guī)則推斷出損壞部位。 57 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料挖礦 以決策樹挖掘顯著分類規(guī)則 ? 利用 780 筆資料進(jìn)行資料篩選,首先選出具有 13 筆資料以上之損壞部位,挑選過(guò)後僅剩下 650 筆資料以及 12 種損壞部位。以初步的簡(jiǎn)化模式,形成決策樹的輸入資料。其資料處理過(guò)程如 圖 。 ? 針對(duì)此 699 筆資料進(jìn)行資料分佈之繪製,可得 圖 之次數(shù)分佈圖。 58 四 、實(shí)證研究 1_臺(tái)灣電力配電事故定位 ? 資料挖礦 以決策樹挖掘顯著分類規(guī)則 ? 本研究決策樹所使用軟體為 Scenario,其演算法的結(jié)果類似 CHAID,若針對(duì)連續(xù)型的目標(biāo)變數(shù)是以 FTest作為分枝方法,若針對(duì)間斷型的變數(shù),其以ChiSquare Test 作為分枝準(zhǔn)則。在長(zhǎng)樹的過(guò)程設(shè)定上,枝葉中顯著目標(biāo)變數(shù)值資料最少需有 13 筆資料,且下一層的
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1