freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

建構(gòu)整合決策樹與關(guān)連規(guī)則之資料挖礦架構(gòu)及實證研究-文庫吧在線文庫

2025-01-23 16:11上一頁面

下一頁面
  

【正文】 18 二 、文獻(xiàn)探討 _關(guān)聯(lián)規(guī)則定義與說明 ? 關(guān)聯(lián)規(guī)則的成立 ? 必頇滿足決策者所訂定之最小支持度 ( Minmum Support Threshold),和最小信賴度 (Minmum Confidence Threshold)。 ? 使用 14種特性作介紹。 2 一 、緒論 _研究背景及重要性 決策 結(jié)果解釋 (視覺化技術(shù) ) 資料挖礦 (資訊探索 ) 資料探索 (OLAP、統(tǒng)計分析、查詢報表 ) 資料倉儲 、 資料超市 資料來源 (資料庫系統(tǒng) 、 OLTP、 檔案 ) 資訊量 價值性 決策者 企業(yè)主管 資料 分析者 資料庫 管理者 圖 企業(yè)中的資料階層 3 一 、緒論 _研究目的 ? 目的: 事故排除 ? 方法: 建構(gòu)整合決策樹與關(guān)連規(guī)則之資料挖礦架構(gòu)及實證研究 。 ? 由下而上 :不需要特別標(biāo)註在某一變數(shù)或某一種値,而是試著尋找所有變數(shù)中是否有隱藏某種關(guān)係。 16 二 、文獻(xiàn)探討 _關(guān)聯(lián)規(guī)則定義與說明 ? 進(jìn)行關(guān)聯(lián)規(guī)則挖礦時,作業(yè)流程的兩大步驟 ? 找出所有的高頻項目組 (Frequent Itemsets) ? 高頻項目組所出現(xiàn)的次數(shù)必頇大於等於事先定義的最小支持度數(shù)目。 19 二 、文獻(xiàn)探討 _關(guān)聯(lián)規(guī)則定義與說明 ? 若規(guī)則表示為 X=Y,則 ? ( Support) ? 在規(guī)則 (Rule)中,項目 (Items)一起出現(xiàn)的交易暨路佔全部交易紀(jì)錄的百分比。 ? )( )( )()()( )()( 式Y(jié)P XYPYPXP YXPYXLift ????22 二 、文獻(xiàn)探討 _關(guān)聯(lián)規(guī)則類型 ? 關(guān)聯(lián)規(guī)則類型 ? ? 若挖礦規(guī)則焦點放在項目 (Item)是否出現(xiàn),則稱為布林値的關(guān)聯(lián)規(guī)則 (Boolean Association Rule) 。 一開始會花時間建立hash table BSM Wur等人 (1999) 使用表格運算方式產(chǎn)生高頻項目組,改善 Apriori多次掃描資料庫的缺點。 ? (Stopping) ? 當(dāng)無法找出任何分隔預(yù)測變數(shù)可以顯著降低下一節(jié)點的分散度,表示樹以生長完整 (Complete) 。 關(guān)聯(lián)資料庫 (Relational Databases) 在關(guān)聯(lián)式資料庫中,透過查詢工具語言 (SQL)可以蒐集到想要的資料。 ? : ㄧ般而言高維度的資料計算複雜,所花費的時間較 多,因此維度的降低亦是一種重要的課題。區(qū)間尺度中,零點的位置並非固定的,而且衡量的單位也是任意的。 ? 。 ? 關(guān)聯(lián)規(guī)則步驟 ? ? ? ? ? ? Y為目標(biāo)變數(shù)之規(guī)則 47 三、 研究架構(gòu) _整合決策樹與關(guān)聯(lián)規(guī)則 工具 決策樹 關(guān)聯(lián)規(guī)則 優(yōu)點 ※ 明白指出最佳變數(shù)的能力 ※ 產(chǎn)生易於了解的規(guī)則 ※ 節(jié)省分類時的計算時間 ※ 可處理連續(xù)與類別變數(shù) ※ 能完整的呈現(xiàn)各變數(shù)之影 響,與變數(shù)組合 ※ 能產(chǎn)生簡單明瞭的結(jié)論 ※ 適用不同形式的原始資料 ※ 計算模式簡單易懂 缺點 ※ 當(dāng)類別太多時,資料量小, 錯誤會增加的比較快。 52 四 、實證研究 1_臺灣電力配電事故定位 ? 資料前置處理 ? 本案例為推導(dǎo)事故之損壞設(shè)備與特殊的事故資料樣型,以快速的找到事故發(fā)生地點為目標(biāo),因此「損壞部位」屬性為本研究模式之目標(biāo)項。 ? 在此驗證中,錯分率小於 。在長樹的過程設(shè)定上,枝葉中顯著目標(biāo)變數(shù)值資料最少需有 13 筆資料,且下一層的子集合純度一定要比上一層的母集合( Parentsubset)較高,且下一層子集合正確率(純度)需大於 50%,以使得枝葉具有絕對之顯著程度,以及最多有三層枝葉等。且加上產(chǎn)品特性差異,因而製造程式等種種環(huán)境參數(shù)亦會有所不同。在此所設(shè)定的顯著水準(zhǔn)為 。 ? 半導(dǎo)體的資料挖礦過程中,很少只利用單一模式就可以解決。本研究建構(gòu)完整的分析步驟,其中包括利用 KruskalWallis 檢定找出顯著屬性,縮小範(fàn)圍,再以決策樹的分類規(guī)則和關(guān)聯(lián)規(guī)則高頻率的關(guān)聯(lián)規(guī)則描述造成低良率的特徵,透過綜合資訊的比較縮小診斷範(fàn)圍,提供給工程師作為製程監(jiān)控的依據(jù),以快速排除事故提昇良率與未來事故診斷的參考。 決策樹 可顯示較影響目標(biāo)之關(guān)鍵預(yù)測變數(shù),提供工程師在決策時所需參考。 67 四 、實證研究 2_以某半導(dǎo)體廠工程資料為實證對象 ? 資料挖礦 關(guān)聯(lián)規(guī)則挖掘問題機(jī)臺組合 ? 關(guān)聯(lián)規(guī)則主要是從資料庫龐大資料中,找出發(fā)生頻率較高的組合,希望藉由此特性找出造成低良率之問題機(jī)臺,幫助工程師趁早作出修機(jī)或是製程上之改善。因此工程師便可以透過工程資料分析系統(tǒng)瞭解產(chǎn)品的生產(chǎn)測試狀況,以進(jìn)行製程的改善與事故診斷。 60 四 、實證研究 1_臺灣電力配電事故定位 ? 解釋與評估 ? 本案例之研究目的,在特定決策環(huán)境下推測配電事故的樣型,減少事故定位所需的時間,因此,在顯著關(guān)聯(lián)規(guī)則的篩選,加入 ROC 曲線中的錯分率概念,以期望每筆決策規(guī)則,都在工程師可容忍的風(fēng)險下。以初步的簡化模式,形成決策樹的輸入資料。 54 四 、實證研究 1_臺灣電力配電事故定位 ? 資料挖礦 以關(guān)聯(lián)規(guī)則推導(dǎo)顯著事故定位規(guī)則 ? 經(jīng)由資料的前置處理( 圖 )後,將資料格式轉(zhuǎn)換為能以挖礦模式建構(gòu)分析的資料格式,設(shè)定參數(shù)後,推導(dǎo)顯著關(guān)聯(lián)規(guī)則。 50 四 、實證研究 1_臺灣電力配電事故定位 ? 問題定義 ? 配電事故為影響電力系統(tǒng)安全性、可靠性以及供電品質(zhì)的重要因素。 ? 決策樹 ? 決策樹會根據(jù)目標(biāo)變數(shù),將資料進(jìn)行適當(dāng)?shù)姆诸?,並以樹枝狀架構(gòu)呈現(xiàn)其分類結(jié)果。為避免加入對目標(biāo)變數(shù)結(jié)果無顯著影響的資料,可利用統(tǒng)計方法檢定預(yù)測變數(shù)與目標(biāo)變數(shù)是否獨立。 39 三、 研究架構(gòu) _資料前置處理 衡量的層次 內(nèi)容說明 舉例 名目尺度 (Nominal Scale) 又稱類別尺度,使用數(shù)字或標(biāo)記區(qū)分物件或事件,此尺度並無大小之分。 36 三、 研究架構(gòu) _資料前置處理 ? 資料前置處理通常會採取的動作如下 : ? : 對於資料的基本數(shù)理特性做醫(yī)界面性的檢視,分佈為常 態(tài)、非常態(tài)、偏右、偏左等,瞭解資料的長相與分佈以 便做後續(xù)處理。 ? 以測試資料 (Testing Data)驗證、抽樣方法來減少決策樹過度學(xué)習(xí)現(xiàn)象的發(fā)生。 ? ? 利用關(guān)聯(lián)規(guī)則做藥品櫥位管理,或以過去看診暨路檢式藥品使用量與方法是否正確,並可分析個病例特
點擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1