freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

建構(gòu)整合決策樹(shù)與關(guān)連規(guī)則之資料挖礦架構(gòu)及實(shí)證研究(編輯修改稿)

2025-01-19 16:11 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 riemen (1984) Quinlan (1986) Quinlin (1993) Hartigan (1975) 處理資料形態(tài) 離散、連續(xù) 離散、連續(xù) 離散、連續(xù) 離散 分裂樹(shù) 二元樹(shù) 不受限制 不受限制 不受限制 連續(xù)形資料 處理方式 分 2枝 不受限制 不受限制 無(wú)法處理 分枝準(zhǔn)則 Gini値 Information Gain Gain_Ratio 統(tǒng)計(jì)檢定 (卡方分配 ) 32 二 、文獻(xiàn)探討 _決策樹(shù)於事故診斷的相關(guān)研究 ? 表 應(yīng)用決策樹(shù)於事故排出之相關(guān)研究 研究者 實(shí)證對(duì)象 使用的演算法 BrahaShmilovici (2023) 半導(dǎo)體黃光區(qū) 鄭人傑 (2023) 晶圓過(guò)站記綠與 CP測(cè)試値 KruskalWallis、卡方交互影響檢測(cè)、變異降低分枝法則 劉中光 (2023) 印刷電路板 (PCB) 決策樹(shù)結(jié)合 SOM方法 Raghavan(2023) 良率、 IC ET Test parameter 利用決策樹(shù) (CART、 CHAID) Fan(2023) WAT、 InLine Manufacturing data 決策樹(shù) 蔡智政 (2023) 晶圓批量製程管制 (LPC)資料 以 CART決策樹(shù)分析 LPC 李培瑞 (2023) 半導(dǎo)體 WAT資料、 CP資料 結(jié)合人工類(lèi)神經(jīng)網(wǎng)路與決策樹(shù) 林鼎浩 (2023) 半導(dǎo)體 WAT與製造相關(guān)資料 無(wú)母數(shù) KruskalWallis統(tǒng)計(jì)檢定法 33 三、 研究架構(gòu) _問(wèn)題定義 ? 透過(guò)清楚的問(wèn)題定義,瞭解問(wèn)題類(lèi)型包含哪些類(lèi)別,才知道有哪些是屬於關(guān)鍵性的資料。 34 三、 研究架構(gòu) _資料選擇 ? 對(duì)領(lǐng)域知識(shí)及問(wèn)題有了基本的認(rèn)識(shí)之後,便是進(jìn)行資料選擇的工作,應(yīng)先對(duì)資料有進(jìn)一步的瞭解,而非將資料盲目的丟進(jìn)模式分析。 ? 資料取得的方式如下表: 檔案 (File) 好處是取得快速且閱讀容易,但是一旦建立好以後日後想再做資料處理就不太容易處理,如: Microsoft Excel。 關(guān)聯(lián)資料庫(kù) (Relational Databases) 在關(guān)聯(lián)式資料庫(kù)中,透過(guò)查詢工具語(yǔ)言 (SQL)可以蒐集到想要的資料。 資料倉(cāng)儲(chǔ) (Data Warehouse) 資料量通常達(dá)數(shù)百 Mega甚至上 Giga,資料讀取方式是以「切割」的觀念,並非巷資料庫(kù)連結(jié)表格的方式處理 35 三、 研究架構(gòu) _資料前置處理 ? 一般資料可分成質(zhì)與量?jī)深?lèi),質(zhì)的資料又分成空間性與時(shí)間性兩種,掘取欲分析的資料,並以去蕪存菁的方式轉(zhuǎn)化處理,才能確保分析資料的品質(zhì)和分析結(jié)果的正確性。 ? 資料前置處理的步驟需要不斷學(xué)習(xí)與經(jīng)濟(jì)累積。 ? 資料前置處理形式 ? 資料清理 ? 資料整合 ? 資料轉(zhuǎn)換 ? 資料化約。 36 三、 研究架構(gòu) _資料前置處理 ? 資料前置處理通常會(huì)採(cǎi)取的動(dòng)作如下 : ? : 對(duì)於資料的基本數(shù)理特性做醫(yī)界面性的檢視,分佈為常 態(tài)、非常態(tài)、偏右、偏左等,瞭解資料的長(zhǎng)相與分佈以 便做後續(xù)處理。 ? : 對(duì)於散佈在正常分佈外的資料點(diǎn)作出處理,譬如直接刪 除還是保留其資訊。 37 三、 研究架構(gòu) _資料前置處理 ? : 空白值與缺值所代表的意義並不相同,空白值為無(wú)法 填入的資料;缺值則為資料的遺漏或錯(cuò)誤。要?jiǎng)h除該 筆資料或者以特殊方式補(bǔ)值,對(duì)於挖礦結(jié)果的解釋會(huì) 有不同的影響,所以頇對(duì)資料有近一步的了解。 ? : ㄧ般而言高維度的資料計(jì)算複雜,所花費(fèi)的時(shí)間較 多,因此維度的降低亦是一種重要的課題。 38 三、 研究架構(gòu) _資料前置處理 ? : 資料處理時(shí),資料的格式轉(zhuǎn)換與其所代表的相對(duì)意義都頇 瞭解。資料格式化和轉(zhuǎn)換亦會(huì)挖掘出另ㄧ層意義的結(jié)果。 ㄧ般將資料數(shù)字分成四種不同的衡量尺度,名義尺度、順 序尺度、區(qū)間尺度、比例尺度衡量。 39 三、 研究架構(gòu) _資料前置處理 衡量的層次 內(nèi)容說(shuō)明 舉例 名目尺度 (Nominal Scale) 又稱(chēng)類(lèi)別尺度,使用數(shù)字或標(biāo)記區(qū)分物件或事件,此尺度並無(wú)大小之分。 機(jī)臺(tái)和貨批的編號(hào)等。 順序尺度 (Ordinal Scale) 又稱(chēng)等級(jí)尺度,就ㄧ事務(wù)之某特質(zhì)好壞次序加以排列,有方向次序的比較,但沒(méi)有距離或獨(dú)特的原點(diǎn)。 各種 Bin值的分類(lèi)、成績(jī) 區(qū)間尺度 (Interval Scale) 以此尺度表現(xiàn)之變數(shù),可區(qū)分類(lèi)別及排出大小順序之外,可算出差異之大小。區(qū)間尺度中,零點(diǎn)的位置並非固定的,而且衡量的單位也是任意的。 機(jī)臺(tái)的溫度、量測(cè)的參數(shù) 比例尺度 (Ratio Scale) 可說(shuō)出名稱(chēng)、排出順序、算出差距、亦可表示出比例的關(guān)係。比例尺度具有絕對(duì)零度的。 化學(xué)藥劑使用量、重量 40 三、 研究架構(gòu) _目標(biāo)與顯著變數(shù)的選取 ? 當(dāng)目標(biāo)變數(shù)與署醒確定後,接下來(lái)即確認(rèn)預(yù)測(cè)變數(shù)。為避免加入對(duì)目標(biāo)變數(shù)結(jié)果無(wú)顯著影響的資料,可利用統(tǒng)計(jì)方法檢定預(yù)測(cè)變數(shù)與目標(biāo)變數(shù)是否獨(dú)立。 41 三、 研究架構(gòu) _目標(biāo)與顯著變數(shù)的選取 ? 變數(shù)衡量尺度對(duì)應(yīng)之統(tǒng)計(jì)檢定方法: 獨(dú)立變數(shù) (Independent Variable) 相依變數(shù)(Dependent Variable) 變數(shù)尺度 名目尺度 順序尺度 區(qū)間尺度 名目尺度 ChiSquare ChiSquare ChiSquare 順序尺度 Spearman 積差相關(guān) 區(qū)間尺度 Ttest ANOVA Ttest、ANOVA、 KW(無(wú)母數(shù)方法 ) Pearson相關(guān) Regression 42 三、 研究架構(gòu) _目標(biāo)與顯著變數(shù)的選取 ? KW法適用資料分配不符合常態(tài),或是已確定其為非常態(tài)分佈的情況下,此種檢驗(yàn)對(duì)帄均值差異敏感,可將此方法想像成一個(gè)對(duì)處理帄均相等的檢驗(yàn)。 ? KW Test 其主要步驟如下: ? ,然後以 取代觀測(cè)值。 ? 處理 i知下秩的和。 ? 。 ? N為所有觀測(cè)值的數(shù)目 43 三、 研究架構(gòu) _ KW法 ? 是第 i個(gè)處理下的觀測(cè)值數(shù)目, N是所有觀測(cè)值的數(shù)目總和 ?????? ???? ? ?? ?KinjijNNRNSi121224)1(11i
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1