【正文】
簡禎富、李培瑞、彭誠湧(民92),「半導(dǎo)體製程資料特徵萃取與資料挖礦之研究」,資訊管理學(xué)報,10(1),頁6384。陳家仁、陳彥良、陳禹辰(民92),「在少樣商品或短交易長度情況下挖掘關(guān)聯(lián)規(guī)則」,資訊管理學(xué)報,9(2),頁5572。在未來的研究上,將資料挖礦觀念導(dǎo)入半導(dǎo)體製造過程中,則對於半導(dǎo)體整體的Wafer Level Tracking上,即由前端的Wafer Start以至於EDA(Engineer Data Analysis)的資料分析,將是另一種追蹤問題的方式,但是必需先將半導(dǎo)體自動化系統(tǒng)資料庫進(jìn)行整合,以及建置更完整的領(lǐng)域經(jīng)驗(yàn)知識庫,方可進(jìn)行較為完善的資料挖礦。本研究驗(yàn)證上所採用的資料量及資料種類,與實(shí)際半導(dǎo)體系統(tǒng)的資料量比較相對較少,因此在執(zhí)行程式的速度與取得的資料方面會與實(shí)際值有落差。五、結(jié)論與建議本研究對於半導(dǎo)體製造過程的問題追蹤,藉由資料挖礦的方法與步驟,進(jìn)行大量資料的篩選、推演與模式建構(gòu)等過程,協(xié)助工程人員處理問題,盡可能減少在龐大的資料中挖掘的困難度,使其方便的挖掘出隱含的訊息,以及快速的找到與問題相關(guān)的關(guān)聯(lián)資訊。就程式運(yùn)作上,Apriori演算法是必須完整的執(zhí)行結(jié)束,因?yàn)槠渲饘铀褜さ姆绞奖仨氂傻谝粚娱_始,逐層比較其支持度再產(chǎn)生頻繁項(xiàng)目集合,若中途停止後其所產(chǎn)生的支持度將不具完整性,也無法真實(shí)呈現(xiàn)產(chǎn)出的結(jié)果。關(guān)聯(lián)規(guī)則之Apriori演算法是使用逐層搜尋的方法,每進(jìn)行一個層次的搜尋則必須掃描資料庫一次,直到條件完成,即找到符合條件的頻繁項(xiàng)目集合,然而當(dāng)程式的條件愈為複雜,則相對的其重覆搜尋資料庫次數(shù)亦提高;也就是說與最小支持度比較產(chǎn)生頻繁項(xiàng)目集合,再結(jié)合產(chǎn)生下一級候選項(xiàng)目集合,直到不再結(jié)合產(chǎn)生出新的候選項(xiàng)目集合為止。表3 候選1項(xiàng)目集合Itemset Down load Fail2 data error32 2 4 2 1表4 候選2項(xiàng)目集合Itemset Down load data error2 Down load 3 Down load data error2 Down load 3 Down load 1 Down load 1 Down load 1 data error 2 data error 2 data error 1 data error 2111 12 1表5 候選3項(xiàng)目集合Itemset Down load data error2 Down load 3 data error 2 data error 2 data error 22表6 候選4項(xiàng)目集合ItemsetConf. data error 2% data error 2% data error 2%2%表7 報廢現(xiàn)象分類對應(yīng)表原因因應(yīng)方式 data error 1. 確認(rèn)CIM資料維護(hù)歷史資料2. 確認(rèn)該設(shè)備異常紀(jì)錄狀況 data error 1. 確認(rèn)CIM資料維護(hù)歷史資料2. 進(jìn)一步確認(rèn) LQC 時的實(shí)際量測值 data error 1. 確認(rèn)CIM資料維護(hù)歷史資料2. 確認(rèn)該產(chǎn)品的製造過程歷史資料1. 確認(rèn) LQC 時的實(shí)際量測值2. 確認(rèn)該產(chǎn)品的製造過程歷史資料表8 可疑產(chǎn)品追蹤清單Lot IDProduct IDRoute IDCurrent Oper. IDPastTimeData_Lot_08Data_Prod_A1Data_Route_AData_Oper_60102004/2/14 15:00Data_Lot_08Data_Prod_B1Data_Route_BData_Oper_24052004/2/15 09:00Data_Lot_18Data_Prod_B1Data_Route_BData_Oper_25062004/2/16 02:01Data_Lot_20Data_Prod_B1Data_Route_BData_Oper_26072004/2/16 05:00Data_Lot_09Data_Prod_B1Data_Route_BData_Oper_26072004/2/17 11:00Data_Lot_10Data_Prod_B1Data_Route_BData_Oper_26082004/2/17 11:0042結(jié)果與討論在實(shí)際半導(dǎo)體製造過程中,工程師必須透過部門與部門之間的協(xié)調(diào),之後經(jīng)過資料庫管理部門的核可,才可透過資料庫管理人員依工程師的需要,進(jìn)行資料搜尋,在經(jīng)過一連串的資料取得步驟之後,工程師最後才能再進(jìn)行分析與討論,如此程序完成後問題可能已擱置數(shù)日了。(7). 當(dāng)頻繁項(xiàng)目集合出現(xiàn)之後進(jìn)行信賴度的計算,結(jié)果如表6所示。(6). 重覆搜尋資料庫,與最小支持度比較,若產(chǎn)生的頻繁項(xiàng)目集合(Lk)大於或等於使用者所定義的最小支持度,則頻繁項(xiàng)目集合即被找到。(5). 再搜尋資料庫,得出該現(xiàn)象的候選3項(xiàng)目集合的支持度,再找出頻繁3項(xiàng)目集合,並利用這些頻繁3項(xiàng)目集合的結(jié)合,產(chǎn)生4項(xiàng)目集合。(4). 再搜尋資料庫,得出該現(xiàn)象的候選2項(xiàng)目集合的支持度,再找出頻繁2項(xiàng)目集合,並利用這些頻繁2項(xiàng)目集合的結(jié)合,產(chǎn)生3項(xiàng)目集合。(3). 得出該現(xiàn)象的候選1項(xiàng)目集合的支持度,以及找出頻繁單項(xiàng)目集合,利用這些頻繁單項(xiàng)目集合的結(jié)合產(chǎn)生候選2項(xiàng)目集合。(2). %。3. 資料挖礦由產(chǎn)品報廢的特徵與現(xiàn)象可以歸類出Recipe Fail、Etch不淨(jìng)、Vt不合等三種可能報廢類型,如表2產(chǎn)品報廢分類對應(yīng)表。以產(chǎn)品發(fā)生報廢為例,當(dāng)報廢的產(chǎn)品在工程師初步判斷之後,彙整報廢的特徵為電性偏低,並列出有影響的站點(diǎn),以作為以下資料處理的線索來源。經(jīng)過一連串的資料挖礦技術(shù)應(yīng)用,將報廢產(chǎn)品及Lot QC問題追蹤建構(gòu)出追蹤規(guī)則,使同樣生產(chǎn)條件的產(chǎn)品可提前防範(fàn)相同狀況發(fā)生,以減少損失並適時的提出其決策建議。9. 最後整理頻繁項(xiàng)目集合,以產(chǎn)出所定義的目標(biāo)。7. 當(dāng)頻繁項(xiàng)目集合的信賴度與最小信賴度比較,若大於或等於使用者所定義的最小信賴度,則候選規(guī)則產(chǎn)生並進(jìn)行所有頻繁項(xiàng)目集合最小信賴度比較。5. 重覆搜尋資料庫,與最小支持度比較,若產(chǎn)生的頻繁項(xiàng)目集合(Lk)大於或等於使用者所定義的最小支持度,則頻繁項(xiàng)目集合即被找到。支持度的計算為:將輸入的屬性與目標(biāo)屬性以一對一或一對多的方式產(chǎn)生多種項(xiàng)目集合,並計算各項(xiàng)目集合中X與Y同時出現(xiàn)的資料筆數(shù)佔(zhàn)所有資料筆數(shù)的百分比。2. 依據(jù)該產(chǎn)品發(fā)生的現(xiàn)象及特徵進(jìn)行第一次的資料庫掃描並定義最小支持度及最小信賴度。當(dāng)OOS發(fā)生時,工程師可提供該產(chǎn)品的發(fā)生站點(diǎn)、時間、量測的機(jī)臺等訊息,依據(jù)所提供的訊息進(jìn)入CIM資料庫中確認(rèn)基本資料的設(shè)定值,若基本資料的設(shè)定問題已發(fā)生則調(diào)整設(shè)定?;举Y料的設(shè)定將確認(rèn)其參數(shù)值、規(guī)格值、量測機(jī)臺與生產(chǎn)機(jī)臺的對應(yīng)及產(chǎn)品與機(jī)臺的對應(yīng)關(guān)係等,而機(jī)臺端將確認(rèn)其是否已將資料完整蒐集。以下問題產(chǎn)品報廢及Lot QC問題追蹤為例,說明資料挖礦流程逐層分析。至於Lot QC方面,亦是以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)的領(lǐng)域資料推導(dǎo)出發(fā)生問題的可能因素,以提供快速的資料搜尋途徑。此階段將以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)工程師的領(lǐng)域知識配合建置一合宜的搜尋方式。Data lost的發(fā)生有兩種狀況,一為參數(shù)設(shè)定的不完整,可能是由資料維護(hù)時遺漏或工程師提供不完整;另一為機(jī)臺與系統(tǒng)的data傳送出現(xiàn)異常,可能是機(jī)臺端當(dāng)機(jī)或傳送機(jī)制停擺或系統(tǒng)端產(chǎn)生異常;至於OOS的產(chǎn)生即是製程條件的異常所致。2. Lot QC data lost及發(fā)生OOS問題時的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,將經(jīng)歷多次的量測以確保產(chǎn)品在製