【文章內(nèi)容簡介】
Lift)等三個(gè)指標(biāo)來評估其效用和重要性。此三項(xiàng)指標(biāo)的計(jì)算公式與物理意義分別闡述如下:1. 支持度:,即代表前提項(xiàng)目X與結(jié)果項(xiàng)目Y一起出現(xiàn)的機(jī)率。也就是在規(guī)則中,前提項(xiàng)目X與結(jié)果項(xiàng)目Y一起出現(xiàn)的交易記錄筆數(shù)佔(zhàn)全部交易記錄筆數(shù)的百分比。2. 信賴度:,即代表在前提項(xiàng)目X發(fā)生的情況下,前提項(xiàng)目X與結(jié)果項(xiàng)目Y又同時(shí)發(fā)生的機(jī)率。此為關(guān)聯(lián)規(guī)則的預(yù)測強(qiáng)度。此指標(biāo)之物理意義為當(dāng)前提項(xiàng)目X發(fā)生時(shí),可推得結(jié)論為結(jié)果項(xiàng)目Y的信賴度。3. 增益:,比較信賴度與結(jié)果項(xiàng)目Y單獨(dú)發(fā)生時(shí)之機(jī)率兩者間的大小。其代表的物理意義為關(guān)聯(lián)規(guī)則的條件機(jī)率比母體中原本發(fā)生的機(jī)率大才具有意義。關(guān)聯(lián)規(guī)則的產(chǎn)生必需滿足決策者所訂定之最小支持度(Minimum support threshold)和最小信賴度(Minimum confidence threshold),當(dāng)滿足這兩個(gè)條件後,再判斷增益是否大於1,當(dāng)三個(gè)指標(biāo)皆成立,即推導(dǎo)出有意義的關(guān)聯(lián)規(guī)則。就一般資料庫的探勘關(guān)聯(lián)規(guī)則上,其過程可為下列步驟(Han and Kamber, 2001):1. 找出所有頻繁項(xiàng)目集合(Frequent Itemset):依據(jù)定義,頻繁項(xiàng)目集合所出現(xiàn)的次數(shù)必須與使用者預(yù)先定義的最小支持度數(shù)目相同。2. 由頻繁項(xiàng)目集合產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則:依據(jù)定義,其所產(chǎn)生的規(guī)則必須滿足最小支持度與最小信賴度,如此規(guī)則方可成立。過程中其關(guān)聯(lián)規(guī)則的總體效能是由步驟(1)所決定,因此有效的找出頻繁項(xiàng)目集合是關(guān)聯(lián)規(guī)則的重點(diǎn)。Apriori演算法是關(guān)聯(lián)規(guī)則中最為常用來找尋頻繁項(xiàng)目集合的演算法,Apriori演算法是使用逐層搜尋的方法(Agrawal and Srikant, 1994),依據(jù)上述的探勘關(guān)聯(lián)規(guī)則步驟,可逐步敘述Apriori演算法流程如下:1. 定義最小支持度及最小信賴度。Apriori演算法使用了候選項(xiàng)目集合(Candidate Itemset) 的觀念,若候選項(xiàng)目集合的支持度大於或等於最小支持度,則該候選項(xiàng)目集合為頻繁項(xiàng)目集合。2. 首先由資料庫讀入所有的交易,得出候選1項(xiàng)目集合 (Candidate 1Itemset)的支持度,在找出頻繁單項(xiàng)目集合(Frequent 1Itemset),並利用這些頻繁單項(xiàng)目集合的結(jié)合,產(chǎn)生候選2項(xiàng)目集合 (Candidate 2Itemset) 。3. 在搜尋資料庫,得出候選2項(xiàng)目集合的支持度以後,在找出頻繁2項(xiàng)目集合,並利用這些頻繁2項(xiàng)目集合的結(jié)合,產(chǎn)生3項(xiàng)目集合。4. 重覆搜尋資料庫,與最小支持度比較,產(chǎn)生頻繁項(xiàng)目集合,再結(jié)合產(chǎn)生下一級候選項(xiàng)目集合,直到不再結(jié)合產(chǎn)生出新的候選項(xiàng)目集合為止。關(guān)於關(guān)聯(lián)規(guī)則的研究,主要是研究發(fā)掘關(guān)聯(lián)規(guī)則的演算法,如何從含有大量資料的資料庫中,快速的找出有意義的關(guān)聯(lián)規(guī)則(Srikant and Agrawal, 1996。 Han and Fu, 1999。 Berzal et al., 2001。 Changchien and Lu, 2001。 Tung et al., 2003),在實(shí)務(wù)應(yīng)用上,Srikant and Agrawal(1997)有提及關(guān)聯(lián)規(guī)則在商業(yè)、保險(xiǎn)、醫(yī)學(xué)等之應(yīng)用,其他主要的應(yīng)用領(lǐng)域包括購物籃分析(Fayyad et al., 1996)、商品擺架安排(Srikant and Agrawal, 1997)、欺騙行為偵查(Berry and Linoff, 1997)、醫(yī)學(xué)研究(葉忠和吳恆睿,2002),在半導(dǎo)體的應(yīng)用上,如透過半導(dǎo)體晶圓允收測試資料,建構(gòu)製程事故診斷資料挖礦架構(gòu),以作為工程師及領(lǐng)域?qū)<医鉀Q問題的參考,進(jìn)而提升其製程良率的改善(簡禎富等,民90; Han and Kamber, 2000)。資料挖礦技術(shù)應(yīng)用於半導(dǎo)體領(lǐng)域的研究很多,本研究將著重於半導(dǎo)體自動化系統(tǒng)生產(chǎn)製造過程中,所蒐集的資料以配合資料挖礦技術(shù)的應(yīng)用,提供工程師一快速的搜尋規(guī)則及方案建議。三、研究方法本節(jié)將探討半導(dǎo)體製造過程中,對於產(chǎn)品量測(Lot QC)資料異常及報(bào)廢的產(chǎn)品如何應(yīng)用資料挖礦技術(shù)尋求合適的資訊以提供解決方案的選擇。本研究之研究架構(gòu)係依據(jù)資料挖礦模式及資料挖礦流程建構(gòu),包含問題定義、資料處理、資料挖礦應(yīng)用、以及評估等步驟,研究架構(gòu)如圖2所示。本研究在資料分類及彙整部分,為了提供資料挖礦模式一正確、乾淨(jìng)、完整的資料,必須確保來源資料的完整性,使得產(chǎn)生的資訊品質(zhì)達(dá)到有效性及正確性的要求,在資料挖礦部分採用關(guān)聯(lián)規(guī)則的Apriori演算法進(jìn)行關(guān)聯(lián)資料的搜尋,以及決策樹歸納法進(jìn)行可疑原因區(qū)別的建議。31問題定義本研究將探討在半導(dǎo)體製造過程中,發(fā)生產(chǎn)品報(bào)廢問題與Lot QC時(shí)產(chǎn)生Data Lost或產(chǎn)生OOS (Out Of Spec.)時(shí),如何從資料庫中快速的追蹤所產(chǎn)生的問題,藉由資料挖礦技術(shù)的應(yīng)用將可能造成的因素從資料庫中篩選出,以提供工程師能掌握有利的資料進(jìn)行分析。32資料處理為了使資料挖礦的資訊能符合實(shí)際需要及其正確性與完整性,對於挖掘前的資料處理是重要的關(guān)鍵。因此,本研究將對於產(chǎn)品報(bào)廢的現(xiàn)象原因與歷史資料進(jìn)行分類及彙整,以作為領(lǐng)域資料的一部分。在於Lot QC方面將建置搜尋Data Lost及OOS的規(guī)則,說明如下︰1. 產(chǎn)品報(bào)廢現(xiàn)象原因分類及彙整半導(dǎo)體的製造程序是環(huán)環(huán)相扣的,如有任一程序發(fā)生異常通常會影響未來的製程甚至導(dǎo)致產(chǎn)品報(bào)廢。當(dāng)報(bào)廢發(fā)生時(shí)若能在較短時(shí)間內(nèi)找出原因,對於有同樣製程的產(chǎn)品即可立即追蹤並掌握問題,可減少產(chǎn)品的報(bào)廢數(shù)量。製造過程中產(chǎn)生報(bào)廢的原因錯(cuò)綜複雜,就以現(xiàn)行工程師的經(jīng)驗(yàn)中,再彙整出現(xiàn)象原因及解決方案於領(lǐng)域資料庫中如表1所示,運(yùn)用此彙整的表格提供工程師一對應(yīng)的訊息,以縮短找尋資料及因個(gè)人經(jīng)驗(yàn)判別的時(shí)間,並且將其他同生產(chǎn)條件的產(chǎn)品列出可能發(fā)生此現(xiàn)象報(bào)廢的產(chǎn)品,以盡早提出因應(yīng)措施。依據(jù)表1的現(xiàn)象為區(qū)分的類別,各類別原因的分類及各原因的處理方式對應(yīng)如圖3所示,依各類別原因及對策的對應(yīng)關(guān)聯(lián),若有新的現(xiàn)象發(fā)生將可再陸續(xù)加入領(lǐng)域資料庫中。2. Lot QC data lost及發(fā)生OOS問題時(shí)的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,將經(jīng)歷多次的量測以確保產(chǎn)品在製圖2 半導(dǎo)體製造過程產(chǎn)品異常應(yīng)用資料挖礦研究架構(gòu)圖造過程中能確實(shí)符合製程上的規(guī)格,因此量測出的數(shù)值將影響該批Lot的品質(zhì)。以目前具有自動化系統(tǒng)的半導(dǎo)體廠而言,量測的方法或資料的蒐集與運(yùn)算已是非常正確與快速,但是在這之前的量測參數(shù)是否正確的被設(shè)定於自動化系統(tǒng)中,以及資料是否完整的被系統(tǒng)所蒐集,將有賴於系統(tǒng)的設(shè)計(jì)及參數(shù)的設(shè)定。Data lost的發(fā)生有兩種狀況,一為參數(shù)設(shè)定的不完整,可能是由資料維護(hù)時(shí)遺漏或工程師提供不完整;另一為機(jī)臺與系統(tǒng)的data傳送出現(xiàn)異常,可能是機(jī)臺端當(dāng)機(jī)或傳送機(jī)制停擺或系統(tǒng)端產(chǎn)生異常;至於OOS的產(chǎn)生即是製程條件的異常所致。因此,在以上所提的這些問題將可由自動化系統(tǒng)人員與製程工程師共同建立解決方案,至於如何在Lot QC data lost及OOS仍然發(fā)生時(shí)快速找到問題,本研究將運(yùn)用資料挖礦技術(shù)提供一快速的搜尋方法,以縮短工程師進(jìn)入資料庫摸索的時(shí)間,並減少不符合量測規(guī)格的產(chǎn)品繼續(xù)產(chǎn)出。此階段將以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)工程師的領(lǐng)域知識配合建置一合宜的搜尋方式。表1 產(chǎn)品報(bào)廢分類對應(yīng)表範(fàn)例現(xiàn)象分類破片污漬………報(bào)廢原因說明Box盒蓋鬆脫造成破片 CLEAN及旋乾異常ABNORENG 破片 治工具造成破片治工具造成破片晶舟 人為破片 CLEAN及旋乾異常ABNORNSCRAP 水痕 ………因應(yīng)方式check run card是否異常造成Box盒蓋未正常蓋上Check Recipe 設(shè)定是否異?!?….….….….….….….………33資料挖礦本研究運(yùn)用關(guān)聯(lián)規(guī)則的Apriori演算法取得產(chǎn)品報(bào)廢的現(xiàn)況與因素分析,計(jì)算其支持度與信賴度以確定分析出來的資訊是否為正確有效的,並以決策樹歸納法配合領(lǐng)域資料的分析,建議其合宜的解決方案。至於Lot QC方面,亦是以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)的領(lǐng)域資料推導(dǎo)出發(fā)生問題的可能因素,以提供快速的資料搜尋途徑