【正文】
s, and will incorporate working knowledge of the semiconductor industry, to search for, and to develop the solution used to track existing problems within the fabrication process. The decision tree analysis method will also be used to categorize and differentiate possible problem sources. This study will also configure an initial prototype of a data mining application system to be used within the semiconductor fabrication process. The data mining application system produced from bining this prototype with the automation system currently used for semiconductor fabs will be set forth as a feasible example in this study, and prehensive data will be filtered, calculated, and modeling, based upon data mining methods and procedures. Research results of this study will be classified and organized, and a goal for future studies will be examined. Keywords:Data Mining、Decision Analysis、Semiconductor Manufacture Management、Association Rule一、前言我國半導(dǎo)體產(chǎn)業(yè)不論是產(chǎn)值、全球佔有率、或是自給能力近年來皆有顯著的表現(xiàn)。在半導(dǎo)體廠製造環(huán)境中,不乏包含200種以上的製程與設(shè)備種類,若以半導(dǎo)體製程的創(chuàng)新速度與產(chǎn)品多樣性生産特性、或是生産能力及其大批量生産方式發(fā)展而言,對於目前已存在的八吋廠或是十二吋廠來說,不論是製程設(shè)備或是自動化系統(tǒng)的規(guī)劃上,皆會影響晶圓廠的成本與生產(chǎn)效率。資料挖礦技術(shù)是一種統(tǒng)計工具的應(yīng)用,其結(jié)合該產(chǎn)業(yè)領(lǐng)域的專業(yè)與資料庫知識,從資料庫或其他資料儲藏系統(tǒng)中,針對大量的資料進行篩選、推演與模式建構(gòu)等程序,以挖掘隱含在資料與模式中的訊息進而轉(zhuǎn)換成為商機,或是提供決策者新的知識以利於決策的進行(簡禎富等,民90;簡禎富等,民92)。2. 建構(gòu)製造過程中製程參數(shù)與機臺資料的關(guān)聯(lián)規(guī)則,以提供一可追蹤產(chǎn)品、製程或設(shè)備參數(shù)設(shè)定值的有用資訊,幫助製程或設(shè)備工程人員進行問題追蹤。目前在半導(dǎo)體產(chǎn)業(yè)的硬體建設(shè)上雖可滿足產(chǎn)業(yè)的大量需求,但是隨之而來的將是如何在快速生產(chǎn)與大量產(chǎn)能中,提升良率與及時發(fā)現(xiàn)異常等問題。關(guān)於晶圓廠自動化系統(tǒng)之資料倉儲,以前段製程FAB生產(chǎn)流程中的Lot Transportation、Lot History、Recipe、Data Collection等四種資料流來了解在自動化系統(tǒng)的製造環(huán)境中,系統(tǒng)是如何紀錄與取得各產(chǎn)品的生產(chǎn)資料以及所需要的資料是存放於何處。不論是即時的生產(chǎn)資料或是歷史資料將存放在系統(tǒng)所指定的資料庫中。在本研究中將以資料挖礦的技術(shù)建立一適合使用者查詢與分析資料的方法,以協(xié)助工程人員的問題追蹤與分析。綜合以上,資料庫知識發(fā)現(xiàn)和資料挖礦的目的皆相同,同樣是從資料庫的大量資料中發(fā)現(xiàn)有用的資訊以提供決策者參考,只是資料庫知識發(fā)現(xiàn)描述出資料準備階段之過程,也就是資料如何從資料庫轉(zhuǎn)換成資料挖礦工具可運用的程序皆完整的描述,然而要達到資料挖礦的目的,資料挖礦的定義已隱含有資料準備的概念,因此,可直接採用資料挖礦此一名詞。24關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是資料挖礦模式中最常被應(yīng)用模式之一(Berry and Linoff, 1997。 陳家仁等,民92)。而D則是所有交易記錄T的集合。此三項指標(biāo)的計算公式與物理意義分別闡述如下:1. 支持度:,即代表前提項目X與結(jié)果項目Y一起出現(xiàn)的機率。此指標(biāo)之物理意義為當(dāng)前提項目X發(fā)生時,可推得結(jié)論為結(jié)果項目Y的信賴度。就一般資料庫的探勘關(guān)聯(lián)規(guī)則上,其過程可為下列步驟(Han and Kamber, 2001):1. 找出所有頻繁項目集合(Frequent Itemset):依據(jù)定義,頻繁項目集合所出現(xiàn)的次數(shù)必須與使用者預(yù)先定義的最小支持度數(shù)目相同。Apriori演算法使用了候選項目集合(Candidate Itemset) 的觀念,若候選項目集合的支持度大於或等於最小支持度,則該候選項目集合為頻繁項目集合。關(guān)於關(guān)聯(lián)規(guī)則的研究,主要是研究發(fā)掘關(guān)聯(lián)規(guī)則的演算法,如何從含有大量資料的資料庫中,快速的找出有意義的關(guān)聯(lián)規(guī)則(Srikant and Agrawal, 1996。 Tung et al., 2003),在實務(wù)應(yīng)用上,Srikant and Agrawal(1997)有提及關(guān)聯(lián)規(guī)則在商業(yè)、保險、醫(yī)學(xué)等之應(yīng)用,其他主要的應(yīng)用領(lǐng)域包括購物籃分析(Fayyad et al., 1996)、商品擺架安排(Srikant and Agrawal, 1997)、欺騙行為偵查(Berry and Linoff, 1997)、醫(yī)學(xué)研究(葉忠和吳恆睿,2002),在半導(dǎo)體的應(yīng)用上,如透過半導(dǎo)體晶圓允收測試資料,建構(gòu)製程事故診斷資料挖礦架構(gòu),以作為工程師及領(lǐng)域?qū)<医鉀Q問題的參考,進而提升其製程良率的改善(簡禎富等,民90; Han and Kamber, 2000)。本研究在資料分類及彙整部分,為了提供資料挖礦模式一正確、乾淨(jìng)、完整的資料,必須確保來源資料的完整性,使得產(chǎn)生的資訊品質(zhì)達到有效性及正確性的要求,在資料挖礦部分採用關(guān)聯(lián)規(guī)則的Apriori演算法進行關(guān)聯(lián)資料的搜尋,以及決策樹歸納法進行可疑原因區(qū)別的建議。在於Lot QC方面將建置搜尋Data Lost及OOS的規(guī)則,說明如下︰1. 產(chǎn)品報廢現(xiàn)象原因分類及彙整半導(dǎo)體的製造程序是環(huán)環(huán)相扣的,如有任一程序發(fā)生異常通常會影響未來的製程甚至導(dǎo)致產(chǎn)品報廢。2. Lot QC data lost及發(fā)生OOS問題時的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,將經(jīng)歷多次的量測以確保產(chǎn)品在製圖2 半導(dǎo)體製造過程產(chǎn)品異常應(yīng)用資料挖礦研究架構(gòu)圖造過程中能確實符合製程上的規(guī)格,因此量測出的數(shù)值將影響該批Lot的品質(zhì)。此階段將以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)工程師的領(lǐng)域知識配合建置一合宜的搜尋方式。以下問題產(chǎn)品報廢及Lot QC問題追蹤為例,說明資料挖礦流程逐層分析。當(dāng)OOS發(fā)生時,工程師可提供該產(chǎn)品的發(fā)生站點、時間、量測的機臺等訊息,依據(jù)所提供的訊息進入CIM資料庫中確認基本資料的設(shè)定值,若基本資料的設(shè)定問題已發(fā)生則調(diào)整設(shè)定。支持度的計算為:將輸入的屬性與目標(biāo)屬性以一對一或一對多的方式產(chǎn)生多種項目集合,並計算各項目集合中X與Y同時出現(xiàn)的資料筆數(shù)佔所有資料筆數(shù)的百分比。7. 當(dāng)頻繁項目集合的信賴度與最小信賴度比較,若大於或等於使用者所定義的最小信賴度,則候選規(guī)則產(chǎn)生並進行所有頻繁項目集合最小信賴度比較。經(jīng)過一連串的資料挖礦技術(shù)應(yīng)用,將報廢產(chǎn)品及Lot QC問題追蹤建構(gòu)出追蹤規(guī)則,使同樣生產(chǎn)條件的產(chǎn)品可提前防範(fàn)相同狀況發(fā)生,以減少損失並適時的提出其決策建議。3. 資料挖礦由產(chǎn)品報廢的特徵與現(xiàn)象可以歸類出Recipe Fail、Etch不淨(jìng)、Vt不合等三種可能報廢類型,如表2產(chǎn)品報廢分類對應(yīng)表。(3). 得出該現(xiàn)象的候選1項目集合的支持度,以及找出頻繁單項目集合,利用這些頻繁單項目集合的結(jié)合產(chǎn)生候選2項目集合。(5). 再搜尋資料庫,得出該現(xiàn)象的候選3項目集合的支持度,再找出頻繁3項目集合,並利用這些頻繁3項目集合的結(jié)合,產(chǎn)生4項目集合。(