【正文】
s, and will incorporate working knowledge of the semiconductor industry, to search for, and to develop the solution used to track existing problems within the fabrication process. The decision tree analysis method will also be used to categorize and differentiate possible problem sources. This study will also configure an initial prototype of a data mining application system to be used within the semiconductor fabrication process. The data mining application system produced from bining this prototype with the automation system currently used for semiconductor fabs will be set forth as a feasible example in this study, and prehensive data will be filtered, calculated, and modeling, based upon data mining methods and procedures. Research results of this study will be classified and organized, and a goal for future studies will be examined. Keywords:Data Mining、Decision Analysis、Semiconductor Manufacture Management、Association Rule一、前言我國半導體產(chǎn)業(yè)不論是產(chǎn)值、全球佔有率、或是自給能力近年來皆有顯著的表現(xiàn)。在半導體廠製造環(huán)境中,不乏包含200種以上的製程與設備種類,若以半導體製程的創(chuàng)新速度與產(chǎn)品多樣性生産特性、或是生産能力及其大批量生産方式發(fā)展而言,對於目前已存在的八吋廠或是十二吋廠來說,不論是製程設備或是自動化系統(tǒng)的規(guī)劃上,皆會影響晶圓廠的成本與生產(chǎn)效率。資料挖礦技術是一種統(tǒng)計工具的應用,其結合該產(chǎn)業(yè)領域的專業(yè)與資料庫知識,從資料庫或其他資料儲藏系統(tǒng)中,針對大量的資料進行篩選、推演與模式建構等程序,以挖掘隱含在資料與模式中的訊息進而轉(zhuǎn)換成為商機,或是提供決策者新的知識以利於決策的進行(簡禎富等,民90;簡禎富等,民92)。2. 建構製造過程中製程參數(shù)與機臺資料的關聯(lián)規(guī)則,以提供一可追蹤產(chǎn)品、製程或設備參數(shù)設定值的有用資訊,幫助製程或設備工程人員進行問題追蹤。目前在半導體產(chǎn)業(yè)的硬體建設上雖可滿足產(chǎn)業(yè)的大量需求,但是隨之而來的將是如何在快速生產(chǎn)與大量產(chǎn)能中,提升良率與及時發(fā)現(xiàn)異常等問題。關於晶圓廠自動化系統(tǒng)之資料倉儲,以前段製程FAB生產(chǎn)流程中的Lot Transportation、Lot History、Recipe、Data Collection等四種資料流來了解在自動化系統(tǒng)的製造環(huán)境中,系統(tǒng)是如何紀錄與取得各產(chǎn)品的生產(chǎn)資料以及所需要的資料是存放於何處。不論是即時的生產(chǎn)資料或是歷史資料將存放在系統(tǒng)所指定的資料庫中。在本研究中將以資料挖礦的技術建立一適合使用者查詢與分析資料的方法,以協(xié)助工程人員的問題追蹤與分析。綜合以上,資料庫知識發(fā)現(xiàn)和資料挖礦的目的皆相同,同樣是從資料庫的大量資料中發(fā)現(xiàn)有用的資訊以提供決策者參考,只是資料庫知識發(fā)現(xiàn)描述出資料準備階段之過程,也就是資料如何從資料庫轉(zhuǎn)換成資料挖礦工具可運用的程序皆完整的描述,然而要達到資料挖礦的目的,資料挖礦的定義已隱含有資料準備的概念,因此,可直接採用資料挖礦此一名詞。24關聯(lián)規(guī)則關聯(lián)規(guī)則是資料挖礦模式中最常被應用模式之一(Berry and Linoff, 1997。 陳家仁等,民92)。而D則是所有交易記錄T的集合。此三項指標的計算公式與物理意義分別闡述如下:1. 支持度:,即代表前提項目X與結果項目Y一起出現(xiàn)的機率。此指標之物理意義為當前提項目X發(fā)生時,可推得結論為結果項目Y的信賴度。就一般資料庫的探勘關聯(lián)規(guī)則上,其過程可為下列步驟(Han and Kamber, 2001):1. 找出所有頻繁項目集合(Frequent Itemset):依據(jù)定義,頻繁項目集合所出現(xiàn)的次數(shù)必須與使用者預先定義的最小支持度數(shù)目相同。Apriori演算法使用了候選項目集合(Candidate Itemset) 的觀念,若候選項目集合的支持度大於或等於最小支持度,則該候選項目集合為頻繁項目集合。關於關聯(lián)規(guī)則的研究,主要是研究發(fā)掘關聯(lián)規(guī)則的演算法,如何從含有大量資料的資料庫中,快速的找出有意義的關聯(lián)規(guī)則(Srikant and Agrawal, 1996。 Tung et al., 2003),在實務應用上,Srikant and Agrawal(1997)有提及關聯(lián)規(guī)則在商業(yè)、保險、醫(yī)學等之應用,其他主要的應用領域包括購物籃分析(Fayyad et al., 1996)、商品擺架安排(Srikant and Agrawal, 1997)、欺騙行為偵查(Berry and Linoff, 1997)、醫(yī)學研究(葉忠和吳恆睿,2002),在半導體的應用上,如透過半導體晶圓允收測試資料,建構製程事故診斷資料挖礦架構,以作為工程師及領域?qū)<医鉀Q問題的參考,進而提升其製程良率的改善(簡禎富等,民90; Han and Kamber, 2000)。本研究在資料分類及彙整部分,為了提供資料挖礦模式一正確、乾淨、完整的資料,必須確保來源資料的完整性,使得產(chǎn)生的資訊品質(zhì)達到有效性及正確性的要求,在資料挖礦部分採用關聯(lián)規(guī)則的Apriori演算法進行關聯(lián)資料的搜尋,以及決策樹歸納法進行可疑原因區(qū)別的建議。在於Lot QC方面將建置搜尋Data Lost及OOS的規(guī)則,說明如下︰1. 產(chǎn)品報廢現(xiàn)象原因分類及彙整半導體的製造程序是環(huán)環(huán)相扣的,如有任一程序發(fā)生異常通常會影響未來的製程甚至導致產(chǎn)品報廢。2. Lot QC data lost及發(fā)生OOS問題時的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,將經(jīng)歷多次的量測以確保產(chǎn)品在製圖2 半導體製造過程產(chǎn)品異常應用資料挖礦研究架構圖造過程中能確實符合製程上的規(guī)格,因此量測出的數(shù)值將影響該批Lot的品質(zhì)。此階段將以關聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)工程師的領域知識配合建置一合宜的搜尋方式。以下問題產(chǎn)品報廢及Lot QC問題追蹤為例,說明資料挖礦流程逐層分析。當OOS發(fā)生時,工程師可提供該產(chǎn)品的發(fā)生站點、時間、量測的機臺等訊息,依據(jù)所提供的訊息進入CIM資料庫中確認基本資料的設定值,若基本資料的設定問題已發(fā)生則調(diào)整設定。支持度的計算為:將輸入的屬性與目標屬性以一對一或一對多的方式產(chǎn)生多種項目集合,並計算各項目集合中X與Y同時出現(xiàn)的資料筆數(shù)佔所有資料筆數(shù)的百分比。7. 當頻繁項目集合的信賴度與最小信賴度比較,若大於或等於使用者所定義的最小信賴度,則候選規(guī)則產(chǎn)生並進行所有頻繁項目集合最小信賴度比較。經(jīng)過一連串的資料挖礦技術應用,將報廢產(chǎn)品及Lot QC問題追蹤建構出追蹤規(guī)則,使同樣生產(chǎn)條件的產(chǎn)品可提前防範相同狀況發(fā)生,以減少損失並適時的提出其決策建議。3. 資料挖礦由產(chǎn)品報廢的特徵與現(xiàn)象可以歸類出Recipe Fail、Etch不淨、Vt不合等三種可能報廢類型,如表2產(chǎn)品報廢分類對應表。(3). 得出該現(xiàn)象的候選1項目集合的支持度,以及找出頻繁單項目集合,利用這些頻繁單項目集合的結合產(chǎn)生候選2項目集合。(5). 再搜尋資料庫,得出該現(xiàn)象的候選3項目集合的支持度,再找出頻繁3項目集合,並利用這些頻繁3項目集合的結合,產(chǎn)生4項目集合。(