【正文】
ropriately processed, by which affected products may be managed through a report chart, and by which yield loss of products may be lessened.This study will focus on the Apriori algorithm used in data mining technologies, and will incorporate working knowledge of the semiconductor industry, to search for, and to develop the solution used to track existing problems within the fabrication process. The decision tree analysis method will also be used to categorize and differentiate possible problem sources. This study will also configure an initial prototype of a data mining application system to be used within the semiconductor fabrication process. The data mining application system produced from bining this prototype with the automation system currently used for semiconductor fabs will be set forth as a feasible example in this study, and prehensive data will be filtered, calculated, and modeling, based upon data mining methods and procedures. Research results of this study will be classified and organized, and a goal for future studies will be examined. Keywords:Data Mining、Decision Analysis、Semiconductor Manufacture Management、Association Rule一、前言我國半導體產(chǎn)業(yè)不論是產(chǎn)值、全球佔有率、或是自給能力近年來皆有顯著的表現(xiàn)。目前在半導體產(chǎn)業(yè)的硬體建設上雖可滿足產(chǎn)業(yè)的大量需求,但是隨之而來的將是如何在快速生產(chǎn)與大量產(chǎn)能中,提升良率與及時發(fā)現(xiàn)異常等問題。綜合以上,資料庫知識發(fā)現(xiàn)和資料挖礦的目的皆相同,同樣是從資料庫的大量資料中發(fā)現(xiàn)有用的資訊以提供決策者參考,只是資料庫知識發(fā)現(xiàn)描述出資料準備階段之過程,也就是資料如何從資料庫轉換成資料挖礦工具可運用的程序皆完整的描述,然而要達到資料挖礦的目的,資料挖礦的定義已隱含有資料準備的概念,因此,可直接採用資料挖礦此一名詞。此三項指標的計算公式與物理意義分別闡述如下:1. 支持度:,即代表前提項目X與結果項目Y一起出現(xiàn)的機率。關於關聯(lián)規(guī)則的研究,主要是研究發(fā)掘關聯(lián)規(guī)則的演算法,如何從含有大量資料的資料庫中,快速的找出有意義的關聯(lián)規(guī)則(Srikant and Agrawal, 1996。2. Lot QC data lost及發(fā)生OOS問題時的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,將經(jīng)歷多次的量測以確保產(chǎn)品在製圖2 半導體製造過程產(chǎn)品異常應用資料挖礦研究架構圖造過程中能確實符合製程上的規(guī)格,因此量測出的數(shù)值將影響該批Lot的品質。支持度的計算為:將輸入的屬性與目標屬性以一對一或一對多的方式產(chǎn)生多種項目集合,並計算各項目集合中X與Y同時出現(xiàn)的資料筆數(shù)佔所有資料筆數(shù)的百分比。(3). 得出該現(xiàn)象的候選1項目集合的支持度,以及找出頻繁單項目集合,利用這些頻繁單項目集合的結合產(chǎn)生候選2項目集合。五、結論與建議本研究對於半導體製造過程的問題追蹤,藉由資料挖礦的方法與步驟,進行大量資料的篩選、推演與模式建構等過程,協(xié)助工程人員處理問題,盡可能減少在龐大的資料中挖掘的困難度,使其方便的挖掘出隱含的訊息,以及快速的找到與問題相關的關聯(lián)資訊。本研究驗證上所採用的資料量及資料種類,與實際半導體系統(tǒng)的資料量比較相對較少,因此在執(zhí)行程式的速度與取得的資料方面會與實際值有落差。(4). 再搜尋資料庫,得出該現(xiàn)象的候選2項目集合的支持度,再找出頻繁2項目集合,並利用這些頻繁2項目集合的結合,產(chǎn)生3項目集合。5. 重覆搜尋資料庫,與最小支持度比較,若產(chǎn)生的頻繁項目集合(Lk)大於或等於使用者所定義的最小支持度,則頻繁項目集合即被找到。Data lost的發(fā)生有兩種狀況,一為參數(shù)設定的不完整,可能是由資料維護時遺漏或工程師提供不完整;另一為機臺與系統(tǒng)的data傳送出現(xiàn)異常,可能是機臺端當機或傳送機制停擺或系統(tǒng)端產(chǎn)生異常;至於OOS的產(chǎn)生即是製程條件的異常所致。 Berzal et al., 2001。2. 信賴度:,即代表在前提項目X發(fā)生的情況下,前提項目X與結果項目Y又同時發(fā)生的機率。資料挖礦中所使用的挖掘技術與類型,通常包含關聯(lián)規(guī)則、分類規(guī)則、叢集規(guī)則、預測分析、趨勢分析、偏差分析等類型。自1947年發(fā)明電晶體後,新的技術亦不斷的被發(fā)現(xiàn),其技術的創(chuàng)新與快速使得積體電路製造在短短的數(shù)十年間迅速發(fā)展至今日的奈米半導體製程。在半導體製造技術日趨進步與純熟之下,已進入八吋、十二吋晶圓的年代,這其中大量資金的投入是不可或缺的,特別是十二吋晶圓廠其所投入的金額約需30億美元。因此,為因應製造過程中產(chǎn)品的製程技術變化、以及在自動化系統(tǒng)的輔助大量生產(chǎn)之下,如何在製造過程中提供工程人員可確認正確的製程參數(shù)、以及發(fā)現(xiàn)產(chǎn)品異常時,可立即針對問題的特徵進行問題真因追蹤與分析,並將可能已受影響的產(chǎn)品列表管理,以減少產(chǎn)品的良率損失與如何針對取得的資訊進行合適的決策,將是生產(chǎn)人員所必須面對的挑戰(zhàn)。首先是Lot Transportation,系統(tǒng)中將會紀錄每一批產(chǎn)品在製造過程中即時的資料,如進出機臺的時間、使用的參數(shù)、製造時間等,並將這些經(jīng)過設計存放的資料依需要將其存放於固定的空間,以作為資料分析的依據(jù),這也就是所謂的Lot History;系統(tǒng)對與Lot Transportation與Lot History的存放方式是在製造過程中同時進行的。 Han and Fu, 1999。3. 增益:,比較信賴度與結果項目Y單獨發(fā)生時之機率兩者間的大小。資料挖礦技術應用於半導體領域的研究很多,本研究將著重於半導體自動化系統(tǒng)生產(chǎn)製造過程中,所蒐集的資料以配合資料挖礦技術的應用,提供工程師一快速的搜尋規(guī)則及方案建議。表1 產(chǎn)品報廢分類對應表範例現(xiàn)象分類破片污漬………報廢原因說明Box盒蓋鬆脫造成破片 CLEAN及旋乾異常ABNORENG 破片 治工具造成破片治工具造成破片晶舟 人為破片 CLEAN及旋乾異常ABNORNSCRAP 水痕 ………因應方式check run card是否異常造成Box盒蓋未正常蓋上Check Recipe 設定是否異?!?….….….….….….….………33資料挖礦本研究運用關聯(lián)規(guī)則的Apriori演算法取得產(chǎn)品報廢的現(xiàn)況與因素分析,計算其支持度與信賴度以確定分析出來的資訊是否為正確有效的,並以決策樹歸納法配合領域資料的分析,建議其合宜的解決方案。8. 計算所有候選規(guī)則的增益,若增益值大於1則選取,小於或等於1則放棄,最後將產(chǎn)生顯著的關聯(lián)規(guī)則。結果如表5所示。參考文獻Agrawal, R., Imielinski, T. and Swa