【正文】
圖2 半導(dǎo)體製造過程產(chǎn)品異常應(yīng)用資料挖礦研究架構(gòu)圖造過程中能確實(shí)符合製程上的規(guī)格,因此量測(cè)出的數(shù)值將影響該批Lot的品質(zhì)。製造過程中產(chǎn)生報(bào)廢的原因錯(cuò)綜複雜,就以現(xiàn)行工程師的經(jīng)驗(yàn)中,再?gòu)≌霈F(xiàn)象原因及解決方案於領(lǐng)域資料庫(kù)中如表1所示,運(yùn)用此彙整的表格提供工程師一對(duì)應(yīng)的訊息,以縮短找尋資料及因個(gè)人經(jīng)驗(yàn)判別的時(shí)間,並且將其他同生產(chǎn)條件的產(chǎn)品列出可能發(fā)生此現(xiàn)象報(bào)廢的產(chǎn)品,以盡早提出因應(yīng)措施。在於Lot QC方面將建置搜尋Data Lost及OOS的規(guī)則,說明如下︰1. 產(chǎn)品報(bào)廢現(xiàn)象原因分類及彙整半導(dǎo)體的製造程序是環(huán)環(huán)相扣的,如有任一程序發(fā)生異常通常會(huì)影響未來(lái)的製程甚至導(dǎo)致產(chǎn)品報(bào)廢。32資料處理為了使資料挖礦的資訊能符合實(shí)際需要及其正確性與完整性,對(duì)於挖掘前的資料處理是重要的關(guān)鍵。本研究在資料分類及彙整部分,為了提供資料挖礦模式一正確、乾淨(jìng)、完整的資料,必須確保來(lái)源資料的完整性,使得產(chǎn)生的資訊品質(zhì)達(dá)到有效性及正確性的要求,在資料挖礦部分採(cǎi)用關(guān)聯(lián)規(guī)則的Apriori演算法進(jìn)行關(guān)聯(lián)資料的搜尋,以及決策樹歸納法進(jìn)行可疑原因區(qū)別的建議。三、研究方法本節(jié)將探討半導(dǎo)體製造過程中,對(duì)於產(chǎn)品量測(cè)(Lot QC)資料異常及報(bào)廢的產(chǎn)品如何應(yīng)用資料挖礦技術(shù)尋求合適的資訊以提供解決方案的選擇。 Tung et al., 2003),在實(shí)務(wù)應(yīng)用上,Srikant and Agrawal(1997)有提及關(guān)聯(lián)規(guī)則在商業(yè)、保險(xiǎn)、醫(yī)學(xué)等之應(yīng)用,其他主要的應(yīng)用領(lǐng)域包括購(gòu)物籃分析(Fayyad et al., 1996)、商品擺架安排(Srikant and Agrawal, 1997)、欺騙行為偵查(Berry and Linoff, 1997)、醫(yī)學(xué)研究(葉忠和吳恆睿,2002),在半導(dǎo)體的應(yīng)用上,如透過半導(dǎo)體晶圓允收測(cè)試資料,建構(gòu)製程事故診斷資料挖礦架構(gòu),以作為工程師及領(lǐng)域?qū)<医鉀Q問題的參考,進(jìn)而提升其製程良率的改善(簡(jiǎn)禎富等,民90; Han and Kamber, 2000)。 Berzal et al., 2001。關(guān)於關(guān)聯(lián)規(guī)則的研究,主要是研究發(fā)掘關(guān)聯(lián)規(guī)則的演算法,如何從含有大量資料的資料庫(kù)中,快速的找出有意義的關(guān)聯(lián)規(guī)則(Srikant and Agrawal, 1996。3. 在搜尋資料庫(kù),得出候選2項(xiàng)目集合的支持度以後,在找出頻繁2項(xiàng)目集合,並利用這些頻繁2項(xiàng)目集合的結(jié)合,產(chǎn)生3項(xiàng)目集合。Apriori演算法使用了候選項(xiàng)目集合(Candidate Itemset) 的觀念,若候選項(xiàng)目集合的支持度大於或等於最小支持度,則該候選項(xiàng)目集合為頻繁項(xiàng)目集合。過程中其關(guān)聯(lián)規(guī)則的總體效能是由步驟(1)所決定,因此有效的找出頻繁項(xiàng)目集合是關(guān)聯(lián)規(guī)則的重點(diǎn)。就一般資料庫(kù)的探勘關(guān)聯(lián)規(guī)則上,其過程可為下列步驟(Han and Kamber, 2001):1. 找出所有頻繁項(xiàng)目集合(Frequent Itemset):依據(jù)定義,頻繁項(xiàng)目集合所出現(xiàn)的次數(shù)必須與使用者預(yù)先定義的最小支持度數(shù)目相同。其代表的物理意義為關(guān)聯(lián)規(guī)則的條件機(jī)率比母體中原本發(fā)生的機(jī)率大才具有意義。此指標(biāo)之物理意義為當(dāng)前提項(xiàng)目X發(fā)生時(shí),可推得結(jié)論為結(jié)果項(xiàng)目Y的信賴度。2. 信賴度:,即代表在前提項(xiàng)目X發(fā)生的情況下,前提項(xiàng)目X與結(jié)果項(xiàng)目Y又同時(shí)發(fā)生的機(jī)率。此三項(xiàng)指標(biāo)的計(jì)算公式與物理意義分別闡述如下:1. 支持度:,即代表前提項(xiàng)目X與結(jié)果項(xiàng)目Y一起出現(xiàn)的機(jī)率。Y〈If X, then Y〉,X為前提項(xiàng)目組(Antecedent item set),Y為結(jié)果項(xiàng)目組(Consequent item set),X和Y皆為所有相異物品項(xiàng)目集合的子集合,且。而D則是所有交易記錄T的集合。過去對(duì)於關(guān)聯(lián)規(guī)則已有相當(dāng)多的研究,也證明關(guān)聯(lián)規(guī)則為一有效之方法,其方法的特性主要是,關(guān)聯(lián)規(guī)則能容易解釋其產(chǎn)生的規(guī)則,且可完整呈現(xiàn)變數(shù)之間的影響,但篩選規(guī)則的條件設(shè)定很重要,否則條件太鬆可能造成結(jié)果多且凌亂,相反地,如果條件太嚴(yán)可能忽略掉一些罕見變數(shù)的有趣樣型。 陳家仁等,民92)。 Han and Kamber, 2001。24關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是資料挖礦模式中最常被應(yīng)用模式之一(Berry and Linoff, 1997。資料挖礦中所使用的挖掘技術(shù)與類型,通常包含關(guān)聯(lián)規(guī)則、分類規(guī)則、叢集規(guī)則、預(yù)測(cè)分析、趨勢(shì)分析、偏差分析等類型。綜合以上,資料庫(kù)知識(shí)發(fā)現(xiàn)和資料挖礦的目的皆相同,同樣是從資料庫(kù)的大量資料中發(fā)現(xiàn)有用的資訊以提供決策者參考,只是資料庫(kù)知識(shí)發(fā)現(xiàn)描述出資料準(zhǔn)備階段之過程,也就是資料如何從資料庫(kù)轉(zhuǎn)換成資料挖礦工具可運(yùn)用的程序皆完整的描述,然而要達(dá)到資料挖礦的目的,資料挖礦的定義已隱含有資料準(zhǔn)備的概念,因此,可直接採(cǎi)用資料挖礦此一名詞。 KDD)、知識(shí)萃?。↘nowledge extraction)、資料考古學(xué)(Data archeology)、資料捕撈(Data dredging)(Han and Kamber, 2001)。在本研究中將以資料挖礦的技術(shù)建立一適合使用者查詢與分析資料的方法,以協(xié)助工程人員的問題追蹤與分析。這些資料經(jīng)過規(guī)劃之後有規(guī)則的將及時(shí)資料與歷史資料個(gè)別置於關(guān)聯(lián)的資料項(xiàng)中,並適當(dāng)適時(shí)的進(jìn)行儲(chǔ)存與備份的工作。不論是即時(shí)的生產(chǎn)資料或是歷史資料將存放在系統(tǒng)所指定的資料庫(kù)中。其次是Recipe即製程參數(shù)的資料流,當(dāng)使用者透過自動(dòng)化系統(tǒng)的介面取得機(jī)臺(tái)與Lot ID的關(guān)係之後,系統(tǒng)將提供一組適合該Lot在此機(jī)臺(tái)製造的參數(shù),這就是自動(dòng)化系統(tǒng)所帶來(lái)的便利之一。關(guān)於晶圓廠自動(dòng)化系統(tǒng)之資料倉(cāng)儲(chǔ),以前段製程FAB生產(chǎn)流程中的Lot Transportation、Lot History、Recipe、Data Collection等四種資料流來(lái)了解在自動(dòng)化系統(tǒng)的製造環(huán)境中,系統(tǒng)是如何紀(jì)錄與取得各產(chǎn)品的生產(chǎn)資料以及所需要的資料是存放於何處。自1947年發(fā)明電晶體後,新的技術(shù)亦不斷的被發(fā)現(xiàn),其技術(shù)的創(chuàng)新與快速使得積體電路製造在短短的數(shù)十年間迅速發(fā)展至今日的奈米半導(dǎo)體製程。目前在半導(dǎo)體產(chǎn)業(yè)的硬體建設(shè)上雖可滿足產(chǎn)業(yè)的大量需求,但是隨之而來(lái)的將是如何在快速生產(chǎn)與大量產(chǎn)能中,提升良率與及時(shí)發(fā)現(xiàn)異常等問題。二、文獻(xiàn)探討21半導(dǎo)體製程半導(dǎo)體技術(shù)變化快速,目前已進(jìn)入深次微米的時(shí)代,產(chǎn)業(yè)的生產(chǎn)趨勢(shì)將是集中資源於最具核心競(jìng)爭(zhēng)力產(chǎn)品的生產(chǎn)方式。2. 建構(gòu)製造過程中製程參數(shù)與機(jī)臺(tái)資料的關(guān)聯(lián)規(guī)則,以提供一可追蹤產(chǎn)品、製程或設(shè)備參數(shù)設(shè)定值的有用資訊,幫助製程或設(shè)備工程人員進(jìn)行問題追蹤。本研究是使用半導(dǎo)體自動(dòng)化系統(tǒng)的資料庫(kù)為資料挖礦的資料來(lái)源,並運(yùn)用資料挖礦中的關(guān)聯(lián)規(guī)則作為分析問題的方法,藉此協(xié)助製程工程人員如何在大量的生產(chǎn)資料中找出可能隱藏的訊息,以快速的找出與問題相關(guān)性的關(guān)聯(lián)資訊,確保問題能在較短的時(shí)間內(nèi)予以解決,不至於造成產(chǎn)品的損失擴(kuò)大。資料挖礦技術(shù)是一種統(tǒng)計(jì)工具的應(yīng)用,其結(jié)合該產(chǎn)業(yè)領(lǐng)域的專業(yè)與資料庫(kù)知識(shí),從資料庫(kù)或其他資料儲(chǔ)藏系統(tǒng)中,針對(duì)大量的資料進(jìn)行篩選、推演與模式建構(gòu)等程序,以挖掘隱含在資料與模式中的訊息進(jìn)而轉(zhuǎn)換成為商機(jī),或是提供決策者新的知識(shí)以利於決策的進(jìn)行(簡(jiǎn)禎富等,民90;簡(jiǎn)禎富等,民92)。就目前的企業(yè)對(duì)於數(shù)以百萬(wàn)筆的歷史資料處理方式而言,當(dāng)產(chǎn)品發(fā)生異?;?yàn)樘囟ㄈ蝿?wù)而必須得到部份資訊的支援時(shí),若將其一一分類並運(yùn)用於分析上,其實(shí)是件耗時(shí)且相當(dāng)困難的工作;通常在自動(dòng)化系統(tǒng)中資料庫(kù)僅記錄現(xiàn)場(chǎng)正使用的已設(shè)定參數(shù)值,因而當(dāng)產(chǎn)品被發(fā)現(xiàn)已產(chǎn)生異常時(shí)往往無(wú)法及時(shí)取得當(dāng)時(shí)製造過程中的參數(shù)設(shè)定值,必須依賴製程或設(shè)備工程人員的紀(jì)錄或是其他備份的資料庫(kù),資料不易取得且方法繁雜。在半導(dǎo)體廠製造環(huán)境中,不乏包含200種以上的製程與設(shè)備種類,若以半導(dǎo)體製程的創(chuàng)新速度與產(chǎn)品多樣性生産特性、或是生産能力及其大批量生産方式發(fā)展而言,對(duì)於目前已存在的八吋廠或是十二吋廠來(lái)說,不論是製程設(shè)備或是自動(dòng)化系統(tǒng)的規(guī)劃上,皆會(huì)影響晶圓廠的成本與生產(chǎn)效率。在半導(dǎo)體製造技術(shù)日趨進(jìn)步與純熟之下,已進(jìn)入八吋、十二吋晶圓的年代,這其中大量資金的投入是不可或缺的,特別是十二吋晶圓廠其所投入的金額約需30億美元。 methods by which obtained data may be appropriately processed, by which affected products