freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

某sas軟件研究所公司sas數(shù)據(jù)挖掘白皮書(編輯修改稿)

2025-07-19 22:42 本頁面
 

【文章內(nèi)容簡介】 不要讓你的專業(yè)知識束縛了你對數(shù)據(jù)特征觀察的敏銳性??赡軐嶋H存在著你的先驗知識認為不存在的關系。假如你的數(shù)據(jù)是真實可靠的話,那末你絕對不要輕易地否定數(shù)據(jù)呈現(xiàn)給你的新關系。很可能這里就是發(fā)現(xiàn)的新知識!有了它,也許會導引你在此后的分析中,得出比你原有的認識更加符合實際的規(guī)律性知識。假如在你的操作中出現(xiàn)了這種情況,應當說,你的數(shù)據(jù)挖掘已挖到了有效的礦脈。在這里要提醒你的是要有耐心,做幾種分析,就發(fā)現(xiàn)重大成果是不大可能的。所幸的是SAS向你提供了強有力的工具,它可跟隨你的思維,可視化、快速的作出反應。免除了數(shù)學的復雜運算過程和編制結果展現(xiàn)程序的煩惱和對你思維的干擾。這就使你數(shù)據(jù)分析過程集聚于你業(yè)務領域的問題,并使你的思維保持了一個集中的較高級的活動狀態(tài),從而加速了你的思維過程,提高了你的思維能力。Modify──問題明確化、數(shù)據(jù)調(diào)整和技術選擇通過上述兩個步驟的操作,你對數(shù)據(jù)的狀態(tài)和趨勢可能有了進一步的了解。對你原來要解決的問題可能會有了進一步的明確;這時要盡可能對問題解決的要求能進一步的量化。問題越明確,越能進一步量化,問題就向它的解決更前進了一步。這是十分重要的。因為原來的問題很可能是諸如質(zhì)量不好、生產(chǎn)率低等模糊的問題,沒有問題的進一步明確,你簡直就無法進行有效的數(shù)據(jù)挖掘操作。在問題進一步明確化的基礎上,你就可以按照問題的具體要求來審視你的數(shù)據(jù)集了,看它是否適應你的問題的需要。Gartner group在評論當前一些數(shù)據(jù)挖掘產(chǎn)品時特別強調(diào)指出:在數(shù)據(jù)挖掘的各個階段中,數(shù)據(jù)挖掘的產(chǎn)品都要使所使用的數(shù)據(jù)和所將建立模型處于十分易于調(diào)整、修改和變動的狀態(tài),這才能保證數(shù)據(jù)挖掘有效的進行。針對問題的需要可能要對數(shù)據(jù)進行增刪;也可能按照你對整個數(shù)據(jù)挖掘過程的新認識,要組合或者生成一些新的變量,以體現(xiàn)對狀態(tài)的有效的描述。SAS對數(shù)據(jù)強有力的存取、管理和操作的能力保證了對數(shù)據(jù)的調(diào)整、修改和變動的可能性。若使用了SAS的數(shù)據(jù)倉庫產(chǎn)品技術時就更進一步保證了有效、方便的進行這些操作。在問題進一步明確;數(shù)據(jù)結構和內(nèi)容進一步調(diào)整的基礎上,下一步數(shù)據(jù)挖掘應采用的技術手段就更加清晰、明確了。Model──模型的研發(fā)、知識的發(fā)現(xiàn)這一步是數(shù)據(jù)挖掘工作的核心環(huán)節(jié)。雖然數(shù)據(jù)挖掘模型化工作涉及了非常廣闊的技術領域,但對SAS研究所來說并不是一件新鮮事。自從SAS問世以來,就一直是統(tǒng)計模型市場領域的領頭羊,而且年年提供新產(chǎn)品,并以這些產(chǎn)品體現(xiàn)業(yè)界技術的最新發(fā)展。按照SAS提出的SEMMA方法論走到這一步時,你對應采用的技術已有了較明確的方向;你的數(shù)據(jù)結構和內(nèi)容也有了充分的適應性。SAS在這時也向你提供了充分的可選擇的技術手段:回歸分析方法等廣泛的數(shù)理統(tǒng)計方法;關聯(lián)分析方法;分類及聚類分析方法;人工神經(jīng)元網(wǎng)絡;決策樹……等。在你的數(shù)據(jù)挖掘中使用哪一種方法,用SAS軟件包中什么方法來實現(xiàn),這主要取決于你的數(shù)據(jù)集的特征和你要實現(xiàn)的目標。實際上這種選擇也不一定是唯一的。好在SAS軟件運行效率十分高,你不妨多試幾種方法,從實踐中選出最適合于你的方法。Assess──模型和知識的綜合解釋和評價從上述過程中將會得出一系列的分析結果、模式或模型。同一個數(shù)據(jù)源可以利用多種數(shù)據(jù)分析方法和模型進行分析,ASSESS 的目的之一就是從這些模型中自動找出一個最好的模型出來,另外就是要對模型進行針對業(yè)務的解釋和應用。若能從模型中得出一個直接的結論當然很好。但更多的時候會得出對目標問題多側面的描述。這時就要能很好的綜合它們的影響規(guī)律性提供合理的決策支持信息。所謂合理,實際上往往是要你在所付出的代價和達到預期目標的可靠性的平衡上作出選擇。假如在你的數(shù)據(jù)挖掘過程中,就預見到最后要進行這樣的選擇的話,那末你最好把這些平衡的指標盡可能的量化,以利你綜合抉擇。你提供的決策支持信息適用性如何,這顯然是十分重要的問題。除了在數(shù)據(jù)處理過程中SAS軟件提供給你的許多檢驗參數(shù)外,評價的辦法之一是直接使用你原來建立模型的樣板數(shù)據(jù)來進行檢驗。假如這一關就通不過的話,那末你的決策支持信息的價值就不太大了。一般來說,在這一步應得到較好的評價。這說明你確實從這批數(shù)據(jù)樣本中挖掘出了符合實際的規(guī)律性。另一種辦法是另外找一批數(shù)據(jù),已知這些數(shù)據(jù)是反映客觀實際的規(guī)律性的。這次的檢驗效果可能會比前一種差。差多少是要注意的。若是差到你所不能容忍程度,那就要考慮第一次構建的樣本數(shù)據(jù)是否具有充分的代表性;或是模型本身不夠完善。這時候可能要對前面的工作進行反思了。若這一步也得到了肯定的結果時,那你的數(shù)據(jù)挖掘應得到很好的評價了。第三章 深層統(tǒng)計分析與預測套件SAS “深層統(tǒng)計分析與預測套件”主要是應用SAS國際標準的經(jīng)典統(tǒng)計分析工具對數(shù)據(jù)進行深層次的分析、加工和預測,進而再生成作為決策支持用的圖形和報表。SAS既可以采用客戶機/服務器方式,也可以采用瀏覽器/服務器方式運行。下面首先介紹此分析套件的功能,之后再介紹SAS的產(chǎn)品配置方案及其工作模式。功能“深層統(tǒng)計分析與預測套件”所具有的功能包含以下幾個方面。1. 強大的數(shù)據(jù)抽取和數(shù)據(jù)轉(zhuǎn)換功能SAS系統(tǒng)最主要的一個數(shù)據(jù)集成策略就是:將任意數(shù)據(jù),不論其數(shù)據(jù)來源及數(shù)據(jù)結構,轉(zhuǎn)換為整理后的、可用的數(shù)據(jù)資源。SAS/ACCESS提供了SAS系統(tǒng)對多種數(shù)據(jù)庫的直接、透明訪問,同時還支持ODBC, OLE DB等標準,在SAS 可以訪問的50多種數(shù)據(jù)源中包括Informix 和Redbrick,DBORACLE、ADABAS、SYBASE等。而SAS BAS等產(chǎn)品提供了強大的數(shù)據(jù)清理和轉(zhuǎn)換功能。在SAS系統(tǒng)中,既支持標準SQL,并加入了適當
點擊復制文檔內(nèi)容
化學相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1