freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

高血壓診療系統(tǒng)畢業(yè)設(shè)計論文(編輯修改稿)

2025-08-23 04:47 本頁面
 

【文章內(nèi)容簡介】 的藥性相近,歸類也應(yīng)相近的特點進行分類預(yù)測。用決策樹和關(guān)聯(lián)規(guī)則分析可以自動對藥物進行功效分類與其藥性特征之間的關(guān)聯(lián)模式或規(guī)則研究。粗糙集理論可以實現(xiàn)對藥物分類的簡化藥性特征研究等。進行中藥藥性特征的數(shù)據(jù)挖掘研究,對中藥復(fù)方配伍的科學(xué)規(guī)律研究有著重要意義。在中藥化學(xué)研究中的應(yīng)用中藥發(fā)揮作用的物質(zhì)是其所含的化學(xué)成分,在中藥中提取有效成分直接用于新藥開發(fā)或作為先導(dǎo)化合物,經(jīng)過結(jié)構(gòu)修飾或改造后進行合理藥物設(shè)計,然后開發(fā)為新藥的途徑,己成為現(xiàn)代新藥開發(fā)的熱點。中藥化學(xué)成分一般較人工合成的成分復(fù)雜,具有相同藥效的成分往往具有相似的活性基團和比較穩(wěn)定的活性構(gòu)象。因此通過對大量中藥化學(xué)成分的二維和三維構(gòu)象分析,以及結(jié)構(gòu)與活性之間關(guān)系的分析,進行藥效基團的建模研究,并實現(xiàn)對中藥化學(xué)成分數(shù)據(jù)庫的柔性搜索,為更充分利用中藥化學(xué)成分提供技術(shù)支持。如利用分子對接技術(shù)(DOCK)在進行受體與配體結(jié)合分析的基礎(chǔ)上,建立對應(yīng)結(jié)構(gòu)類型不同配體的構(gòu)效方程和它們的結(jié)合模式。比較分子力場分析(COMFA)和定量構(gòu)效關(guān)系(QSAR)的結(jié)合可以在提取大量分子共同活性結(jié)構(gòu)模式的基礎(chǔ)上,揭示出化合物之間的聯(lián)系和潛在特征以及與生物活性之間的關(guān)系,并可實現(xiàn)對成分數(shù)據(jù)庫和活性數(shù)據(jù)庫中有價值信息的挖掘。在中醫(yī)醫(yī)案方面的應(yīng)用中醫(yī)醫(yī)案在中醫(yī)藥科學(xué)中扮演著非常重要的角色,大量的醫(yī)案散見于文獻刊物中,散見于名老中醫(yī)的案頭,他們的學(xué)術(shù)經(jīng)驗是中醫(yī)藥事業(yè)的一筆巨大財富。但“百花齊放、百家爭鳴”的局面使得醫(yī)案經(jīng)常出現(xiàn)藥味和藥量千差萬別的情況,無法形成中醫(yī)在整體上對疾病規(guī)律統(tǒng)一的認識。應(yīng)用數(shù)據(jù)挖掘方法對眾多中醫(yī)專家的寶貴經(jīng)驗進行全面整理和挖掘,將會比較全面地獲得對中醫(yī)藥基礎(chǔ)理論和臨床實踐規(guī)律的統(tǒng)一的認識。其中決策樹、關(guān)聯(lián)規(guī)則和面向?qū)傩缘臍w納方法可以在不同配伍層次(單味藥、藥物功效分類等)上分析藥味配伍的模式或規(guī)則。在中醫(yī)藥其他方面的應(yīng)用數(shù)據(jù)挖掘技術(shù)不但可以應(yīng)用到中醫(yī)藥研究中的上述方面,而且在研究中醫(yī)病證與復(fù)方組方的關(guān)系、中醫(yī)癥候與現(xiàn)代醫(yī)學(xué)臨床表現(xiàn)之間關(guān)聯(lián)的關(guān)系以及中醫(yī)藥信息數(shù)據(jù)倉庫的開發(fā)研究等方面都可以得到廣泛應(yīng)用。 數(shù)據(jù)挖掘和傳統(tǒng)數(shù)據(jù)分析工具和學(xué)習(xí)機器的區(qū)別對于在線分析OLAP (On Line Analytical Processing),用戶首先建立一個假設(shè),然后用OLAP檢索數(shù)據(jù)庫來驗證這個假設(shè)是否正確。比如一個分析師想找到是什么導(dǎo)致拖欠貸款,他可能先做一個初始假設(shè),認為低收入的人信用也低,然后他可以用OLAP來驗證他的假設(shè),如果這個假設(shè)沒有被證實,他可能去查看那些高負債的賬戶,如果還不行,他可能要把收入和負債一起來考慮,繼續(xù)進行下去直到找到他想要的結(jié)果或放棄。也可以這么說,OLAP分析師是建立一系列的假設(shè),然后通過OLAP驗證或推翻這些假設(shè)來最終得到自己的結(jié)論。OLAP過程本質(zhì)上是一個演繹推理的過程。數(shù)據(jù)挖掘與OLAP相比其不同之處在于數(shù)據(jù)挖掘不是用來驗證某個假設(shè)的模式(模型)的正確性,而是在數(shù)據(jù)庫中自己尋找模型。它在本質(zhì)上是一個歸納的過程。舉個例子,一個用數(shù)據(jù)挖掘工具的分析,想找到引起貸款拖欠的因素,數(shù)據(jù)挖掘可以幫他找到高負債和低收入是引起這個問題的因素,甚至還能發(fā)現(xiàn)一些分析師從沒想過或試過的其它因素。概括說來,數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報表、聯(lián)機分析處理)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所得到的信息應(yīng)具有原先未知、有效和實用三個特征。先前未知的信息是指該信息是預(yù)先未能預(yù)料的。即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。數(shù)據(jù)挖掘是從現(xiàn)實世界中存在的一些具體的數(shù)據(jù)中提取知識,這些數(shù)據(jù)在數(shù)據(jù)挖掘出現(xiàn)之前早己存在;而機器學(xué)習(xí)所使用的數(shù)據(jù)是專門為機器學(xué)習(xí)而特別準備的數(shù)據(jù),這些數(shù)據(jù)在現(xiàn)實世界中也許毫無意義。由于數(shù)據(jù)挖掘使用的數(shù)據(jù)來自于實際的數(shù)據(jù)庫,所要處理的數(shù)據(jù)量可能很大,因此數(shù)據(jù)挖掘算法的效率和可擴充性就顯得尤為重要;此外,數(shù)據(jù)挖掘所處理的數(shù)據(jù)由于來自于現(xiàn)實世界,數(shù)據(jù)的完整性、一致性和正確性都很難保證,如何將這些數(shù)據(jù)加工成算法可以接收的數(shù)據(jù)也需要進行深入的研究;再者,數(shù)據(jù)挖掘可以利用目前數(shù)據(jù)庫技術(shù)所取得的研究成果來加快挖掘過程,提高挖掘的效率。最后,由于數(shù)據(jù)挖掘處理的數(shù)據(jù)來自于實際的數(shù)據(jù)庫,而與這些數(shù)據(jù)庫數(shù)據(jù)有關(guān)的還有其他一些背景知識,這些背景知識的合理運用也會提高算法的效率。 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則介紹數(shù)據(jù)挖掘所發(fā)現(xiàn)出的知識種類中關(guān)聯(lián)規(guī)則的應(yīng)用是目前數(shù)據(jù)挖掘領(lǐng)域中研究最為廣泛的課題之一。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間潛在關(guān)系的規(guī)則。關(guān)聯(lián)規(guī)則挖掘的一般對象是事務(wù)數(shù)據(jù)庫,起初主要應(yīng)用于零售業(yè),比如超級市場的銷售管理。條形碼技術(shù)的發(fā)展使得數(shù)據(jù)的收集變得更容易更完整,從而存儲了大量交易資料,關(guān)聯(lián)規(guī)則是通過辨別這些交易資料,來分析顧客的購買模式。根據(jù)關(guān)聯(lián)規(guī)則提供的信息可以用做商品銷售目錄設(shè)計、商品布置、針對性的營銷等。1993年Agrawal ,并于1994年提出了挖掘關(guān)聯(lián)規(guī)則的經(jīng)典Apriori算法。后來有不少學(xué)者對關(guān)聯(lián)規(guī)則的挖掘問題進行了大量的研究。他們的工作包括對原有Aprior算法進行優(yōu)化,如引入隨機采樣、并行的思想、使用哈希方法等,以提高算法挖掘規(guī)則的效率,有的為了避免頻繁集產(chǎn)生方法的一些缺陷,提出了獨立于Apriori算法的挖掘關(guān)聯(lián)規(guī)則的新方法,如Jianwei Han等人提出的不產(chǎn)生候選挖掘頻繁項集的FPGrowth方法、基于關(guān)聯(lián)圖的挖掘關(guān)聯(lián)規(guī)則的方法等。 關(guān)聯(lián)規(guī)則的有關(guān)定義設(shè)是n個不同項(Item)的集合,表示集合中的第j項。相同的事務(wù)的集合構(gòu)成事務(wù)集D。一組項的集合構(gòu)成一個事務(wù)T,使得每一個事物都與唯一的標識符TID相聯(lián)。設(shè)A是一個項集當且僅當時就稱事務(wù)T包含A。一條關(guān)聯(lián)規(guī)則就是一個形如的蘊涵式,其中。關(guān)聯(lián)規(guī)則的實用性由支持度衡量。:support(AB)=P(AB)。關(guān)聯(lián)規(guī)則的準確性由置信度衡量,描述了出現(xiàn)A的前提下也出現(xiàn)B的概率,定義為。最小支持度表示項集的最低實用性,最小置信度表示關(guān)聯(lián)規(guī)則的最低可靠性。滿足最小支持度minsup的項集成為頻繁項集,同時滿足最小支持度minsup和最小可信度minconf的規(guī)則成為強關(guān)聯(lián)規(guī)則。SupportConfidence 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的過程大體為兩步,如下圖所示,第一步是利用頻繁項集搜索算法從事物數(shù)據(jù)中找出所有大于或等于。up的頻繁項集的集合:第二步是根據(jù)設(shè)定的minconf從頻繁項集產(chǎn)生關(guān)聯(lián)規(guī)則。第一步要從大量的事物數(shù)據(jù)中找出頻繁項集,每次執(zhí)行部要掃描一次數(shù)據(jù)庫,需要耗費大量的時間和空間,所以對關(guān)聯(lián)規(guī)則算法的研究工作主要是對第一步算法的優(yōu)化或改進。描述關(guān)聯(lián)規(guī)則屬性常用的參數(shù)有:支持度(Support)支持度S是D中包含的事務(wù)百分比,它是概率,即,它描述了A和B這兩個物品集的并集在所有的事務(wù)中出現(xiàn)的概率。例如,一事務(wù)數(shù)據(jù)庫中共有1000條記錄,其中同時包含A和B的100條,則關(guān)聯(lián)規(guī)則AFB的支持度為100/ 1000100% =10%。支持度表示了規(guī)則的頻度。滿足最小支持度的項集稱之為頻繁項集。置信度(Confidence)置信度C為D中包含A的事務(wù)中同時也包含B的百分比,它是概率,即。在上例中,如果有200條記錄包含A,則關(guān)聯(lián)規(guī)則的置信度為100/200100% =50%。置信度表示了規(guī)則的強度。同時滿足最小支持度閾值和最小置信度閾值的規(guī)則稱作強規(guī)則。 期望置信度(Expected Confidence) 期望置信度e為D中包含B的事務(wù)百分比,即P (B )。期望置信度描述在沒有任何條件影響時,物品集B在所有事物中出現(xiàn)的概率有多大。在上例中如果有150條記錄包含B,則關(guān)聯(lián)規(guī)則AFB的期望置信度為150/ 1000 100% =15%。作用度(Lift)作用度是置信度與期望置信度的比值,即。作用度描述了項集A的出現(xiàn)對項集B的出現(xiàn)有多大的影響,作用度越大,說明物品集B受物品集A的影響越大。因為項集B在所有事務(wù)中出現(xiàn)的概率是期望置信度;而項集B在所有項集A出現(xiàn)的概率是置信度,通過置信度與期望置信度的比值反映了在加入“項集A出現(xiàn)”這個條件后,項集B的出現(xiàn)概率發(fā)生了多大的變化。在上例中,關(guān)聯(lián)規(guī)則的作用度為50%/15% ≈3. 3。一般情況,有用的關(guān)聯(lián)規(guī)則的作用度都應(yīng)該大于1,只有關(guān)聯(lián)規(guī)則的可信度大于期望可信度,才說明A的出現(xiàn)對B的出現(xiàn)有促進作用,也說明了它們之間某種程序的相關(guān)性,如果作用度不大于1,則此關(guān)聯(lián)規(guī)則也就沒有意義了。興趣度(Interest measure)在數(shù)據(jù)挖掘中,并不是所有的強關(guān)聯(lián)規(guī)則都是足夠的有趣而值得向用戶提供。例如一個學(xué)校的5000名學(xué)生進行早晨參與活動與早餐的情況調(diào)查。數(shù)據(jù)顯示:60%的學(xué)生(3000)晨練,75%的學(xué)生(3750)吃早餐,40%的學(xué)生(2000)即晨練又吃早餐。假設(shè)最小支持度為40%,最小置信度為60%,則。是一強關(guān)聯(lián)規(guī)則,因為其支持度為40%,置信度為2000/3000100% =66%,滿足最小支持數(shù)和最小置信度的要求,然而以上規(guī)則是誤導(dǎo),因為總的吃早餐的學(xué)生占75%,比66%還要大,為了修剪一些無趣的規(guī)則,即避免生成錯覺的關(guān)聯(lián)規(guī)則,下面定義了興趣度這個度量值。基于差異思想的興趣度定義,分母上的只是一個標準化因子,使得。根據(jù)這個式子,一條規(guī)則的興趣度越大(IR0)說明對這條規(guī)則越感興趣(即其實際利用價值越大);一條規(guī)則的興趣度越小(IR0) 說明對這條規(guī)則的反面規(guī)則越感興趣(即其反面規(guī)則的實際利用價值越大)?;诟怕收摰呐d趣度定義:。這樣整個關(guān)聯(lián)規(guī)則的評價體系就可以統(tǒng)一在概率論的范疇內(nèi)。即從概率論的角度說,興趣度I反映了關(guān)聯(lián)規(guī)則中A和B之間的關(guān)系究竟如何密切。通過定義可以說明,當A和B相互獨立時,他們同時發(fā)生就純屬偶然,他們同時發(fā)生的意義就不會被人們關(guān)注。即,當時,其所對應(yīng)的關(guān)聯(lián)規(guī)則是沒有意義的。相應(yīng)的,當一條關(guān)聯(lián)規(guī)則的興趣度大于1說明對這條規(guī)則越感興趣;一規(guī)則的興趣度越小于1說明對這條規(guī)則的反面規(guī)則越感興趣。顯然,此種定義的興趣度不小于0。關(guān)聯(lián)規(guī)則描述了A的出現(xiàn)影響到B的出現(xiàn)。現(xiàn)實中,這樣的例子很多。例如超級市場利用收款機收集存儲了大量的售貨數(shù)據(jù),這些數(shù)據(jù)是一條條的購買事務(wù)記錄,每條記錄存貯了事務(wù)處理時間,顧客購買的物品,物品的數(shù)量及金額等。這些數(shù)據(jù)中常常隱含形式如下的關(guān)聯(lián)規(guī)則:在購買牛奶的顧客當中,有70%的人同時購買了面包。這些關(guān)聯(lián)規(guī)則很有價值,商場管理人員可以根據(jù)這些關(guān)聯(lián)規(guī)則更好的規(guī)劃商場,如將面包和牛奶這樣的商品擺放在一起,能夠促進銷售。一些數(shù)據(jù)不像售貨數(shù)據(jù)那樣很容易就能看出一個事務(wù)是許多物品的集合,但稍微轉(zhuǎn)換一下思考角度,仍然可以像售貨數(shù)據(jù)一樣處理。比如人壽保險,一份保單就是一個事務(wù)。保險公司在接受保險前,往往需要記錄投保人詳盡的信息,有時還要到醫(yī)院做身體檢查。保單上記錄有投保人的年齡、性別、健康狀況、工作單位、工作地址、工資水平等。這些投保人的個人住處就可以看作事務(wù)中的樣品。通過分析這些數(shù)據(jù),可以得到類似以下這樣的關(guān)聯(lián)規(guī)則:年齡在40歲以上,區(qū)的投保人當中歲以上是物品甲,有45%的曾經(jīng)向保險公司索賠過。在這條規(guī)則中。工作在年齡在,工作在A區(qū)是物品乙。向保險公司索賠過則是物品丙??梢钥吹贸鰜恚珹區(qū)可能污染比較嚴重,環(huán)境比較差,導(dǎo)致工作在該區(qū)的人健康狀況不好,索賠率也相對比較高。 關(guān)聯(lián)規(guī)則的分類我們將關(guān)聯(lián)規(guī)則按不同的情況進行分類:基于規(guī)則中處理的變量的類別,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。布爾型關(guān)聯(lián)規(guī)則處理的值都是離散的、種類化的,它顯示了這些變量之間的關(guān)系;值型關(guān)聯(lián)規(guī)則可以和多維關(guān)聯(lián)或多層關(guān)聯(lián)規(guī)則結(jié)合起來,對數(shù)值型字段進行處理,將其進行動態(tài)的分割,或者直接對原始的數(shù)據(jù)進行處理,值型關(guān)聯(lián)規(guī)則中也可以包含種類變量。例如:性別=“女”職業(yè)=“秘書”,是布爾型關(guān)聯(lián)規(guī)則:性別=“女”avg(收入)=1800,涉及的是數(shù)值類型,所以是一個數(shù)值型關(guān)聯(lián)規(guī)則?;谝?guī)則中數(shù)據(jù)的抽象層次,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。在單層的關(guān)聯(lián)規(guī)則中,所有的變量都沒有考慮到現(xiàn)實的數(shù)據(jù)是具有多個不同的層次的:在多層的關(guān)聯(lián)規(guī)則中,對數(shù)據(jù)的多層性已經(jīng)進行了充分的考慮。例如:I BM臺式機Sony打印機,是一個細節(jié)數(shù)據(jù)上的單層關(guān)聯(lián)規(guī)則;臺式機Sony打印機,是一個較高層次和細節(jié)層次之間的多層關(guān)聯(lián)規(guī)則?;谝?guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分單維和多維的。在單維的關(guān)聯(lián)規(guī)則中,我們只涉及到數(shù)據(jù)的一個維,如用戶購買的物品;而在多維的關(guān)聯(lián)規(guī)則中,要處理的數(shù)據(jù)將會涉及多個維。換成另一句話,單維關(guān)聯(lián)規(guī)則是處理單個屬性中的一些關(guān)系。多維關(guān)聯(lián)規(guī)則是處理各個屬性之間的某些關(guān)系。2.3 挖掘關(guān)聯(lián)規(guī)則的經(jīng)典算法介紹為了描述算法,我們給出了原事務(wù)數(shù)據(jù)庫如表23所示,每個項目賦一個整數(shù),Bread1, Coke2, Milk3, Beer4, Cake5,得整數(shù)化后的數(shù)據(jù)庫如表24設(shè)最小支持度為22%,因為一共有9個事務(wù),次,給定一個事務(wù)數(shù)據(jù)庫D,挖掘關(guān)聯(lián)規(guī)則的問題就是找出所有滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,即挖出所有的強規(guī)則,該問題可分解為兩個子問題:①找出所有頻繁項目集, 即出現(xiàn)頻率至少和預(yù)定義的最小支持一樣的項目集。②由頻繁項目集產(chǎn)生關(guān)聯(lián)規(guī)則。一旦找
點擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1