freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

高血壓診療系統(tǒng)畢業(yè)設(shè)計(jì)論文(編輯修改稿)

2025-08-23 04:47 本頁面
 

【文章內(nèi)容簡(jiǎn)介】 的藥性相近,歸類也應(yīng)相近的特點(diǎn)進(jìn)行分類預(yù)測(cè)。用決策樹和關(guān)聯(lián)規(guī)則分析可以自動(dòng)對(duì)藥物進(jìn)行功效分類與其藥性特征之間的關(guān)聯(lián)模式或規(guī)則研究。粗糙集理論可以實(shí)現(xiàn)對(duì)藥物分類的簡(jiǎn)化藥性特征研究等。進(jìn)行中藥藥性特征的數(shù)據(jù)挖掘研究,對(duì)中藥復(fù)方配伍的科學(xué)規(guī)律研究有著重要意義。在中藥化學(xué)研究中的應(yīng)用中藥發(fā)揮作用的物質(zhì)是其所含的化學(xué)成分,在中藥中提取有效成分直接用于新藥開發(fā)或作為先導(dǎo)化合物,經(jīng)過結(jié)構(gòu)修飾或改造后進(jìn)行合理藥物設(shè)計(jì),然后開發(fā)為新藥的途徑,己成為現(xiàn)代新藥開發(fā)的熱點(diǎn)。中藥化學(xué)成分一般較人工合成的成分復(fù)雜,具有相同藥效的成分往往具有相似的活性基團(tuán)和比較穩(wěn)定的活性構(gòu)象。因此通過對(duì)大量中藥化學(xué)成分的二維和三維構(gòu)象分析,以及結(jié)構(gòu)與活性之間關(guān)系的分析,進(jìn)行藥效基團(tuán)的建模研究,并實(shí)現(xiàn)對(duì)中藥化學(xué)成分?jǐn)?shù)據(jù)庫(kù)的柔性搜索,為更充分利用中藥化學(xué)成分提供技術(shù)支持。如利用分子對(duì)接技術(shù)(DOCK)在進(jìn)行受體與配體結(jié)合分析的基礎(chǔ)上,建立對(duì)應(yīng)結(jié)構(gòu)類型不同配體的構(gòu)效方程和它們的結(jié)合模式。比較分子力場(chǎng)分析(COMFA)和定量構(gòu)效關(guān)系(QSAR)的結(jié)合可以在提取大量分子共同活性結(jié)構(gòu)模式的基礎(chǔ)上,揭示出化合物之間的聯(lián)系和潛在特征以及與生物活性之間的關(guān)系,并可實(shí)現(xiàn)對(duì)成分?jǐn)?shù)據(jù)庫(kù)和活性數(shù)據(jù)庫(kù)中有價(jià)值信息的挖掘。在中醫(yī)醫(yī)案方面的應(yīng)用中醫(yī)醫(yī)案在中醫(yī)藥科學(xué)中扮演著非常重要的角色,大量的醫(yī)案散見于文獻(xiàn)刊物中,散見于名老中醫(yī)的案頭,他們的學(xué)術(shù)經(jīng)驗(yàn)是中醫(yī)藥事業(yè)的一筆巨大財(cái)富。但“百花齊放、百家爭(zhēng)鳴”的局面使得醫(yī)案經(jīng)常出現(xiàn)藥味和藥量千差萬別的情況,無法形成中醫(yī)在整體上對(duì)疾病規(guī)律統(tǒng)一的認(rèn)識(shí)。應(yīng)用數(shù)據(jù)挖掘方法對(duì)眾多中醫(yī)專家的寶貴經(jīng)驗(yàn)進(jìn)行全面整理和挖掘,將會(huì)比較全面地獲得對(duì)中醫(yī)藥基礎(chǔ)理論和臨床實(shí)踐規(guī)律的統(tǒng)一的認(rèn)識(shí)。其中決策樹、關(guān)聯(lián)規(guī)則和面向?qū)傩缘臍w納方法可以在不同配伍層次(單味藥、藥物功效分類等)上分析藥味配伍的模式或規(guī)則。在中醫(yī)藥其他方面的應(yīng)用數(shù)據(jù)挖掘技術(shù)不但可以應(yīng)用到中醫(yī)藥研究中的上述方面,而且在研究中醫(yī)病證與復(fù)方組方的關(guān)系、中醫(yī)癥候與現(xiàn)代醫(yī)學(xué)臨床表現(xiàn)之間關(guān)聯(lián)的關(guān)系以及中醫(yī)藥信息數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)研究等方面都可以得到廣泛應(yīng)用。 數(shù)據(jù)挖掘和傳統(tǒng)數(shù)據(jù)分析工具和學(xué)習(xí)機(jī)器的區(qū)別對(duì)于在線分析OLAP (On Line Analytical Processing),用戶首先建立一個(gè)假設(shè),然后用OLAP檢索數(shù)據(jù)庫(kù)來驗(yàn)證這個(gè)假設(shè)是否正確。比如一個(gè)分析師想找到是什么導(dǎo)致拖欠貸款,他可能先做一個(gè)初始假設(shè),認(rèn)為低收入的人信用也低,然后他可以用OLAP來驗(yàn)證他的假設(shè),如果這個(gè)假設(shè)沒有被證實(shí),他可能去查看那些高負(fù)債的賬戶,如果還不行,他可能要把收入和負(fù)債一起來考慮,繼續(xù)進(jìn)行下去直到找到他想要的結(jié)果或放棄。也可以這么說,OLAP分析師是建立一系列的假設(shè),然后通過OLAP驗(yàn)證或推翻這些假設(shè)來最終得到自己的結(jié)論。OLAP過程本質(zhì)上是一個(gè)演繹推理的過程。數(shù)據(jù)挖掘與OLAP相比其不同之處在于數(shù)據(jù)挖掘不是用來驗(yàn)證某個(gè)假設(shè)的模式(模型)的正確性,而是在數(shù)據(jù)庫(kù)中自己尋找模型。它在本質(zhì)上是一個(gè)歸納的過程。舉個(gè)例子,一個(gè)用數(shù)據(jù)挖掘工具的分析,想找到引起貸款拖欠的因素,數(shù)據(jù)挖掘可以幫他找到高負(fù)債和低收入是引起這個(gè)問題的因素,甚至還能發(fā)現(xiàn)一些分析師從沒想過或試過的其它因素。概括說來,數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報(bào)表、聯(lián)機(jī)分析處理)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。數(shù)據(jù)挖掘所得到的信息應(yīng)具有原先未知、有效和實(shí)用三個(gè)特征。先前未知的信息是指該信息是預(yù)先未能預(yù)料的。即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí),甚至是違背直覺的信息或知識(shí),挖掘出的信息越是出乎意料,就可能越有價(jià)值。數(shù)據(jù)挖掘是從現(xiàn)實(shí)世界中存在的一些具體的數(shù)據(jù)中提取知識(shí),這些數(shù)據(jù)在數(shù)據(jù)挖掘出現(xiàn)之前早己存在;而機(jī)器學(xué)習(xí)所使用的數(shù)據(jù)是專門為機(jī)器學(xué)習(xí)而特別準(zhǔn)備的數(shù)據(jù),這些數(shù)據(jù)在現(xiàn)實(shí)世界中也許毫無意義。由于數(shù)據(jù)挖掘使用的數(shù)據(jù)來自于實(shí)際的數(shù)據(jù)庫(kù),所要處理的數(shù)據(jù)量可能很大,因此數(shù)據(jù)挖掘算法的效率和可擴(kuò)充性就顯得尤為重要;此外,數(shù)據(jù)挖掘所處理的數(shù)據(jù)由于來自于現(xiàn)實(shí)世界,數(shù)據(jù)的完整性、一致性和正確性都很難保證,如何將這些數(shù)據(jù)加工成算法可以接收的數(shù)據(jù)也需要進(jìn)行深入的研究;再者,數(shù)據(jù)挖掘可以利用目前數(shù)據(jù)庫(kù)技術(shù)所取得的研究成果來加快挖掘過程,提高挖掘的效率。最后,由于數(shù)據(jù)挖掘處理的數(shù)據(jù)來自于實(shí)際的數(shù)據(jù)庫(kù),而與這些數(shù)據(jù)庫(kù)數(shù)據(jù)有關(guān)的還有其他一些背景知識(shí),這些背景知識(shí)的合理運(yùn)用也會(huì)提高算法的效率。 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則介紹數(shù)據(jù)挖掘所發(fā)現(xiàn)出的知識(shí)種類中關(guān)聯(lián)規(guī)則的應(yīng)用是目前數(shù)據(jù)挖掘領(lǐng)域中研究最為廣泛的課題之一。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間潛在關(guān)系的規(guī)則。關(guān)聯(lián)規(guī)則挖掘的一般對(duì)象是事務(wù)數(shù)據(jù)庫(kù),起初主要應(yīng)用于零售業(yè),比如超級(jí)市場(chǎng)的銷售管理。條形碼技術(shù)的發(fā)展使得數(shù)據(jù)的收集變得更容易更完整,從而存儲(chǔ)了大量交易資料,關(guān)聯(lián)規(guī)則是通過辨別這些交易資料,來分析顧客的購(gòu)買模式。根據(jù)關(guān)聯(lián)規(guī)則提供的信息可以用做商品銷售目錄設(shè)計(jì)、商品布置、針對(duì)性的營(yíng)銷等。1993年Agrawal ,并于1994年提出了挖掘關(guān)聯(lián)規(guī)則的經(jīng)典Apriori算法。后來有不少學(xué)者對(duì)關(guān)聯(lián)規(guī)則的挖掘問題進(jìn)行了大量的研究。他們的工作包括對(duì)原有Aprior算法進(jìn)行優(yōu)化,如引入隨機(jī)采樣、并行的思想、使用哈希方法等,以提高算法挖掘規(guī)則的效率,有的為了避免頻繁集產(chǎn)生方法的一些缺陷,提出了獨(dú)立于Apriori算法的挖掘關(guān)聯(lián)規(guī)則的新方法,如Jianwei Han等人提出的不產(chǎn)生候選挖掘頻繁項(xiàng)集的FPGrowth方法、基于關(guān)聯(lián)圖的挖掘關(guān)聯(lián)規(guī)則的方法等。 關(guān)聯(lián)規(guī)則的有關(guān)定義設(shè)是n個(gè)不同項(xiàng)(Item)的集合,表示集合中的第j項(xiàng)。相同的事務(wù)的集合構(gòu)成事務(wù)集D。一組項(xiàng)的集合構(gòu)成一個(gè)事務(wù)T,使得每一個(gè)事物都與唯一的標(biāo)識(shí)符TID相聯(lián)。設(shè)A是一個(gè)項(xiàng)集當(dāng)且僅當(dāng)時(shí)就稱事務(wù)T包含A。一條關(guān)聯(lián)規(guī)則就是一個(gè)形如的蘊(yùn)涵式,其中。關(guān)聯(lián)規(guī)則的實(shí)用性由支持度衡量。:support(AB)=P(AB)。關(guān)聯(lián)規(guī)則的準(zhǔn)確性由置信度衡量,描述了出現(xiàn)A的前提下也出現(xiàn)B的概率,定義為。最小支持度表示項(xiàng)集的最低實(shí)用性,最小置信度表示關(guān)聯(lián)規(guī)則的最低可靠性。滿足最小支持度minsup的項(xiàng)集成為頻繁項(xiàng)集,同時(shí)滿足最小支持度minsup和最小可信度minconf的規(guī)則成為強(qiáng)關(guān)聯(lián)規(guī)則。SupportConfidence 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的過程大體為兩步,如下圖所示,第一步是利用頻繁項(xiàng)集搜索算法從事物數(shù)據(jù)中找出所有大于或等于。up的頻繁項(xiàng)集的集合:第二步是根據(jù)設(shè)定的minconf從頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。第一步要從大量的事物數(shù)據(jù)中找出頻繁項(xiàng)集,每次執(zhí)行部要掃描一次數(shù)據(jù)庫(kù),需要耗費(fèi)大量的時(shí)間和空間,所以對(duì)關(guān)聯(lián)規(guī)則算法的研究工作主要是對(duì)第一步算法的優(yōu)化或改進(jìn)。描述關(guān)聯(lián)規(guī)則屬性常用的參數(shù)有:支持度(Support)支持度S是D中包含的事務(wù)百分比,它是概率,即,它描述了A和B這兩個(gè)物品集的并集在所有的事務(wù)中出現(xiàn)的概率。例如,一事務(wù)數(shù)據(jù)庫(kù)中共有1000條記錄,其中同時(shí)包含A和B的100條,則關(guān)聯(lián)規(guī)則AFB的支持度為100/ 1000100% =10%。支持度表示了規(guī)則的頻度。滿足最小支持度的項(xiàng)集稱之為頻繁項(xiàng)集。置信度(Confidence)置信度C為D中包含A的事務(wù)中同時(shí)也包含B的百分比,它是概率,即。在上例中,如果有200條記錄包含A,則關(guān)聯(lián)規(guī)則的置信度為100/200100% =50%。置信度表示了規(guī)則的強(qiáng)度。同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則稱作強(qiáng)規(guī)則。 期望置信度(Expected Confidence) 期望置信度e為D中包含B的事務(wù)百分比,即P (B )。期望置信度描述在沒有任何條件影響時(shí),物品集B在所有事物中出現(xiàn)的概率有多大。在上例中如果有150條記錄包含B,則關(guān)聯(lián)規(guī)則AFB的期望置信度為150/ 1000 100% =15%。作用度(Lift)作用度是置信度與期望置信度的比值,即。作用度描述了項(xiàng)集A的出現(xiàn)對(duì)項(xiàng)集B的出現(xiàn)有多大的影響,作用度越大,說明物品集B受物品集A的影響越大。因?yàn)轫?xiàng)集B在所有事務(wù)中出現(xiàn)的概率是期望置信度;而項(xiàng)集B在所有項(xiàng)集A出現(xiàn)的概率是置信度,通過置信度與期望置信度的比值反映了在加入“項(xiàng)集A出現(xiàn)”這個(gè)條件后,項(xiàng)集B的出現(xiàn)概率發(fā)生了多大的變化。在上例中,關(guān)聯(lián)規(guī)則的作用度為50%/15% ≈3. 3。一般情況,有用的關(guān)聯(lián)規(guī)則的作用度都應(yīng)該大于1,只有關(guān)聯(lián)規(guī)則的可信度大于期望可信度,才說明A的出現(xiàn)對(duì)B的出現(xiàn)有促進(jìn)作用,也說明了它們之間某種程序的相關(guān)性,如果作用度不大于1,則此關(guān)聯(lián)規(guī)則也就沒有意義了。興趣度(Interest measure)在數(shù)據(jù)挖掘中,并不是所有的強(qiáng)關(guān)聯(lián)規(guī)則都是足夠的有趣而值得向用戶提供。例如一個(gè)學(xué)校的5000名學(xué)生進(jìn)行早晨參與活動(dòng)與早餐的情況調(diào)查。數(shù)據(jù)顯示:60%的學(xué)生(3000)晨練,75%的學(xué)生(3750)吃早餐,40%的學(xué)生(2000)即晨練又吃早餐。假設(shè)最小支持度為40%,最小置信度為60%,則。是一強(qiáng)關(guān)聯(lián)規(guī)則,因?yàn)槠渲С侄葹?0%,置信度為2000/3000100% =66%,滿足最小支持?jǐn)?shù)和最小置信度的要求,然而以上規(guī)則是誤導(dǎo),因?yàn)榭偟某栽绮偷膶W(xué)生占75%,比66%還要大,為了修剪一些無趣的規(guī)則,即避免生成錯(cuò)覺的關(guān)聯(lián)規(guī)則,下面定義了興趣度這個(gè)度量值?;诓町愃枷氲呐d趣度定義,分母上的只是一個(gè)標(biāo)準(zhǔn)化因子,使得。根據(jù)這個(gè)式子,一條規(guī)則的興趣度越大(IR0)說明對(duì)這條規(guī)則越感興趣(即其實(shí)際利用價(jià)值越大);一條規(guī)則的興趣度越小(IR0) 說明對(duì)這條規(guī)則的反面規(guī)則越感興趣(即其反面規(guī)則的實(shí)際利用價(jià)值越大)?;诟怕收摰呐d趣度定義:。這樣整個(gè)關(guān)聯(lián)規(guī)則的評(píng)價(jià)體系就可以統(tǒng)一在概率論的范疇內(nèi)。即從概率論的角度說,興趣度I反映了關(guān)聯(lián)規(guī)則中A和B之間的關(guān)系究竟如何密切。通過定義可以說明,當(dāng)A和B相互獨(dú)立時(shí),他們同時(shí)發(fā)生就純屬偶然,他們同時(shí)發(fā)生的意義就不會(huì)被人們關(guān)注。即,當(dāng)時(shí),其所對(duì)應(yīng)的關(guān)聯(lián)規(guī)則是沒有意義的。相應(yīng)的,當(dāng)一條關(guān)聯(lián)規(guī)則的興趣度大于1說明對(duì)這條規(guī)則越感興趣;一規(guī)則的興趣度越小于1說明對(duì)這條規(guī)則的反面規(guī)則越感興趣。顯然,此種定義的興趣度不小于0。關(guān)聯(lián)規(guī)則描述了A的出現(xiàn)影響到B的出現(xiàn)。現(xiàn)實(shí)中,這樣的例子很多。例如超級(jí)市場(chǎng)利用收款機(jī)收集存儲(chǔ)了大量的售貨數(shù)據(jù),這些數(shù)據(jù)是一條條的購(gòu)買事務(wù)記錄,每條記錄存貯了事務(wù)處理時(shí)間,顧客購(gòu)買的物品,物品的數(shù)量及金額等。這些數(shù)據(jù)中常常隱含形式如下的關(guān)聯(lián)規(guī)則:在購(gòu)買牛奶的顧客當(dāng)中,有70%的人同時(shí)購(gòu)買了面包。這些關(guān)聯(lián)規(guī)則很有價(jià)值,商場(chǎng)管理人員可以根據(jù)這些關(guān)聯(lián)規(guī)則更好的規(guī)劃商場(chǎng),如將面包和牛奶這樣的商品擺放在一起,能夠促進(jìn)銷售。一些數(shù)據(jù)不像售貨數(shù)據(jù)那樣很容易就能看出一個(gè)事務(wù)是許多物品的集合,但稍微轉(zhuǎn)換一下思考角度,仍然可以像售貨數(shù)據(jù)一樣處理。比如人壽保險(xiǎn),一份保單就是一個(gè)事務(wù)。保險(xiǎn)公司在接受保險(xiǎn)前,往往需要記錄投保人詳盡的信息,有時(shí)還要到醫(yī)院做身體檢查。保單上記錄有投保人的年齡、性別、健康狀況、工作單位、工作地址、工資水平等。這些投保人的個(gè)人住處就可以看作事務(wù)中的樣品。通過分析這些數(shù)據(jù),可以得到類似以下這樣的關(guān)聯(lián)規(guī)則:年齡在40歲以上,區(qū)的投保人當(dāng)中歲以上是物品甲,有45%的曾經(jīng)向保險(xiǎn)公司索賠過。在這條規(guī)則中。工作在年齡在,工作在A區(qū)是物品乙。向保險(xiǎn)公司索賠過則是物品丙。可以看得出來,A區(qū)可能污染比較嚴(yán)重,環(huán)境比較差,導(dǎo)致工作在該區(qū)的人健康狀況不好,索賠率也相對(duì)比較高。 關(guān)聯(lián)規(guī)則的分類我們將關(guān)聯(lián)規(guī)則按不同的情況進(jìn)行分類:基于規(guī)則中處理的變量的類別,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。布爾型關(guān)聯(lián)規(guī)則處理的值都是離散的、種類化的,它顯示了這些變量之間的關(guān)系;值型關(guān)聯(lián)規(guī)則可以和多維關(guān)聯(lián)或多層關(guān)聯(lián)規(guī)則結(jié)合起來,對(duì)數(shù)值型字段進(jìn)行處理,將其進(jìn)行動(dòng)態(tài)的分割,或者直接對(duì)原始的數(shù)據(jù)進(jìn)行處理,值型關(guān)聯(lián)規(guī)則中也可以包含種類變量。例如:性別=“女”職業(yè)=“秘書”,是布爾型關(guān)聯(lián)規(guī)則:性別=“女”avg(收入)=1800,涉及的是數(shù)值類型,所以是一個(gè)數(shù)值型關(guān)聯(lián)規(guī)則?;谝?guī)則中數(shù)據(jù)的抽象層次,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。在單層的關(guān)聯(lián)規(guī)則中,所有的變量都沒有考慮到現(xiàn)實(shí)的數(shù)據(jù)是具有多個(gè)不同的層次的:在多層的關(guān)聯(lián)規(guī)則中,對(duì)數(shù)據(jù)的多層性已經(jīng)進(jìn)行了充分的考慮。例如:I BM臺(tái)式機(jī)Sony打印機(jī),是一個(gè)細(xì)節(jié)數(shù)據(jù)上的單層關(guān)聯(lián)規(guī)則;臺(tái)式機(jī)Sony打印機(jī),是一個(gè)較高層次和細(xì)節(jié)層次之間的多層關(guān)聯(lián)規(guī)則。基于規(guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分單維和多維的。在單維的關(guān)聯(lián)規(guī)則中,我們只涉及到數(shù)據(jù)的一個(gè)維,如用戶購(gòu)買的物品;而在多維的關(guān)聯(lián)規(guī)則中,要處理的數(shù)據(jù)將會(huì)涉及多個(gè)維。換成另一句話,單維關(guān)聯(lián)規(guī)則是處理單個(gè)屬性中的一些關(guān)系。多維關(guān)聯(lián)規(guī)則是處理各個(gè)屬性之間的某些關(guān)系。2.3 挖掘關(guān)聯(lián)規(guī)則的經(jīng)典算法介紹為了描述算法,我們給出了原事務(wù)數(shù)據(jù)庫(kù)如表23所示,每個(gè)項(xiàng)目賦一個(gè)整數(shù),Bread1, Coke2, Milk3, Beer4, Cake5,得整數(shù)化后的數(shù)據(jù)庫(kù)如表24設(shè)最小支持度為22%,因?yàn)橐还灿?個(gè)事務(wù),次,給定一個(gè)事務(wù)數(shù)據(jù)庫(kù)D,挖掘關(guān)聯(lián)規(guī)則的問題就是找出所有滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,即挖出所有的強(qiáng)規(guī)則,該問題可分解為兩個(gè)子問題:①找出所有頻繁項(xiàng)目集, 即出現(xiàn)頻率至少和預(yù)定義的最小支持一樣的項(xiàng)目集。②由頻繁項(xiàng)目集產(chǎn)生關(guān)聯(lián)規(guī)則。一旦找
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1