freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

高血壓診療系統(tǒng)畢業(yè)設(shè)計(jì)(論文)(參考版)

2024-08-30 18:16本頁面
  

【正文】 第一部分是醫(yī)案的錄入、查詢、刪除部分,該部分為中醫(yī)醫(yī)案分析系統(tǒng)提供原始數(shù)據(jù) 。 系統(tǒng)體系結(jié)構(gòu) 中醫(yī)醫(yī)案分析系統(tǒng)以門診醫(yī)案為數(shù)據(jù)源,通過數(shù)據(jù)清洗、轉(zhuǎn)換、匯總、抽取等技術(shù)手段,構(gòu)建數(shù)據(jù)集市,在數(shù)據(jù)集市的基礎(chǔ)上,利用數(shù)據(jù)挖掘技術(shù),構(gòu)造中醫(yī)醫(yī)案模型。②對(duì)醫(yī)案進(jìn)行查詢 。基于原始數(shù)據(jù)的可靠性、準(zhǔn)確性和完整性方面的考慮, 本研究以自 2020 年 1 月一 2020 年 10 月 中國中醫(yī)研究院基礎(chǔ)所胸痹急癥研究室主任、國家中醫(yī)藥管理局醫(yī)政司胸痹急癥協(xié)作組組長沈紹功 先生醫(yī)案 65 份為醫(yī)案來 源,以高血壓病為例,采用 Apriori 算法進(jìn)行頻繁項(xiàng)集的搜索,所得醫(yī)案模型幾乎完全符合沈教授在治療高血壓病時(shí)常用的處方。 圖 27 所給數(shù)據(jù)庫對(duì)應(yīng)的關(guān)聯(lián) 北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 32 第三章 中醫(yī)醫(yī)案分析系統(tǒng)的實(shí)施及結(jié)果分析 中醫(yī)醫(yī)案分析系統(tǒng)是在 Windows XP (CPU 為 P41600MHz,內(nèi)存為 256M)平臺(tái)上,Access2020 和 Visual BAS 工 C6. 0 的環(huán)境下,基于當(dāng)今最前沿的數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)的。同樣可得 {1, 2, 5}也是頻繁 3項(xiàng)集。依次執(zhí)行直到不能產(chǎn)生新的頻繁項(xiàng)目集。的有向邊,那么項(xiàng)目集 ? ?12,ki i i??? 被擴(kuò)展為 (k +1)項(xiàng)目集。 第三步 :基于關(guān)聯(lián)圖產(chǎn)生頻繁 k項(xiàng)集 (k 2) , DLG 算法用 k項(xiàng)目集的最后項(xiàng)來擴(kuò)展項(xiàng)目集為 (k +1)項(xiàng)集。 第二步 :構(gòu)造關(guān)聯(lián)圖,用以表示頻繁項(xiàng)目之間的關(guān)聯(lián)。就前面給出的數(shù)據(jù)庫 :1BV =(1DD11D111), 2BV =(1111D1D11), 3BV = (DD1D11111), 4BV =(D1DIDDDDD), 5BV =(1DDDDDDID)。 DLG 算法 DLG 算法共有三步: 第一步 :掃描數(shù)據(jù)庫一遍,統(tǒng)計(jì)每一個(gè)項(xiàng)目出現(xiàn)的次數(shù),且為每一個(gè)項(xiàng)目建立比特向量,每個(gè)比特向量的長度 是數(shù)據(jù)庫中事物 的數(shù)目。 FP增長方法將發(fā)現(xiàn)長頻繁模式的問題轉(zhuǎn)換成遞歸地發(fā)現(xiàn)一些短模式,然后連接后綴。然后構(gòu)造它的 (條件 )FP 一樹,并遞歸地在該樹上進(jìn)行挖掘。這樣,數(shù)據(jù)庫頻繁模式的挖掘問題就轉(zhuǎn)換成挖掘FP 一樹問題。一般地,當(dāng)為一個(gè)事務(wù)考慮增加分枝時(shí),沿共同前綴上的每個(gè)節(jié)點(diǎn)的計(jì)數(shù)增加 1,為跟隨在前綴之后的項(xiàng)創(chuàng)建節(jié)點(diǎn)并鏈接。第二次掃描數(shù)據(jù)庫。頻繁項(xiàng)的集合按支持度計(jì)數(shù)的遞減排序,用 L 表示。中具有與該表項(xiàng)相同 itemname 域的第一個(gè)節(jié)點(diǎn)。 ③頻繁項(xiàng)頭表 (frequent item header table)的每個(gè)表項(xiàng) (entry)由兩個(gè)域組成 :itemname, node_ link。 ②每個(gè)項(xiàng)前綴子樹的節(jié)點(diǎn)有三個(gè)域 :itemname, count, node_ link 。該算法將原數(shù)據(jù)庫以高壓縮的方式 (FP 一樹 )存儲(chǔ)在內(nèi)存中,將原來從磁盤的讀取工作直接放入內(nèi)存中進(jìn)行,內(nèi)存中數(shù)據(jù)的存取比在磁盤中快數(shù)萬倍。下面介紹的 FPGrowth 算法和 DLG 算法就可以挖掘全部項(xiàng)集而不產(chǎn) 生候選并能減少數(shù)據(jù)庫的掃描次數(shù)。此外,如 果要生成一個(gè)很長的規(guī)則的時(shí)候,要產(chǎn)生的中間元素也是巨大的。當(dāng)支持度 閾 值太低或產(chǎn)生的模式長度太長時(shí),基于候選項(xiàng)集的算法可能會(huì)浪費(fèi)很多不必要的花費(fèi)。 不產(chǎn)生候選挖掘頻繁項(xiàng)集算法 上面介紹的是基于 Apriori 的頻繁項(xiàng)集挖掘方法,在許多情況下, Apriori 算法及其優(yōu)化采用候選、檢驗(yàn)的方法產(chǎn)生關(guān)聯(lián)規(guī)則。 圖 26 通過劃分挖掘 事務(wù)壓縮 (壓縮進(jìn)一步迭代掃描的事務(wù)數(shù) )一個(gè)基本的原理就是當(dāng)一個(gè)事務(wù)不包含長度為 k 的大項(xiàng)集,則必然不包含長度為 k +1 的大項(xiàng)集。該算法的正確性是由每一個(gè)可能的頻繁至少在一個(gè)分塊中是頻繁集保證的。第一遍,先把數(shù)據(jù)庫中的事務(wù)從邏輯上分成 n 個(gè)非重疊的部分,使得每個(gè)部分能夠放入內(nèi)存進(jìn)行處理,對(duì)每一部分找出其頻繁項(xiàng)集 (局部頻繁項(xiàng)集 ),然后匯總產(chǎn)生全局候選項(xiàng)集。 基于劃分的方法。該方法利用 Hash 表來保存所有頻繁項(xiàng)集。由于 kC 中的候選集很多,所以在刪除步驟中所涉及的計(jì)算量 (時(shí)間 )是非常大的,為了減少 kC 的大小,就需要利用 Apriori 性質(zhì),一個(gè)非頻繁 (k1)北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 28 項(xiàng)集不可能成為頻繁 k項(xiàng)集的一個(gè)子集。但是該方法存在一個(gè)很大的缺點(diǎn)就是產(chǎn)生的結(jié)果不精確,而且如何對(duì)數(shù)據(jù)庫進(jìn)行合理取樣而盡可能不丟失信息是目前人們已經(jīng)注意到,但尚未很好解決的公開問題。該方法不但能夠減少數(shù)據(jù)庫掃描 的次數(shù),而且能夠減少 CPU 和 I/O 負(fù)擔(dān),在執(zhí)行 效率上有很大提高。 由于以上原因,人們對(duì) Apriori 算法進(jìn)行了一定的改進(jìn),希望能夠在提高算法的可靠性、高效性及擴(kuò)展性等方面做一些工作 : 基于采樣的方法 。主要是因?yàn)閿?shù)據(jù)庫掃描次數(shù)太多,尋找每個(gè) k項(xiàng)集都需要掃描數(shù)據(jù)庫一北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 26 次,共需要掃描數(shù)據(jù)庫 k 次。當(dāng)數(shù)據(jù)庫太大或支持度、信任度閾 值太低時(shí)產(chǎn)生的規(guī)則太多。 該算法在產(chǎn)生候選項(xiàng)目集的時(shí)候只用到前一次迭代所產(chǎn)生的頻繁項(xiàng)目集,而沒有考慮數(shù)據(jù)庫中的事務(wù),同時(shí)還使用了連接和刪除技術(shù),這樣就會(huì)產(chǎn)生比 AIS 算法少的候選集。但由于 {I 1,I2, I3,I5}的支持頻度小于最小支持閾 值,因此從 4C 中除去 {I1,I2,I3,I5},從而得到 4C 。 利用 3L 來獲得候選 4項(xiàng)集 4C 。 kC 是 kL 的一個(gè)超集,其中的各元素 (項(xiàng)集 )不一定都是頻繁項(xiàng)集,但所有的頻繁 k項(xiàng)集一定 都在 }k 中,即有 kkLC? 掃描一遍數(shù)據(jù)庫就可以決定 kC 中各候選項(xiàng)集 (元素 )的支持頻度,并由此獲得 kL 中各個(gè)元素 (頻繁 k項(xiàng)集 )。 設(shè) 1l 和 2l 為 1kL? 中的兩個(gè)項(xiàng)集 (元素 ),記號(hào) ??Jil? 表示 il 中的第 J 個(gè)項(xiàng),假設(shè)交易數(shù) 據(jù)庫中各交易記錄中各項(xiàng)均已 按字典排序,若 h 和 l:中的前 k2 項(xiàng)是相同的, 也就是說若有? ? ? ? ? ?1 2 1( 1 2 ) ( 2 )l l l k? ? ???? ? ?? ? ?12( 1 1 )l k l k? ? ? ?,則 kl 中 1l 和 2l 的內(nèi)容就可以連接到一起。①連接步驟。其基本思想是:掃描數(shù)據(jù)庫一遍統(tǒng)計(jì)各數(shù)據(jù)項(xiàng),從而找出頻繁 1項(xiàng)集 1L ,然后利用 1L 來挖掘 2L ,即頻繁 2項(xiàng)集 ; 不斷如此循環(huán)下去直到無法發(fā)現(xiàn)更多的頻繁 k項(xiàng)集為止,每挖掘一層 Lk 就需要掃描整個(gè)數(shù)據(jù)庫一遍。這個(gè)算法有個(gè)很大的缺陷就是產(chǎn)生過多的小候選,因此效率非常低。 表 23 原事物數(shù)據(jù)庫 表 24 整數(shù)化的數(shù)據(jù)庫 北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 25 AIS算法 當(dāng)數(shù)據(jù)庫被掃描時(shí),候選集被產(chǎn)生并計(jì)數(shù),每讀一個(gè)事務(wù),決定上次掃描找到的頻繁集中有哪些包含在事務(wù)中。一旦找出了頻繁項(xiàng)目集,則由它們產(chǎn)生強(qiáng)相關(guān)規(guī)則就簡單了,因?yàn)榭梢詓up _ ( )( ) ( / ) sup _ ( )port c ount A Bc onfi de nc e A B P A B port c ount A?? ? ?來計(jì)算置信度,其中s u p _ ( )port count A B?是包含 AB? 的事物集, sup _ ( )port count A是包含 A 的事物集。 北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 24 2. 3 挖掘關(guān)聯(lián)規(guī)則的經(jīng)典算法 介紹 為了描述算法,我們給出了原事務(wù)數(shù)據(jù)庫如表 23 所示,每個(gè)項(xiàng)目賦一個(gè)整數(shù),Bread1, Coke2, Milk3, Beer4, Cake5,得整 數(shù)化后的數(shù)據(jù)庫如表 24 設(shè)最小支持度為22%,因?yàn)橐还灿?9 個(gè)事務(wù), (9 22% 2) 2??次,給定一個(gè)事務(wù)數(shù)據(jù)庫 D,挖掘關(guān)聯(lián)規(guī)則的問題就是找出所有滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,即挖出所有的強(qiáng)規(guī)則,該問題可分解為兩個(gè)子問題:①找出所有頻繁項(xiàng)目集, 即出現(xiàn)頻率至少和預(yù)定義的最小支持一樣的項(xiàng)目集。換成另一句話,單維關(guān)聯(lián)規(guī)則是處理單個(gè)屬性中的一些關(guān)系 。 基于規(guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分單維和多維的。 在單層的關(guān)聯(lián)規(guī)則中,所有的變量都沒有考慮到現(xiàn)實(shí)的數(shù)據(jù)是具有多個(gè)不同的層次的 :在多層的關(guān)聯(lián)規(guī)則中,對(duì)數(shù)據(jù)的多層性已經(jīng)進(jìn)行了充分的考慮。例如:性別 =“女” ? 職業(yè) =“秘書”,是布爾型關(guān)聯(lián)規(guī)則:性別 =“女” ? avg(收入) =1800,涉及的是數(shù)值類型,所以是一個(gè)數(shù)值型關(guān)聯(lián)規(guī)則。 關(guān)聯(lián)規(guī)則的分類 我們將關(guān)聯(lián)規(guī)則按不同的情況進(jìn)行分類: 基于規(guī)則中處理的變量的類別,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。向保險(xiǎn)公司索賠過則是物品丙。在這條規(guī)則中。這些投保人的個(gè)人住處就可以看作事務(wù)中北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 23 的樣品。保險(xiǎn)公司在接受保險(xiǎn)前,往往需要記錄投保人詳盡的信息,有時(shí)還要到醫(yī)院做身體檢查。一些數(shù)據(jù)不像售貨數(shù)據(jù)那樣很容易就能看出一個(gè)事務(wù)是許多物品的集合,但稍微轉(zhuǎn)換一下思考角度,仍然可以像售貨數(shù)據(jù)一樣處理。這些數(shù)據(jù)中常常隱含形式如下的關(guān)聯(lián)規(guī)則 :在購買牛奶的顧客當(dāng)中,有 70%的人同時(shí)購買了面包。 現(xiàn)實(shí)中,這樣的例子很多。顯然,此種定義的興趣度不小于 0。即,當(dāng) ? ? ? ? ? ?S A B S A S B? 時(shí),其所對(duì)應(yīng)的關(guān)聯(lián)規(guī)則是沒有意義的。即從概率論的角度說,興趣度 I 反映了關(guān)聯(lián)規(guī)則中 A 和 B 之間的關(guān)系究竟如何密切。 基于概率論的興趣度定義: ()( ) ( )S A BI S A S B??。 基于差異思想的興趣度定義 ? ?()m ax , ( )RR RC S BI C S B??,分母上的 ? ?max , ( )RC S B 只是一個(gè)標(biāo)準(zhǔn)化因子,使得 1RI ? 。假設(shè)最小支北京科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 22 持度為 40%,最小置信度為 60%,則 ?晨 練 吃 早 餐 。例如一個(gè)學(xué)校的 5000 名學(xué)生進(jìn)行早晨參與活動(dòng)與早餐的情況調(diào)查。一般情況,有用的關(guān)聯(lián)規(guī)則的作用度都應(yīng)該大于 1,只有關(guān)聯(lián)規(guī)則的可信度大于期望可信度,才說明 A 的出現(xiàn)對(duì) B 的出現(xiàn)有促進(jìn)作用,也說明了它們之間某種程序的相關(guān)性,如果作用度不大于 1,則此關(guān)聯(lián)規(guī)則也就沒有意義了。因?yàn)轫?xiàng)集 B 在所有事務(wù)中出現(xiàn)的概率是期望置信度 ; 而項(xiàng)集 B 在所有項(xiàng)集 A 出現(xiàn)的概率是置信度,通過置信度與期望置信度的比值反映 了在加入“項(xiàng)集 A 出現(xiàn)”這個(gè)條件后,項(xiàng)集 B 的出現(xiàn)概率發(fā)生了多大的變化。 作用度 (Lift) 作用度是置信度與期望置信度的比值,即 ? ?P (B/A) / P B。期 望置信度描述在沒有任何條件影響時(shí),物品集 B 在所有事物中出現(xiàn)的概率有多大。 同時(shí)滿足最小支持度閾值和最小置信度閾 值的規(guī)則稱作強(qiáng)規(guī)則。在上例中,如果有 200 條記錄包含 A,則關(guān)聯(lián)規(guī)則AB? 的置信度為 100/200 100% =50%。滿足最小支持度的項(xiàng)集稱之為頻繁項(xiàng)集。例如,一事務(wù)數(shù)據(jù)庫中共有 1000 條記錄,其中同時(shí)包含 A 和 B 的 100條,則關(guān)聯(lián)規(guī)則 AFB 的支持度為 100/ 1000 100% =10%。第一步要從大量的事物數(shù)據(jù)中找出頻繁項(xiàng)集,每次執(zhí)行部要掃描一次數(shù)據(jù)庫,需要耗費(fèi)大量的時(shí)間和空間,所以對(duì)關(guān)聯(lián)規(guī)則算法的研究工作主要是對(duì)第一步算法的優(yōu)化或改進(jìn)。 Support ( ) ( )A B P A B? ? ? Confidence ()( ) 10 0% ( / )()P A BA B P B APA?? ? ? ? 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的過程大體為兩步,如下圖所示,第一步是利用頻繁項(xiàng)集搜索算法從事物數(shù)據(jù)中找出所有大于或等于。 最小支持度表示項(xiàng)集的最低實(shí)用性,最小置信度表示關(guān)聯(lián)規(guī)則的最低可靠性。描述了 A 和 B 兩個(gè)項(xiàng)集同時(shí)出現(xiàn)的概率 .定義為 :support(A?B)=P(A? B)。一條關(guān)聯(lián)規(guī)則就是一個(gè)形如 AB? 的蘊(yùn)涵式,其中 AT? , BI? , AB? ?? 。一組項(xiàng)的集合構(gòu)成一個(gè)事務(wù) T,使得 TI? 每一個(gè)事物都與唯一的標(biāo)識(shí)符 TID 相聯(lián)。 關(guān)聯(lián)規(guī)則的有關(guān)定義 設(shè) ??12, , , nI i i i? ???? 是 n 個(gè)不同項(xiàng) (Item)的集合, (1 )ji i n?? 表示集合中的第 j 項(xiàng)。后來有不少學(xué)者對(duì)關(guān)聯(lián)規(guī)則的挖掘問題進(jìn)行了大量的研究。根據(jù)關(guān)聯(lián)規(guī)則提供的信息可以用做商品銷售目錄設(shè)計(jì)、商品布置、針對(duì)性的營銷等。關(guān)聯(lián)規(guī)則挖掘的一般對(duì)象是事務(wù)數(shù)據(jù)庫,起初主要應(yīng)用于零售業(yè),比如超級(jí)市 場的銷售管理。 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則介紹 數(shù)據(jù)挖掘所發(fā)現(xiàn)出的知識(shí)種類中關(guān)聯(lián)規(guī)則的應(yīng)用是目前數(shù)據(jù)挖掘領(lǐng)域中研究最為廣泛的課題之一。由于數(shù)據(jù)挖掘使用的數(shù)據(jù)來自于實(shí)際的數(shù)據(jù)庫,所要處理的數(shù)據(jù)量可能很大,因此數(shù)據(jù)挖掘算法的效率和可擴(kuò)充性就顯得尤為重要;此外,數(shù)據(jù)挖掘所處理的數(shù)據(jù)由于來自于現(xiàn)實(shí)世界,數(shù)據(jù)的完整性、一致性和正確性都很難保證,如何將這些數(shù)據(jù)加工成 算法可以接收的數(shù)據(jù)也需要進(jìn)行深入的研究;再者,數(shù)據(jù)挖掘可以利用目前數(shù)據(jù)庫技術(shù)所取得的研究成果來加快挖掘過程,
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1