freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

高血壓診療系統(tǒng)畢業(yè)設(shè)計論文(參考版)

2025-07-30 04:47本頁面
  

【正文】 50。另外,還要感謝在校的各位同窗,感謝你們陪我度過了四年的大學(xué)時光!最后,特別感謝我的父母親人,是你們無時無刻不在的關(guān)心支持我走到現(xiàn)在,你們無私的愛是我勇往直前的動力源泉。結(jié)果固然重要,在跌倒之后收獲的成熟與方向更加可貴。在研究學(xué)習(xí)中我遇到種種困難,在分析與解決這些困難的同時我深刻感受到了畢設(shè)設(shè)計的意義所在。有待于模塊化開發(fā)糖尿病、胃炎等一系列中醫(yī)診療系統(tǒng),盡可能的發(fā)揮計算機在中醫(yī)醫(yī)學(xué)研究上的作用,最大限度的造福民眾。首先必須看到Apriori算法在數(shù)據(jù)挖掘過程中的局限性,有待于開發(fā)和使用效率更高的DRA等算法。同時,我們將不斷探索數(shù)據(jù)挖掘技術(shù)在其他方面的應(yīng)用,并且不斷改進算法、完善現(xiàn)有的模型。本文介紹了基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)案分析系統(tǒng)的設(shè)計和實現(xiàn)。本研究以自2001年1月一2005年10月中國中醫(yī)研究院基礎(chǔ)所胸痹急癥研究室主任、國家中醫(yī)藥管理局醫(yī)政司胸痹急癥協(xié)作組組長沈紹功先生醫(yī)案65份為醫(yī)案來源,以高血壓病為例,采用Apriori算法進行頻繁項集的搜索,所得醫(yī)案模型幾乎完全符合沈教授在治療高血壓病時常用的處方。在數(shù)據(jù)挖掘的知識模式中,關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)是比較重要的一種,本文的研究是圍繞著關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)展開的,在簡單介紹了與數(shù)據(jù)挖掘和關(guān)聯(lián)規(guī)則相關(guān)的內(nèi)容后,介紹了許多學(xué)者提出的一些挖掘關(guān)聯(lián)規(guī)則的算法,并提出了Apriori算法。如圖326所示。表323是最小置信度的不同對時間的影響,表324是最小置信度的不同對醫(yī)案模型中中藥味數(shù)的影響,表325是最小置信度的不同對醫(yī)案模型個數(shù)的影響。 對Apriori算法進行性能分析經(jīng)過試驗分析,最小置信度和醫(yī)案的數(shù)量是決定性能的關(guān)鍵因素。黃答作用于中樞及血管感受器,能反射性引起血壓下降,并有鎮(zhèn)靜和利尿作用。野葛根的主要有效成分葛根素具有R受體阻滯作用,可通過降低交感神經(jīng)功能而使血壓下降?,F(xiàn)代藥理研究,鉤藤堿可直接和反射性抑制血管運動中樞,以及阻滯交感神經(jīng)與神經(jīng)節(jié),使外周血管擴張、阻力降低。從用藥頻率表可知,在65醫(yī)案中,用中藥151種,其中鉤藤、黃連、當(dāng)歸、野葛根、川芍、黃答和澤瀉等藥的應(yīng)用頻率較高,這表明沈紹功教授治療高血壓病時喜用上述中藥。圖320 圖321 圖322 結(jié)果評價及性能分析 對高血壓醫(yī)案模型進行分析在沈紹功教授治療高血壓病的65份醫(yī)案中,共用中藥151種。順次把頻繁項集進行拆分,找出相對應(yīng)的中藥名稱,讀入文本文件。 第五步:記錄程序執(zhí)行結(jié)束后的時間并得出執(zhí)行時間,把頻繁項集以文本的方式導(dǎo)出。 第四步:產(chǎn)生頻繁k項集。第二步:產(chǎn)生頻繁1集首先把1項集清空,從頭到尾掃描臨時病歷,找到臨時病歷所對應(yīng)的藥方,把藥方中中藥的代號以及其出現(xiàn)的次數(shù)分別記入1項集的代號和頻數(shù)字段中,再從頭到尾遍歷1項集,把頻數(shù)小于相應(yīng)患者個數(shù)x最小置信度的項集刪除,生成頻繁1項集。第一步:記錄程序開始執(zhí)行的時間和初始化篩選出具有相應(yīng)特征的醫(yī)案的患者代號,讀入臨時病歷。②產(chǎn)生頻繁1集③產(chǎn)生頻繁2集④產(chǎn)生頻繁k集。在本研究中我們將分析對象設(shè)為A(譬如:A可以為癥狀中的“頭暈”、“頭痛”等,辨證分型中的“血癖”、“陽亢”等,診斷中的“高血壓病”、“冠心病”等),通過搜索頻繁項集,可以分析出各類癥狀與所用中藥、各類證型與所用中藥、各類疾病與所用中藥之間的相關(guān)性。推論1 由公式1很容易得出結(jié)論。數(shù)據(jù)結(jié)構(gòu)如表313,各子庫的詳細(xì)介紹如表3131313131和表319所示:表313 數(shù)據(jù)結(jié)構(gòu)一覽表表314 中藥庫表315 病例庫表316 藥方庫表317 臨時病例表318 1項集表319 2項集 算法設(shè)計的基本思想及實現(xiàn)過程 算法設(shè)計的基本思想公式1 其中,是置信度,是事務(wù)數(shù)據(jù)庫D中包含A的事務(wù)中包含B的百分比。我們所構(gòu)建的數(shù)據(jù)庫結(jié)構(gòu)是由若干子庫構(gòu)成的,有中藥庫、病歷庫、藥方庫。圖312 中醫(yī)醫(yī)案模型瀏覽界面 數(shù)據(jù)存儲結(jié)構(gòu)的設(shè)計數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計是對醫(yī)案數(shù)據(jù)進行符合數(shù)據(jù)挖掘要求的合理組織,這對揭示名老中醫(yī)用藥規(guī)律是極為重要的。 模型瀏覽模塊將創(chuàng)建好的模型以用戶易于理解的可視化方式顯示出來。圖311 中醫(yī)醫(yī)案模型創(chuàng)建界面數(shù)據(jù)挖掘要實現(xiàn)的一個重要目標(biāo)是尋找關(guān)聯(lián)規(guī)則,而其第一步則是要找到相應(yīng)的頻繁項集。圖39 中藥錄入界面圖310 醫(yī)案錄入界面 中醫(yī)醫(yī)案模型創(chuàng)建模塊該模塊是在中醫(yī)醫(yī)案數(shù)據(jù)集市基礎(chǔ)上,利用數(shù)據(jù)挖掘算法創(chuàng)建中醫(yī)醫(yī)案模型,如圖311所示。我們在具體操作中,逐一進行歸并。本研究對心血管病醫(yī)案數(shù)據(jù)預(yù)處理主要是數(shù)據(jù)的規(guī)范化。在進行錄入以前必須對原始的醫(yī)案數(shù)據(jù)進行數(shù)據(jù)預(yù)處理。圖38 中醫(yī)醫(yī)案分析系統(tǒng)體系結(jié)構(gòu)圖 功能模塊中醫(yī)醫(yī)案分析系統(tǒng)由三個功能模塊組成,包括:原始數(shù)據(jù)的錄入模塊、中醫(yī)醫(yī)案模型創(chuàng)建模塊、模型瀏覽模塊。第一部分是醫(yī)案的錄入、查詢、刪除部分,該部分為中醫(yī)醫(yī)案分析系統(tǒng)提供原始數(shù)據(jù)。 系統(tǒng)體系結(jié)構(gòu)中醫(yī)醫(yī)案分析系統(tǒng)以門診醫(yī)案為數(shù)據(jù)源,通過數(shù)據(jù)清洗、轉(zhuǎn)換、匯總、抽取等技術(shù)手段,構(gòu)建數(shù)據(jù)集市,在數(shù)據(jù)集市的基礎(chǔ)上,利用數(shù)據(jù)挖掘技術(shù),構(gòu)造中醫(yī)醫(yī)案模型。②對醫(yī)案進行查詢?;谠紨?shù)據(jù)的可靠性、準(zhǔn)確性和完整性方面的考慮,本研究以自2001年1月一2005年10月中國中醫(yī)研究院基礎(chǔ)所胸痹急癥研究室主任、國家中醫(yī)藥管理局醫(yī)政司胸痹急癥協(xié)作組組長沈紹功先生醫(yī)案65份為醫(yī)案來源,以高血壓病為例,采用Apriori算法進行頻繁項集的搜索,所得醫(yī)案模型幾乎完全符合沈教授在治療高血壓病時常用的處方。圖27 所給數(shù)據(jù)庫對應(yīng)的關(guān)聯(lián)第三章 中醫(yī)醫(yī)案分析系統(tǒng)的實施及結(jié)果分析中醫(yī)醫(yī)案分析系統(tǒng)是在Windows XP (CPU為P41600MHz,內(nèi)存為256M)平臺上,Access2000和Visual BAS工C6. 0的環(huán)境下,基于當(dāng)今最前沿的數(shù)據(jù)挖掘技術(shù)實現(xiàn)的。同樣可得{1, 2, 5}也是頻繁3項集。依次執(zhí)行直到不能產(chǎn)生新的頻繁項目集。的有向邊,那么項目集被擴展為(k +1)項目集。第三步:基于關(guān)聯(lián)圖產(chǎn)生頻繁k項集(k 2) , DLG算法用k項目集的最后項來擴展項目集為(k +1)項集。第二步:構(gòu)造關(guān)聯(lián)圖,用以表示頻繁項目之間的關(guān)聯(lián)。就前面給出的數(shù)據(jù)庫:=(1DD11D111),=(1111D1D11),= (DD1D11111),=(D1DIDDDDD), =(1DDDDDDID)。DLG算法DLG算法共有三步:第一步:掃描數(shù)據(jù)庫一遍,統(tǒng)計每一個項目出現(xiàn)的次數(shù),且為每一個項目建立比特向量,每個比特向量的長度是數(shù)據(jù)庫中事物的數(shù)目。FP增長方法將發(fā)現(xiàn)長頻繁模式的問題轉(zhuǎn)換成遞歸地發(fā)現(xiàn)一些短模式,然后連接后綴。然后構(gòu)造它的(條件)FP一樹,并遞歸地在該樹上進行挖掘。這樣,數(shù)據(jù)庫頻繁模式的挖掘問題就轉(zhuǎn)換成挖掘FP一樹問題。一般地,當(dāng)為一個事務(wù)考慮增加分枝時,沿共同前綴上的每個節(jié)點的計數(shù)增加1,為跟隨在前綴之后的項創(chuàng)建節(jié)點并鏈接。第二次掃描數(shù)據(jù)庫。頻繁項的集合按支持度計數(shù)的遞減排序,用L表示。中具有與該表項相同itemname域的第一個節(jié)點。③頻繁項頭表(frequent item header table)的每個表項(entry)由兩個域組成:itemname, node_ link。②每個項前綴子樹的節(jié)點有三個域:itemname, count, node_ link 。該算法將原數(shù)據(jù)庫以高壓縮的方式(FP一樹)存儲在內(nèi)存中,將原來從磁盤的讀取工作直接放入內(nèi)存中進行,內(nèi)存中數(shù)據(jù)的存取比在磁盤中快數(shù)萬倍。下面介紹的FPGrowth算法和DLG算法就可以挖掘全部項集而不產(chǎn)生候選并能減少數(shù)據(jù)庫的掃描次數(shù)。此外,如果要生成一個很長的規(guī)則的時候,要產(chǎn)生的中間元素也是巨大的。當(dāng)支持度閾值太低或產(chǎn)生的模式長度太長時,基于候選項集的算法可能會浪費很多不必要的花費。 不產(chǎn)生候選挖掘頻繁項集算法上面介紹的是基于Apriori的頻繁項集挖掘方法,在許多情況下,Apriori算法及其優(yōu)化采用候選、檢驗的方法產(chǎn)生關(guān)聯(lián)規(guī)則。圖26 通過劃分挖掘事務(wù)壓縮(壓縮進一步迭代掃描的事務(wù)數(shù))一個基本的原理就是當(dāng)一個事務(wù)不包含長度為k的大項集,則必然不包含長度為k +1的大項集。該算法的正確性是由每一個可能的頻繁至少在一個分塊中是頻繁集保證的。第一遍,先把數(shù)據(jù)庫中的事務(wù)從邏輯上分成n個非重疊的部分,使得每個部分能夠放入內(nèi)存進行處理,對每一部分找出其頻繁項集(局部頻繁項集),然后匯總產(chǎn)生全局候選項集?;趧澐值姆椒āT摲椒ɡ肏ash表來保存所有頻繁項集。由于中的候選集很多,所以在刪除步驟中所涉及的計算量(時間)是非常大的,為了減少的大小,就需要利用Apriori性質(zhì),一個非頻繁(k1)項集不可能成為頻繁k項集的一個子集。但是該方法存在一個很大的缺點就是產(chǎn)生的結(jié)果不精確,而且如何對數(shù)據(jù)庫進行合理取樣而盡可能不丟失信息是目前人們已經(jīng)注意到,但尚未很好解決的公開問題。該方法不但能夠減少數(shù)據(jù)庫掃描的次數(shù),而且能夠減少CPU和I/O負(fù)擔(dān),在執(zhí)行效率上有很大提高。由于以上原因,人們對Apriori算法進行了一定的改進,希望能夠在提高算法的可靠性、高效性及擴展性等方面做一些工作:基于采樣的方法。主要是因為數(shù)據(jù)庫掃描次數(shù)太多,尋找每個k項集都需要掃描數(shù)據(jù)庫一次,共需要掃描數(shù)據(jù)庫k次。當(dāng)數(shù)據(jù)庫太大或支持度、信任度閾值太低時產(chǎn)生的規(guī)則太多。該算法在產(chǎn)生候選項目集的時候只用到前一次迭代所產(chǎn)生的頻繁項目集,而沒有考慮數(shù)據(jù)庫中的事務(wù),同時還使用了連接和刪除技術(shù),這樣就會產(chǎn)生比AIS算法少的候選集。但由于{I 1,I2,I3,I5}的支持頻度小于最小支持閾值,因此從中除去{I1,I2,I3,I5},從而得到。利用來獲得候選4項集。是的一個超集,其中的各元素(項集)不一定都是頻繁項集,但所有的頻繁k項集一定都在}k中,即有掃描一遍數(shù)據(jù)庫就可以決定中各候選項集(元素)的支持頻度,并由此獲得中各個元素(頻繁k項集)。設(shè)和為中的兩個項集(元素),記號表示中的第J個項,假設(shè)交易數(shù)據(jù)庫中各交易記錄中各項均已按字典排序,若h和l:中的前k2項是相同的,也就是說若有,則中和的內(nèi)容就可以連接到一起。①連接步驟。其基本思想是:掃描數(shù)據(jù)庫一遍統(tǒng)計各數(shù)據(jù)項,從而找出頻繁1項集,然后利用來挖掘,即頻繁2項集;不斷如此循環(huán)下去直到無法發(fā)現(xiàn)更多的頻繁k項集為止,每挖掘一層就需要掃描整個數(shù)據(jù)庫一遍。這個算法有個很大的缺陷就是產(chǎn)生過多的小候選,因此效率非常低。 表23原事物數(shù)據(jù)庫 表24整數(shù)化的數(shù)據(jù)庫 AIS算法當(dāng)數(shù)據(jù)庫被掃描時,候選集被產(chǎn)生并計數(shù),每讀一個事務(wù),決定上次掃描找到的頻繁集中有哪些包含在事務(wù)中。一旦找出了頻繁項目集,則由它們產(chǎn)生強相關(guān)規(guī)則就簡單了,因為可以來計算置信度,其中是包含的事物集,是包含A的事物集。2.3 挖掘關(guān)聯(lián)規(guī)則的經(jīng)典算法介紹為了描述算法,我們給出了原事務(wù)數(shù)據(jù)庫如表23所示,每個項目賦一個整數(shù),Bread1, Coke2, Milk3, Beer4, Cake5,得整數(shù)化后的數(shù)據(jù)庫如表24設(shè)最小支持度為22%,因為一共有9個事務(wù),次,給定一個事務(wù)數(shù)據(jù)庫D,挖掘關(guān)聯(lián)規(guī)則的問題就是找出所有滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,即挖出所有的強規(guī)則,該問題可分解為兩個子問題:①找出所有頻繁項目集, 即出現(xiàn)頻率至少和預(yù)定義的最小支持一樣的項目集。換成另一句話,單維關(guān)聯(lián)規(guī)則是處理單個屬性中的一些關(guān)系?;谝?guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分單維和多維的。在單層的關(guān)聯(lián)規(guī)則中,所有的變量都沒有考慮到現(xiàn)實的數(shù)據(jù)是具有多個不同的層次的:在多層的關(guān)聯(lián)規(guī)則中,對數(shù)據(jù)的多層性已經(jīng)進行了充分的考慮。例如:性別=“女”職業(yè)=“秘書”,是布爾型關(guān)聯(lián)規(guī)則:性別=“女”avg(收入)=1800,涉及的是數(shù)值類型,所以是一個數(shù)值型關(guān)聯(lián)規(guī)則。 關(guān)聯(lián)規(guī)則的分類我們將關(guān)聯(lián)規(guī)則按不同的情況進行分類:基于規(guī)則中處理的變量的類別,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。向保險公司索賠過則是物品丙。在這條規(guī)則中。這些投保人的個人住處就可以看作事務(wù)中的樣品。保險公司在接受保險前,往往需要記錄投保人詳盡的信息,有時還要到醫(yī)院做身體檢查。一些數(shù)據(jù)不像售貨數(shù)據(jù)那樣很容易就能看出一個事務(wù)是許多物品的集合,但稍微轉(zhuǎn)換一下思考角度,仍然可以像售貨數(shù)據(jù)一樣處理。這些數(shù)據(jù)中常常隱含形式如下的關(guān)聯(lián)規(guī)則:在購買牛奶的顧客當(dāng)中,有70%的人同時購買了面包?,F(xiàn)實中,這樣的例子很多。顯然,此種定義的興趣度不小于0。即,當(dāng)時,其所對應(yīng)的關(guān)聯(lián)規(guī)則是沒有意義的。即從概率論的角度說,興趣度I反映了關(guān)聯(lián)規(guī)則中A和B之間的關(guān)系究竟如何密切。基于概率論的興趣度定義:?;诓町愃枷氲呐d趣度定義,分母上的只是一個標(biāo)準(zhǔn)化因子,使得。假設(shè)最小支持度為40%,最小置信度為60%,則。例如一個
點擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1