freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹分類算法在教學(xué)分析中的應(yīng)用畢業(yè)論文-全文預(yù)覽

  

【正文】 ,和信息增益。 對(duì)非離散數(shù)據(jù)也能處理。更精確地講,一個(gè)屬性 A 相對(duì)樣例集合 S的信息增益Gain(S,A)被定義為: G( S,A) =Info( S) Info( A) 最后根據(jù)信 息增益最大的原則選擇根節(jié)點(diǎn)來構(gòu)成決策樹。 安徽新華學(xué)院 2020 屆本科畢業(yè)論文(設(shè)計(jì)) 12 Info( S) = -1ni??Pilog2( Pi)=- P○+ log2 P○+ P○- log2 P○- 上述公式中, p+代表正樣例,而 p則代表反樣例 。最后得到的一棵決策樹,它可以用來對(duì)新的樣本進(jìn)行分類。 ID3 算法的大概過程是:我們?cè)囂叫缘倪x擇一個(gè)屬性放置在 根節(jié)點(diǎn),并對(duì)該屬性的每個(gè)值產(chǎn)生一個(gè)分支。 安徽新華學(xué)院 2020 屆本科畢業(yè)論文(設(shè)計(jì)) 11 圖 決策樹 決策樹的主要算法 近年來,決策樹方法在很多機(jī)器學(xué)習(xí)、知識(shí)的探究等過程中得到了廣泛的應(yīng)用。一般的數(shù)據(jù)挖掘工具,允許選擇分裂條件和修剪規(guī)則,以 及控制 參數(shù)(最小結(jié)點(diǎn)的大小, 最大樹的深度等等),來限制決策樹的。決策樹的主要作用是揭示數(shù)據(jù)中的結(jié)構(gòu)化信息。在數(shù)據(jù)挖掘中決策樹算法是目前數(shù)據(jù)挖掘領(lǐng)域中應(yīng)用的最廣泛、最流行的推理算法之一。盡管這可能包括時(shí)間相關(guān)數(shù)據(jù)的區(qū)分 、特征化、關(guān)聯(lián)和相關(guān)分析、預(yù)測(cè)、分類或聚類,這類分析的不同特點(diǎn)包括序列或周期模式匹配、時(shí)間序列數(shù)據(jù)分析和基于相似性的數(shù)據(jù)分析。這些數(shù)據(jù)對(duì)象是離群點(diǎn)( outlier)。 簡(jiǎn)而言之,就是分析兩個(gè)事物之間的一些特性,通過一個(gè)事物去預(yù)測(cè)另外一個(gè)事物,這就是關(guān)聯(lián)分析。 關(guān)聯(lián)分析展示了屬性與值頻繁的在給定的數(shù)據(jù)集中的一起出現(xiàn)的條件。訓(xùn)練集由一組數(shù)據(jù)庫(kù)記錄或元組構(gòu)成,每個(gè)元組是一個(gè)由有關(guān)字段(又稱屬性或特征)值組成的特征向量,此外,訓(xùn)練樣本還有一個(gè)類別標(biāo)記。描述性挖掘任務(wù)描述數(shù)據(jù)庫(kù)中數(shù)據(jù)的一般性質(zhì),而預(yù)測(cè)性挖掘任務(wù)是指對(duì)當(dāng)前數(shù)據(jù)進(jìn)行處理、分析和推斷,以做出相應(yīng)的預(yù)測(cè)。 ( 4)粗糙集 粗糙集算法將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,每一被劃分的集合被稱為概念,主要思想是利用已知的知識(shí)庫(kù),將不精確或不確定的知識(shí)用已知的知識(shí)庫(kù)中的知識(shí)來近似刻畫處理 粗糙集理論,是 繼 模糊集、證據(jù)理論、 概率論 之后的又一個(gè) 可以處理不確定性的數(shù)學(xué)工具。決策樹僅有單一輸出,若欲有復(fù)數(shù)輸出,可以建立獨(dú)立的決策樹以處理不同輸出 [8] ( 3)遺傳算法 遺傳算法是一種空間搜索方法,遺傳算法的搜索方向是由算法的適應(yīng)函數(shù)來決定的,用擬生物化的人工運(yùn)算過程進(jìn)行一代一代的周而復(fù)始的演化,最終得出一個(gè)最佳結(jié)果。 關(guān)聯(lián)規(guī)則是描述了數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間所存在的關(guān)系的規(guī)則,即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn)可導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系 [7]。 如果數(shù)據(jù)挖掘過程中的發(fā)現(xiàn)的知識(shí)不能滿足用戶的需求,我們則需要重新對(duì)數(shù)據(jù)進(jìn)行處理,用其他的數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)進(jìn)行挖掘,并分析結(jié)果,直到滿足用戶的需求。然后確定用什么數(shù)據(jù)挖掘算法對(duì)數(shù)據(jù)進(jìn)行挖掘,再利用數(shù)據(jù)挖掘的工具和一系列方法對(duì)之前所確定以及轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行分析、產(chǎn)生一個(gè)特定的有意義的模式以更好的對(duì)已處理好的數(shù)據(jù)進(jìn)行分析,獲取有用信息。 數(shù)據(jù)挖掘時(shí)對(duì)應(yīng)的數(shù)據(jù)量往往是非常大的,數(shù)據(jù)歸約是縮小所挖掘數(shù)據(jù)的規(guī)模,但保 持?jǐn)?shù)據(jù)的完整性。 數(shù)據(jù)清洗處理過程通常包括:填補(bǔ)遺漏的數(shù)據(jù)值、光滑有噪聲數(shù)據(jù)、識(shí)別或刪除異常值、以及解決不一致問題。本文是安徽新華學(xué)院學(xué)生成績(jī)的數(shù)據(jù)挖掘技術(shù)應(yīng)用,這些數(shù)據(jù)包含新華學(xué)院歷屆的學(xué)生考試成績(jī)數(shù)據(jù),數(shù)據(jù)屬性包括學(xué)生姓名、性別、年齡、專業(yè)、成績(jī)等。 數(shù)據(jù)對(duì)象的確立 明確我們研究問題所需要的數(shù)據(jù),理解數(shù)據(jù)并提出問題,需要進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)信息,明確數(shù)據(jù)挖掘的目標(biāo)的定義。它是數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn) (Knowledge Discovery in Datebases,簡(jiǎn)稱: KDD),是目前人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問題,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。 安徽新華學(xué)院 2020 屆本科畢業(yè)論文(設(shè)計(jì)) 4 2 數(shù)據(jù)挖掘技術(shù) 數(shù)據(jù)挖掘的概念 數(shù)據(jù)挖掘的背景 隨著信息技術(shù)的高速發(fā)展,人們積累的數(shù)據(jù)量急劇增長(zhǎng),如何從海量的數(shù)據(jù)中提取有用的知識(shí)成為當(dāng)務(wù)之急。 第三章 決策樹。 論文結(jié)構(gòu)如下: 第一章 緒論。 論文研究?jī)?nèi)容及結(jié)構(gòu)安排 本課題的主要工作是將數(shù)據(jù)挖掘技術(shù)和學(xué)校的信息管理系統(tǒng)相結(jié)合,新華學(xué)院多年來的信息化教學(xué)管理工作積累了大量的教學(xué)數(shù)據(jù),從新華學(xué)院的數(shù)據(jù)庫(kù)中收集學(xué)生的考試成績(jī)信息。 相對(duì)國(guó)外而言 , 我國(guó)的研究還沒有形成整體的力量 。比較著名的如卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)。 1993 年以后,美國(guó)計(jì)算機(jī)協(xié)會(huì)美年都舉行了專門研究探討數(shù)據(jù)挖掘技術(shù)的會(huì)議,會(huì)議的規(guī)模也發(fā)展成為國(guó)際學(xué)術(shù)大會(huì),并且在各個(gè)領(lǐng)域里取得了很多研究成果。 本文主要是基于如下背景開展的:以安徽新華學(xué)院歷屆學(xué)生成績(jī)?yōu)楸尘埃紫葘W(xué)習(xí)數(shù)據(jù)挖掘的理論知識(shí)以及決策樹技術(shù),然后建立新華學(xué)院學(xué)生成績(jī)數(shù)據(jù)庫(kù),并利用數(shù)據(jù)挖掘技術(shù)中的決策樹對(duì)自己建立的數(shù)據(jù)庫(kù)進(jìn)行深入的挖掘。 隨著數(shù)據(jù)挖掘技術(shù)的不斷擴(kuò)展,許多高校為了避免信息浪費(fèi),已經(jīng)將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校的教學(xué)分析中。教學(xué)工作信息化有了很大的進(jìn)步,好多高校在管理學(xué)生和教師信息方面有了很好的方式。 academic performance. This paper intends to show the use of Data Mining Technique in the analysis of students’ score information in Examination, from the pretreatment on the collected data to the use of decision tree technique in data analysis. This employs algorithm in decision tree technique to get the decision tree of the students’ score. Then by analyzing the useful information to find out the elements that can influence score and the rules in these influences to instruct school teaching work. Key words:Data mining; grade examination; decision tree; 安徽新華學(xué)院 2020 屆本科畢業(yè)論文(設(shè)計(jì)) 目 錄 1 緒 論 ............................................... 1 研究背景與意義 ....................................... 1 數(shù)據(jù)挖掘的國(guó) 內(nèi)外研究現(xiàn)狀 ............................. 1 論文研究?jī)?nèi)容及結(jié)構(gòu)安排 ............................... 2 2 數(shù)據(jù)挖掘技術(shù) .......................................... 4 數(shù)據(jù)挖掘的概念 ....................................... 4 數(shù)據(jù)挖掘的背景 ..................................... 4 數(shù)據(jù)挖掘的定義 ..................................... 4 數(shù)據(jù)挖掘的過程 ....................................... 4 數(shù)據(jù)對(duì)象的確立 ..................................... 5 數(shù)據(jù)預(yù)處理階段 ..................................... 5 數(shù)據(jù)挖掘階段 ....................................... 6 結(jié)果的解釋和評(píng)估階段 ............................... 6 數(shù)據(jù)挖掘的主要方法 ................................... 6 數(shù)據(jù)挖掘的功能 ....................................... 7 本章小 結(jié) ............................................. 9 3 決策樹技術(shù) ........................................... 10 決策樹簡(jiǎn)介 .......................................... 10 決策樹的主要算法 .................................... 11 ID3 算法 .......................................... 11 算法 ......................................... 12 決策樹剪枝 .......................................... 15 本章小結(jié) ............................................ 18 4 算法在學(xué)生考試成績(jī)中的應(yīng)用 ....................... 19 安徽新華學(xué)院 2020 屆本科畢業(yè)論文(設(shè)計(jì)) 成績(jī)分析方法的依據(jù) .................................. 19 決策樹算法在考試成績(jī)分析中的應(yīng)用 .................... 19 確定對(duì)象集目標(biāo) .................................... 19 數(shù)據(jù)的采集 ....................................... 20 數(shù)據(jù)預(yù)處理 ....................................... 21 數(shù)據(jù)挖掘工作的展開 ................................ 22 結(jié)果分析 .......................................... 27 5 總結(jié)與展望 ........................................... 28 研究結(jié)果 ............................................ 28 后續(xù)研究與展望 ...................................... 28 參考文獻(xiàn) ............................................... 31 安徽新華學(xué)院 2020 屆本科畢業(yè)論文(設(shè)計(jì)) 1 1 緒 論 研究背景與意義 無論在企業(yè)應(yīng)用領(lǐng)域,還是在科學(xué)領(lǐng)域,數(shù)據(jù)挖掘技術(shù)有著廣泛的應(yīng)用價(jià)值。 本文通過學(xué)生成績(jī)信息運(yùn)用數(shù)據(jù)挖掘技術(shù),對(duì)所采集的數(shù)據(jù)進(jìn)行預(yù)處理,運(yùn)用決策樹分類算法中的 算法對(duì)成績(jī)進(jìn)行分析得到了成績(jī)分析決策樹,分析研究出有用的信息找到影響學(xué)生的因素,發(fā)現(xiàn)某些規(guī)律的存在,用以指導(dǎo)學(xué)校教學(xué)分析工作的開展。 數(shù)據(jù)挖掘技術(shù)又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是從一個(gè)大規(guī)模的數(shù)據(jù)庫(kù)的數(shù)據(jù)中有效地、隱含的、以前未知的、有潛在使用價(jià)值的信息的過程。 I 本科畢業(yè)論文 (設(shè)計(jì) ) 題目: 決策樹分類算法在教學(xué)分析中的應(yīng)用 姓 名: 學(xué) 號(hào): 專 業(yè): 院 系: 信息工程 指導(dǎo)老師: 職稱學(xué)位: 助教/碩士 完成時(shí)間: 教務(wù)處制 安徽新華學(xué)院本科畢業(yè)論文(設(shè)計(jì))獨(dú)創(chuàng)承諾書 II 本人按照畢業(yè)論文(設(shè)計(jì))進(jìn)度計(jì)劃積極開展實(shí)驗(yàn)(調(diào)查)研究活動(dòng),實(shí)事求是地做 好實(shí)驗(yàn)(調(diào)查)記錄,所呈交的畢業(yè)論文(設(shè)計(jì))是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。 畢業(yè)論文(設(shè)計(jì))作者簽名 : 日 期:
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1