freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹分類算法在教學(xué)分析中的應(yīng)用論文-資料下載頁

2025-06-24 22:37本頁面
  

【正文】 較好完全了解認真較好87合格44董其浩較好完全了解認真較好89合格50張瑤瑤較好基本了解一般一般83合格46張中宇較差不了解不認真較差65合格47產(chǎn)意較好基本了解一般一般82合格48姚傳梅一般不了解不認真較差63合格49任仁一般認真一般一般72合格50高衍苗一般不了解一般一般75合格 數(shù)據(jù)預(yù)處理本文選擇中采集到數(shù)據(jù)中與成績屬性相關(guān)性較大的平時成績、上課聽課情況、課堂作業(yè)完成情況和學(xué)前對知識了解情況以及學(xué)生計算機等級考試總評作為建立成績分類決策樹模型的依據(jù)。對成績沒有影響的數(shù)據(jù)屬性將不參與數(shù)據(jù)挖掘的工作。編號姓名作業(yè)完成情況學(xué)前知識了解上課是否認真聽課平時成績總評1劉娜較好完全了解一般一般合格2董其浩較好完全了解認真較好合格3秦豪偉較好完全了解認真較好合格4袁玥較差不了解不認真較差不合格5張中宇較差不了解不認真較差合格6何浩然一般不了解不認真較差不合格5肖遙較好完全了解認真較好合格8楊潔一般不了解不認真較差合格9劉英豪較差不了解不認真較差合格14李蓉蓉一般不了解不認真較差不合格11吳慧蘭一般認真一般較差合格12鵬程較好基本了解認真較好合格13江軍較差不了解不認真較差不合格8馬香梅一般認真一般較差合格15杜譜較好完全了解認真一般合格16申宛燕較差不了解不認真較差不合格17李旻較好完全了解認真較好合格18包澎較差不了解不認真較差不合格19周超較差不了解不認真較差合格20張德勝較差不了解不認真較差不合格 數(shù)據(jù)挖掘工作的展開本次數(shù)據(jù)挖掘工作是對處理后的數(shù)據(jù)進行分析,本次采用的數(shù)據(jù)挖掘的主要放大是決策樹算法。,其中考試成績有2類,因此,將這個訓(xùn)練集分成2類和C2,分別代表合格和不合格。 (1)計算熵 本次數(shù)據(jù)挖掘中,計算機等級考試成績的輸出結(jié)果是合格、不合格,一共是50條記錄,取值為合格的有28條,取值為不合格的有22條,則樣本D記為:D1=28,D2=22,根據(jù)熵的計算公式Info(D)= -Pilog2(Pi)。,計算得到:Info(D)=*log2*log2=(2)計算信息增益分別以平時成績、上機作業(yè)完成情況、學(xué)前對知識的了解以及課堂作業(yè)完成情況作為根節(jié)點,計算其信息增益:屬性為平時成績中取值為較好的有17個,其中13個計算機等級考試成績?yōu)楹细瘢?個計算機等級考試成績?yōu)椴缓细?。取值為中等的?0個,其中考試成績合格的有14個,不合格的有16個。取值為較差的有13個,其中考試成績合格的有1個,不合格的為12個。我們可以計算出相應(yīng)的熵為:Info(較好)=log2log2=Info(中等)=log2log2=Info(較差)=log2log2=現(xiàn)在就可以根據(jù)信息增益計算公式:計算出相應(yīng)的信息增益了:Gain(X,D)=Info(D)-Info(X,D)Gain(平時成績)=Info(D)* Info(較好)* Info(中等)* Info(較差)=同理,如果以上機作業(yè)完成情況為根節(jié)點:Info(較好)=log2log2=Info(一般)=log2log2=Info(較差)=log2log2=所以,上機作業(yè)完成情況的信息增益為:Gain(上機作業(yè)完成情況)=***=以學(xué)前對知識了解情況為根節(jié)點:Info(完全了解)=log2log2=Info(基本了解)=log2log2=Info*(了解一些)= log2log2=所以,學(xué)前對知識的了解情況的信息增益為:Gain(學(xué)前對知識的了解情)=***=以課堂作業(yè)完成情況為根節(jié)點:Info(較好)=log2log2=Info(一般)=log2log2=Info(較差)=log2log2=所以,課堂作業(yè)完成情況的信息增益為:Gain(課堂作業(yè)完成情況)=***=這樣,我們就可以得到以上四個屬性相應(yīng)的信息增益值:Gain(平時成績)=Gain(上機作業(yè)完成情況)=Gain(學(xué)前對知識的了解情)=Gain(課堂作業(yè)完成情況)=最后Gain(平時成績)最大,按照ID3算法的根節(jié)點選取原則:信息增益最大的選為根節(jié)點,選擇平時成績?yōu)楦?jié)點,然后根據(jù)平時成績?nèi)≈禐檩^好、中等、較差三個方向,對每一顆子樹按照以上的方法遞歸計算。 成績分析決策樹在決策樹創(chuàng)建時,由于數(shù)據(jù)中的噪聲和離群點,許多分支反映的是訓(xùn)練數(shù)據(jù)中的異常,同時決策樹枝繁葉茂是沒有必要的,這樣降低了樹的可理解性和可用性,同時也使得決策樹對歷史數(shù)據(jù)依賴性大,為了使得到的決策樹所蘊涵的規(guī)則具有普遍意義,為了防止訓(xùn)練過度,減少訓(xùn)練時間,因此需要對得到的決策樹進行剪枝,剪枝的方法有:先剪枝和后剪枝。這里我們采用后剪枝法,即通過衡量某一分支的存在對分類性能的提高程度和它對整棵樹的復(fù)雜性的增加程度來決定是否對此分支給予保留。本文研究出的決策樹,由于最后的學(xué)前知識了解屬性過大的增加了樹的復(fù)雜性,而且子樹遞歸計算的信息增益很小,因此對其進行剪枝。可以看出,剪枝后的樹更小、復(fù)雜度低,因此容易理解。 修剪后的決策樹決策樹的最大優(yōu)點就是可以直接提取分類規(guī)則。由于本例中,希望了解到影響學(xué)生計算機考試成績合格的因素,因此,所提取的規(guī)則主要考慮分類為“yes”(即學(xué)生計算機等級考試成績?yōu)楹细瘢┑陌俜直纫?guī)則。所生成的計算機考試成績?yōu)楹细竦姆诸愐?guī)則如下:IF 平時成績=“較好”AND課堂作業(yè)完成情況=“較好”THEN 學(xué)生計算機考試成績合格率為100%IF 平時成績=“較差”AND課堂作業(yè)完成情況=“一般”THEN 學(xué)生計算機考試成績合格率=71%IF 平時成績=“較好”AND課堂作業(yè)完成情況=“較差””THEN 學(xué)生計算機考試成績合格率=33%IF 平時成績=“中等”AND課堂作業(yè)完成情況=“較好”THEN 學(xué)生計算機考試成績合格率=80%IF 平時成績=“中等”AND 課堂作業(yè)完成情況=“較差”THEN 學(xué)生計算機考試成績合格率=33%IF 平時成績=“中等”AND課堂作業(yè)完成情況=“較好”AND上機作業(yè)完成情況=“較好”THEN 學(xué)生計算機考試成績合格率=83%IF 平時成績=“中等”AND課堂作業(yè)完成情況=“一般”AND上機作業(yè)完成情況=“較好”THEN 學(xué)生計算機考試成績合格率=67%IF 平時成績=“中等”AND課堂作業(yè)完成情況=“較差”AND上機作業(yè)完成情況=“較好”THEN 學(xué)生計算機考試成績合格率=67%5總結(jié)與展望本文介紹了一個基于決策樹和SqlServer2008數(shù)據(jù)庫的學(xué)生計算機等級考試成績的數(shù)據(jù)挖掘與分析。對數(shù)據(jù)挖掘技術(shù)中的決策樹在學(xué)生計算機等級考試成績分析中的應(yīng)用進行了深入的研究,提出和實施了決策樹方法和數(shù)據(jù)庫應(yīng)用的方法在計算機等級考試成績分析中的實施方案。本次數(shù)據(jù)挖掘?qū)ο?,學(xué)生計算機等級考試成績,從數(shù)據(jù)屬性可以找出影響學(xué)生計算機等級考試成績的因素包括:平時成績、課堂作業(yè)完成情況、上機作業(yè)完成情況、學(xué)前對知識的了解情況,分析出影響學(xué)生計算機等級考試的通過率的因素。通過初期的數(shù)據(jù)采集、數(shù)據(jù)清理工作,然后應(yīng)用決策樹算法、數(shù)據(jù)庫sql查詢分析器構(gòu)造出學(xué)生計算機等級考試成績決策樹。在這其中,我們可以發(fā)現(xiàn)平時成績這個屬性的信息增益最大,對成績影響也最大,然后通過所建立的決策樹,我們可以得到一系列的IF—THEN的知識模式便于人們理解。通過前篇內(nèi)容的研究,我們得到的學(xué)生計算機等級考試成績決策樹,我們可以進一步的挖掘出,擴大數(shù)據(jù)的規(guī)模,增加更多的數(shù)據(jù)屬性,找出計算機等級考試成績通過率的差異。 上述這些挖掘出來的知識對于今后的學(xué)校計算機教育的決策是有幫助的,今后學(xué)校計算機教育要著重加強通過率比較低的院系、調(diào)整好院系學(xué)生語種學(xué)習(xí)的選擇等方法來提高學(xué)校學(xué)生計算機等級考試的通過率。目前,許多高等院校的研究人員已經(jīng)開始將數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于學(xué)校教學(xué)管理中,這樣做能夠很有效地提高學(xué)校教學(xué)信息管理水平。其中,利用決策樹技術(shù)對學(xué)生的學(xué)習(xí)成績分析,得到有意義的知識,從而幫助學(xué)校教育工作者制定相應(yīng)的教學(xué)計劃,有利于提高學(xué)校的教育質(zhì)量。 本文初步實現(xiàn)了關(guān)于決策樹在計算機等級考試成績分析中的應(yīng)用,取得了良好的挖掘效果。當然,隨著數(shù)據(jù)挖掘技術(shù)的不斷改進,應(yīng)用數(shù)據(jù)挖掘技術(shù)中的決策樹在學(xué)校計算機等級考試成績分析需要在各個方面不斷的加深。例如,學(xué)??梢詫W(xué)校在??荚嚦煽兿到y(tǒng)中的學(xué)生在??荚嚦煽冃畔?、學(xué)校課程信息以及學(xué)校教師管理信息系統(tǒng)和學(xué)生計算機等級考試成績系統(tǒng)相結(jié)合,這樣可以更進一步地對學(xué)生計算機等級考試成績進行數(shù)據(jù)挖掘分析,得到更有用的數(shù)據(jù)挖掘模式,從而更有效地提高學(xué)校的教學(xué)質(zhì)量。同時,決策樹技術(shù)不斷可以應(yīng)用在學(xué)生計算機等級考試成績分析,我們還可以用于其他教學(xué)信息管理系統(tǒng)中,比如英語四六級考試成績等,這些方面的應(yīng)用都是有待研究的新課題。致 謝歷時將近兩個月的時間終于將這篇論文寫完,在論文的寫作過程中遇到了無數(shù)的困難和障礙,都在同學(xué)和老師的幫助下度過了。尤其要強烈感謝我的論文指導(dǎo)老師—袁張露老師,她對我進行了無私的指導(dǎo)和幫助,不厭其煩的幫助進行論文的修改和改進。另外,在校圖書館查找資料的時候,圖書館的老師也給我提供了很多方面的支持與幫助。在此向幫助和指導(dǎo)過我的各位老師表示最中心的感謝!感謝這篇論文所涉及到的各位學(xué)者。本文引用了數(shù)位學(xué)者的研究文獻,如果沒有各位學(xué)者的研究成果的幫助和啟發(fā),我將很難完成本篇論文的寫作。感謝我的同學(xué)和朋友,在我寫論文的過程中給予我了很多你問素材,還在論文的撰寫和排版的過程中提供熱情的幫助。由于我的學(xué)術(shù)水平有限,所寫論文難免有不足之處,懇請各位老師和學(xué)友批評和指正!參考文獻[1][D]..[2][D]..[3][D]..[4][J]..[5][A].2006年全國開放式分布與并行計算學(xué)術(shù)會議論文集(一)[C].2006年.[6][A].計算機技術(shù)與應(yīng)用進展2007——全國第18屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C].2007年.[7]張建同,[A].Proceedings of 2010 International Conference on Management Science and Engineering (MSE 2010) (Volume 3)[C].2010年.[8][D]..[9][D].哈爾濱工程大學(xué)。2006年.[10][J]..[11]許華虎,孫柏林,高玨,[A].Proceedings of 2010 International Conference on Computer Science and Sports Engineering (CSSE 2010)[C].2010年.[12]張松,周亞建,[A].2010年全國通信安全學(xué)術(shù)會議論文集[C].2010年.[13]李開宇,黃建軍,“數(shù)據(jù)挖掘”作用發(fā)揮出來[N]..[14]“拍腦袋”[N]..[15][D]..[16][D]..[17][D]..[18][D]..
點擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1