freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

紅樓夢文本分析-展示頁

2025-06-27 12:38本頁面
  

【正文】 格:統(tǒng)計虛詞使用情況。三、模型假設(shè)[1]每個樣本擁有獨立性(不受其他樣本影響也不影響其他樣本);[2]樣本選取是隨機的,具有普遍性;[3]虛詞的使用頻率的異同可以充分區(qū)分作者的行文風(fēng)格;[4]標(biāo)題中詞匯在整個文本中具有代表性(標(biāo)題是整個文本中心思想的概括);[5]3個樣本在整個文本各四十回中的人物關(guān)系具有代表性。對于問題三,分別選取三個樣本中的虛詞頻率和人物分析進(jìn)行比較。對于問題二,運用所建立的模型對選擇樣本進(jìn)行運算,得到文本總字?jǐn)?shù),虛詞的使用情況,人物關(guān)系情況由聚類法得到,再將文本由標(biāo)題詞匯判定段落分層。對于問題一,根據(jù)物理結(jié)構(gòu)和邏輯結(jié)構(gòu)兩個角度確立我們文本分析角度,物理結(jié)構(gòu)方面,通過計算文本虛詞使用頻率確定作者的行文風(fēng)格;邏輯結(jié)構(gòu)方面,以紅樓夢主要人物名字為特征值對人物關(guān)系進(jìn)行分析,和以標(biāo)題詞匯為特征值的文本層次分析。將上述研究結(jié)果寫成綜合性的研究報告。(2)分別估計3個模型的參數(shù),并對模型進(jìn)行檢驗。因此,在處理問題時角度和特征項的選擇是關(guān)鍵。相比較而言,詞比字具有更強的表達(dá)能力,而詞和短語相比,詞的切分難度比短語的切分難度小得多。特征項必須具備一定的特性:(1)特征項要能夠確實標(biāo)識文本內(nèi)容;(2)特征項具有將目標(biāo)文本與其他文本相區(qū)分的能力;(3)特征項的個數(shù)不能太多;(4)特征項分離要比較容易實現(xiàn)。在分析問題是我們了解到目前有關(guān)文本表示的研究主要集中于文本表示模型的選擇和特征詞選擇算法的選取上。使計算機能夠通過對這種模型的計算和操作來實現(xiàn)對文本的識別。文本分析是指對文本的表示及其特征項的選??;文本分析是文本挖掘、信息檢索的一個基本問題,它把從文本中抽取出的特征詞進(jìn)行量化來表示文本信息。文本是由特定的人制作的,文本的語義不可避免地會反映人的特定立場、觀點、價值和利益。最后說明模型的優(yōu)缺點及需要改進(jìn)的地方。針對問題三,我們計算了各個樣本中主要人物的比重,做出了折線圖,從圖中我們得出了文本結(jié)構(gòu)一致性的結(jié)論,體現(xiàn)了三個樣本的相同性。對于聚類分析的結(jié)果,我們與從對文本概述的文學(xué)概括分析得到的人物關(guān)系進(jìn)行比較檢驗,驗證了聚類分析結(jié)果是可靠性。最后通過matlab編程統(tǒng)計樣本中虛詞的頻數(shù),并且分別對樣本中虛詞總體和各個虛詞進(jìn)行統(tǒng)計,運用計算風(fēng)格學(xué)理論,我們得出前八十回與后四十回作者的行文風(fēng)格存在差異。通過系統(tǒng)聚類分析,我們得到了聚類圖,從中得出了主演人物之間的關(guān)系。針對問題一,我們運用聚類分析和層次分析建立模型從物理結(jié)構(gòu)與邏輯結(jié)構(gòu)兩方面來分析文本,我們提取文本中和文本標(biāo)題中的人名作為特征項,用matlab編程分別統(tǒng)計每個人名在各個段落中的頻數(shù)。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): 我們的參賽報名號為(如果賽區(qū)設(shè)置報名號的話): 所屬學(xué)校(請?zhí)顚懲暾娜? 參賽隊員 (打印并簽名) :1. 2. 3. 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): 日期: 年 月 日賽區(qū)評閱編號(由賽區(qū)組委會評閱前進(jìn)行編號):隊員信息表(必須如實填寫)學(xué)號姓名所屬院專業(yè)年級電話指導(dǎo)教師是否有筆記本201100800277周怡數(shù)學(xué)與統(tǒng)計學(xué)院統(tǒng)計學(xué)2011未選定201100820017段熙玉數(shù)學(xué)與統(tǒng)計學(xué)院統(tǒng)計學(xué)2011未選定201000800138林陽機電與信息工程軟件工程2010未選定注:如未選定指導(dǎo)教師可不填寫“指導(dǎo)教師”一欄。我們鄭重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。2013高教社杯全國大學(xué)生數(shù)學(xué)建模競賽(選拔賽)承 諾 書我們仔細(xì)閱讀了中國大學(xué)生數(shù)學(xué)建模競賽的競賽規(guī)則.我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。如有違反競賽規(guī)則的行為,我們將受到嚴(yán)肅處理。2013高教社杯全國大學(xué)生數(shù)學(xué)建模競賽(選拔賽)編 號 專 用 頁賽區(qū)評閱編號(由賽區(qū)組委會評閱前進(jìn)行編號):賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進(jìn)行編號):對《紅樓夢》文本的計算機識別方法的研究與設(shè)計摘 要本文通過對文本人物關(guān)系、文本結(jié)構(gòu)分層、作者行文風(fēng)格的分析來分析中文文本。通過運用主成分分析法對文本進(jìn)行的分析我們得出自變量與常數(shù)項幾乎不相關(guān),因此不需要采取主成分回歸分析。通過層次劃分,我們將樣本一劃分為兩層,樣本二劃分為兩層,樣本三劃分為兩層。針對問題二,我們對聚類分析、層次劃分、行文風(fēng)格進(jìn)行了檢驗。對于層次分析,我們通過用Excel對數(shù)據(jù)做出折線圖,對圖形進(jìn)行分析,得出與用層次分析算法得出的相同的人物關(guān)系結(jié)論。通過計算同一個人物在不同樣本中的頻數(shù)(以黛玉為例),我們得出各個樣本由于主題思想的不同主要人物也有差異。關(guān)鍵字:系統(tǒng)聚類 計算風(fēng)格學(xué) 文本層次分析一、問題重述文本(text),與 訊息(message)的意義大致相同,是有一定的符號或符碼組成的信息結(jié)構(gòu)體,這種結(jié)構(gòu)體可采用不同的表現(xiàn)形態(tài),如語言的、文字的、影像的等等。因此,由文本內(nèi)容分析,可以推斷文本提供者的表述方式,意圖和目的。將它們從一個無結(jié)構(gòu)的原始文本轉(zhuǎn)化為結(jié)構(gòu)化的計算機可以識別處理的信息,即對文本進(jìn)行科學(xué)的抽象,建立它的數(shù)學(xué)模型,用以描述和代替文本。由于文本是非結(jié)構(gòu)化的數(shù)據(jù),要想從大量的文本中挖掘有用的信息就必須首先將文本轉(zhuǎn)化為可處理的結(jié)構(gòu)化形式。用于表示文本的基本單位通常稱為文本的特征或特征項。在中文文本中可以采用字、詞或短語作為表示文本的特征項。因此,目前大多數(shù)中文文本分類系統(tǒng)都采用詞作為特征項,稱作特征詞。我們要解決的問題是:(1)從第一回第四十回,第四十一回第八十回,第八十一回第一百二十回分別選取3段文字(每段不少于2000字,指出開始,結(jié)束的頁碼和行數(shù))作為3個樣本,對這3個樣本提出文本分析的角度,特征項的選取及數(shù)量表征,并建立數(shù)學(xué)模型。(3)基于你們的模型,對3個文本進(jìn)行比較分析(包括相同點和它們之間的差異性分析)。二、問題分析本問題主要是通過不同的文本分析角度,建立數(shù)學(xué)模型,實
點擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1