freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

紅樓夢(mèng)文本分析(已修改)

2025-06-30 12:38 本頁(yè)面
 

【正文】 2013高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(選拔賽)承 諾 書(shū)我們仔細(xì)閱讀了中國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽的競(jìng)賽規(guī)則.我們完全明白,在競(jìng)賽開(kāi)始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問(wèn)題。我們知道,抄襲別人的成果是違反競(jìng)賽規(guī)則的, 如果引用別人的成果或其他公開(kāi)的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競(jìng)賽規(guī)則,以保證競(jìng)賽的公正、公平性。如有違反競(jìng)賽規(guī)則的行為,我們將受到嚴(yán)肅處理。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫(xiě)): 我們的參賽報(bào)名號(hào)為(如果賽區(qū)設(shè)置報(bào)名號(hào)的話): 所屬學(xué)校(請(qǐng)?zhí)顚?xiě)完整的全名): 參賽隊(duì)員 (打印并簽名) :1. 2. 3. 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): 日期: 年 月 日賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):隊(duì)員信息表(必須如實(shí)填寫(xiě))學(xué)號(hào)姓名所屬院專業(yè)年級(jí)電話指導(dǎo)教師是否有筆記本201100800277周怡數(shù)學(xué)與統(tǒng)計(jì)學(xué)院統(tǒng)計(jì)學(xué)2011未選定201100820017段熙玉數(shù)學(xué)與統(tǒng)計(jì)學(xué)院統(tǒng)計(jì)學(xué)2011未選定201000800138林陽(yáng)機(jī)電與信息工程軟件工程2010未選定注:如未選定指導(dǎo)教師可不填寫(xiě)“指導(dǎo)教師”一欄。2013高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(選拔賽)編 號(hào) 專 用 頁(yè)賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):賽區(qū)評(píng)閱記錄(可供賽區(qū)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注全國(guó)統(tǒng)一編號(hào)(由賽區(qū)組委會(huì)送交全國(guó)前編號(hào)):全國(guó)評(píng)閱編號(hào)(由全國(guó)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):對(duì)《紅樓夢(mèng)》文本的計(jì)算機(jī)識(shí)別方法的研究與設(shè)計(jì)摘 要本文通過(guò)對(duì)文本人物關(guān)系、文本結(jié)構(gòu)分層、作者行文風(fēng)格的分析來(lái)分析中文文本。針對(duì)問(wèn)題一,我們運(yùn)用聚類分析和層次分析建立模型從物理結(jié)構(gòu)與邏輯結(jié)構(gòu)兩方面來(lái)分析文本,我們提取文本中和文本標(biāo)題中的人名作為特征項(xiàng),用matlab編程分別統(tǒng)計(jì)每個(gè)人名在各個(gè)段落中的頻數(shù)。通過(guò)運(yùn)用主成分分析法對(duì)文本進(jìn)行的分析我們得出自變量與常數(shù)項(xiàng)幾乎不相關(guān),因此不需要采取主成分回歸分析。通過(guò)系統(tǒng)聚類分析,我們得到了聚類圖,從中得出了主演人物之間的關(guān)系。通過(guò)層次劃分,我們將樣本一劃分為兩層,樣本二劃分為兩層,樣本三劃分為兩層。最后通過(guò)matlab編程統(tǒng)計(jì)樣本中虛詞的頻數(shù),并且分別對(duì)樣本中虛詞總體和各個(gè)虛詞進(jìn)行統(tǒng)計(jì),運(yùn)用計(jì)算風(fēng)格學(xué)理論,我們得出前八十回與后四十回作者的行文風(fēng)格存在差異。針對(duì)問(wèn)題二,我們對(duì)聚類分析、層次劃分、行文風(fēng)格進(jìn)行了檢驗(yàn)。對(duì)于聚類分析的結(jié)果,我們與從對(duì)文本概述的文學(xué)概括分析得到的人物關(guān)系進(jìn)行比較檢驗(yàn),驗(yàn)證了聚類分析結(jié)果是可靠性。對(duì)于層次分析,我們通過(guò)用Excel對(duì)數(shù)據(jù)做出折線圖,對(duì)圖形進(jìn)行分析,得出與用層次分析算法得出的相同的人物關(guān)系結(jié)論。針對(duì)問(wèn)題三,我們計(jì)算了各個(gè)樣本中主要人物的比重,做出了折線圖,從圖中我們得出了文本結(jié)構(gòu)一致性的結(jié)論,體現(xiàn)了三個(gè)樣本的相同性。通過(guò)計(jì)算同一個(gè)人物在不同樣本中的頻數(shù)(以黛玉為例),我們得出各個(gè)樣本由于主題思想的不同主要人物也有差異。最后說(shuō)明模型的優(yōu)缺點(diǎn)及需要改進(jìn)的地方。關(guān)鍵字:系統(tǒng)聚類 計(jì)算風(fēng)格學(xué) 文本層次分析一、問(wèn)題重述文本(text),與 訊息(message)的意義大致相同,是有一定的符號(hào)或符碼組成的信息結(jié)構(gòu)體,這種結(jié)構(gòu)體可采用不同的表現(xiàn)形態(tài),如語(yǔ)言的、文字的、影像的等等。文本是由特定的人制作的,文本的語(yǔ)義不可避免地會(huì)反映人的特定立場(chǎng)、觀點(diǎn)、價(jià)值和利益。因此,由文本內(nèi)容分析,可以推斷文本提供者的表述方式,意圖和目的。文本分析是指對(duì)文本的表示及其特征項(xiàng)的選?。晃谋痉治鍪俏谋就诰?、信息檢索的一個(gè)基本問(wèn)題,它把從文本中抽取出的特征詞進(jìn)行量化來(lái)表示文本信息。將它們從一個(gè)無(wú)結(jié)構(gòu)的原始文本轉(zhuǎn)化為結(jié)構(gòu)化的計(jì)算機(jī)可以識(shí)別處理的信息,即對(duì)文本進(jìn)行科學(xué)的抽象,建立它的數(shù)學(xué)模型,用以描述和代替文本。使計(jì)算機(jī)能夠通過(guò)對(duì)這種模型的計(jì)算和操作來(lái)實(shí)現(xiàn)對(duì)文本的識(shí)別。由于文本是非結(jié)構(gòu)化的數(shù)據(jù),要想從大量的文本中挖掘有用的信息就必須首先將文本轉(zhuǎn)化為可處理的結(jié)構(gòu)化形式。在分析問(wèn)題是我們了解到目前有關(guān)文本表示的研究主要集中于文本表示模型的選擇和特征詞選擇算法的選取上。用于表示文本的基本單位通常稱為文本的特征或特征項(xiàng)。特征項(xiàng)必須具備一定的特性:(1)特征項(xiàng)要能夠確實(shí)標(biāo)識(shí)文本內(nèi)容;(2)特征項(xiàng)具有將目標(biāo)文本與其他文本相區(qū)分的能力;(3)特征項(xiàng)的個(gè)數(shù)不能太多;(4)特征項(xiàng)分離要比較容易實(shí)現(xiàn)。在中文文本中可以采用字、詞或短語(yǔ)作為表示文本的特征項(xiàng)。相比較而言,詞比字具有更強(qiáng)的表達(dá)能力,而詞和短語(yǔ)相比,詞的切分難度比短語(yǔ)的切分難度小得多。因此,目前大多數(shù)中文文本分類系統(tǒng)都采用詞作為特征項(xiàng),稱作特征詞。因此,在處理問(wèn)題時(shí)角度和特征項(xiàng)的選擇是關(guān)鍵。我們要解決的問(wèn)題是:(1)從第一回第四十回,第四十一回第八十回,第八十一回第一百二十回分別選取3段文字(每段不少于2000字,指出開(kāi)始,結(jié)束的頁(yè)碼和行數(shù))作為3個(gè)樣本,對(duì)這3個(gè)樣本提出文本分析的角度,特征項(xiàng)的選取及數(shù)量表征,并建立數(shù)學(xué)模型。(2)分別估計(jì)3個(gè)模型的參數(shù),并對(duì)模型進(jìn)行檢驗(yàn)。(3)基于你們的模型,對(duì)3個(gè)文本進(jìn)行比較分析(包括相同點(diǎn)和它們之間的差異性分析)。將上述研究結(jié)果寫(xiě)成綜合性的研究報(bào)告。二、問(wèn)題分析本問(wèn)題主要是通過(guò)不同的文本分析角度,建立數(shù)學(xué)模型,實(shí)現(xiàn)對(duì)文本的識(shí)別,來(lái)推斷文本提供者的表述方式,意圖和目的。對(duì)于問(wèn)題一,根據(jù)物理結(jié)構(gòu)和邏輯結(jié)構(gòu)兩個(gè)角度確立我們文本分析角度,物理結(jié)構(gòu)方面,通過(guò)計(jì)算文本虛詞使用頻率確定作者的行文風(fēng)格;邏輯結(jié)構(gòu)方面,以紅樓夢(mèng)主要人物名字為特征值對(duì)人物關(guān)系進(jìn)行分析,和以標(biāo)題詞匯為特征值的文本層次分析。使用聚類和層次分析法建模。對(duì)于問(wèn)題二,運(yùn)用所建立的模型對(duì)選擇樣本進(jìn)行運(yùn)算,得到文本總字?jǐn)?shù),虛詞的使用情況,人物關(guān)系情況由聚類法得到,再將文本由標(biāo)題詞匯判定段落分層。在模型檢驗(yàn)方面,我們由人為讀出的結(jié)論與模型得到的人物關(guān)系進(jìn)行大致方向上的比較,由分段后主要人物在各層次所占比重判斷層次分析的精確性,作者行文風(fēng)格通過(guò)所得結(jié)論與專家推斷比較檢驗(yàn)。對(duì)于問(wèn)題三,分別選取三個(gè)樣本中的虛詞頻率和人物分析進(jìn)行比較。通過(guò)虛詞頻率的比較我們可以大致分析出各四十回中作者的行文風(fēng)格從而判斷紅樓夢(mèng)作者是否為一人;
點(diǎn)擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1