freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

紅樓夢(mèng)文本分析(參考版)

2025-06-21 12:38本頁(yè)面
  

【正文】 ,num2str(freq(i))]) end fclose(fid)。 end end for i = 1:size(dict,1) disp([dict(i,:),39。 % 如果運(yùn)行結(jié)果顯示亂碼,請(qǐng)修改mand和workspace的font disp(aLine) for i = 1:size(dict,1) % deblank 使用的原因:詞語(yǔ)長(zhǎng)度不一, % dict生成時(shí),會(huì)在短的詞語(yǔ)后面加空格,查找的時(shí)候必須去掉,否則搜索不到 re = strfind(aLine,deblank(dict(i,:)))。 % 字典freq = zeros(size(dict,1),1)。賈珍39。寶玉39。 return。Can not open the file39。)。,39。fid = fopen(39。close all。九、參考文獻(xiàn)[1]維基百科 主成分分析法詞條[2]賴國(guó)毅 陳超, 常用功能與應(yīng)用實(shí)例精講,北京;電子工業(yè)出版社,[3]林鴻飛 戰(zhàn)學(xué)剛 姚天順,文本層次分析與文本瀏覽,中 文 信 息 學(xué) 報(bào),第13 卷第4 期,1998[4]百度百科 計(jì)算風(fēng)格學(xué)詞條附錄:三個(gè)樣本基于主成分分析法的協(xié)方差矩陣:漢字頻數(shù)統(tǒng)計(jì)——Matlab程序% 讀取漢字% 讀取的漢字在and中顯示可能會(huì)亂碼,需要修改字體。這一論斷表明,我們不可能以量化的數(shù)值來(lái)表示絕對(duì)的作家風(fēng)格。林語(yǔ)堂式的幽默,沈從文式的淡雅,都是不同的言語(yǔ)風(fēng)格,而不是語(yǔ)言風(fēng)格。文本層次劃分由于特征詞的選用是根據(jù)《紅樓夢(mèng)》文本的標(biāo)題決定的,該文本標(biāo)題是全文內(nèi)容的概括,出現(xiàn)人名就是故事主要人物,但這類文本不具有普遍性,故幾乎不可用于其他文本結(jié)構(gòu)分析上,不具有普遍性。該文本識(shí)別模型從物理結(jié)構(gòu)與邏輯結(jié)構(gòu)兩個(gè)方面分析文本,得到了作者行文風(fēng)格、段落劃分及文本結(jié)構(gòu)和人物關(guān)系的結(jié)論。應(yīng)用計(jì)算風(fēng)格學(xué),采用計(jì)算機(jī)技術(shù)和統(tǒng)計(jì)方法,編制特定的數(shù)學(xué)程序和數(shù)量模型來(lái)研究文章風(fēng)格。而在確定具體人名時(shí),我們先規(guī)劃了主要人物,然后選用了概括性最強(qiáng)的人名最為特征值。八、模型的評(píng)價(jià)與推廣 運(yùn)用系統(tǒng)聚類的方法來(lái)描述人物間的聯(lián)系,通過(guò)生成水平樹(shù)形圖可以非常清楚地看到人物的分層合并,并且與直接分析文本所得到的人物間聯(lián)系吻合的效果很好。并且對(duì)各虛詞的使用沒(méi)有特定的偏好;后40回中作者的虛詞使用頻率較低,對(duì)‘何’,‘若’,‘為’,‘也’,‘因’等部分虛詞有使用上的偏好。例如黛玉在三個(gè)樣本中頻數(shù)的變化:由上圖可以看出黛玉在三個(gè)文本中出現(xiàn)的頻數(shù)在急劇下降到幾乎消失,可以推斷出黛玉的身體狀況可能出現(xiàn)了問(wèn)題,而最后的頻數(shù)為零可以大膽假設(shè)為黛玉病危或死亡。并且對(duì)各虛詞的使用沒(méi)有特定的偏好。故該用模型確立作者的行文風(fēng)格有可行性。從而推斷出前80回的作者的行文風(fēng)格不同于后40回的作者。我們可以確定的是前80回的作者在寫作中對(duì)虛詞的使用頻率較高,大致為2%。程偉元將全稿以活字版印刷刊行。采用了各種統(tǒng)計(jì)分析方法(主要有主成份分析,典型相關(guān)分析,多維尺度法,廣義線性模型,類卡方距離與相關(guān)系數(shù)等等)利用以上信息,作者推斷出結(jié)論:《紅樓夢(mèng)》前八十回是曹雪芹據(jù)《石頭記》增刪而成,其中插入他早年著的《金瓶梅》式小說(shuō)《風(fēng)月寶鑒》,并增寫了具有深刻內(nèi)涵的許多內(nèi)容。 (4)十個(gè)表示轉(zhuǎn)折、程度、比較等意的虛字:可、便、就、但、越、再、更、比、很、偏。(1)十三個(gè)文言虛字:之、其、或、亦、方、于、即、皆、因、仍、故、尚、乃(2)九個(gè)句尾虛字:呀、嗎、咧、罷咧、啊、罷、罷了、么、呢。由此推斷得出前八十回與后四十回的作者均為曹雪芹一人的結(jié)論。從每組中任取八萬(wàn)字,分別挑出名詞、動(dòng)詞、形容詞、副詞、虛詞這五種詞,通過(guò)計(jì)算機(jī)程序?qū)@些詞進(jìn)行編排、統(tǒng)計(jì)、比較和處理,進(jìn)而找出各組相關(guān)程度。陳炳藻將《紅樓夢(mèng)》一百二十回本按順序編成三組,每組四十回。1980年,在威斯康辛大學(xué)舉辦的首屆國(guó)際《紅樓夢(mèng)》研討會(huì)上 ,陳炳藻發(fā)表《從詞匯上的統(tǒng)計(jì)論〈紅樓夢(mèng)〉的作者問(wèn)題》一文。故我們可以看出,寫前80回的作者對(duì)虛詞使用沒(méi)有特定偏好,而后40回的作者對(duì)‘何’,‘若’,‘為’,‘也’,‘因’等部分虛詞有使用上的偏好,而虛詞的使用不由文本內(nèi)容所影響,僅由作者寫作習(xí)慣決定,從而分析出前80回的作者不同于后40回的作者。兩個(gè)作者為同一個(gè)的可能性為(2%—%)/%=%,從中我們可以看出紅樓夢(mèng)的作者為兩個(gè)人。樣本三從圖中可以看出,寶玉只在前5段中出現(xiàn),而賈珍只在6段之后出現(xiàn),由實(shí)際對(duì)《紅樓夢(mèng)》第八十八回的閱讀,不難發(fā)現(xiàn),在11段之后描寫的是和賈珍有密切關(guān)系的人,所以可以得到1至5段為第一層,6至19段為第二層,從而驗(yàn)證了層次分析中的結(jié)論。根據(jù)各樣本標(biāo)題中人物名在各段落中出現(xiàn)的頻數(shù),我們用Excel繪制了折線圖,根據(jù)圖形我們可以大致得出層次劃分的結(jié)論:(1)樣本一從圖中我們可以看出14自然段之后寶釵在文本中沒(méi)有出現(xiàn),寶玉在文本中出現(xiàn)的次數(shù)保持一個(gè)相對(duì)穩(wěn)定的狀態(tài),由此,我們可以得到層次劃分的分界點(diǎn)是在第13自然段,從而驗(yàn)證在層次分析中得到的對(duì)文本的層次劃分是符合實(shí)際的。下表為標(biāo)題中出現(xiàn)的人物名在各段落中出現(xiàn)的頻率:寶玉0051100000000000000賈珍0000024644000000000樣本三第八十八回層次一層次二段落19段落5段落1段落6 ....... ....... . . 設(shè)文本共有N 個(gè)自然段,專家劃分H1 = ( Pi1 ?Pi2 1) ( Pi2 ?Pi3 1) ?( Pik ?PiK + 1 1) ,機(jī)器自動(dòng)劃分H2 = ( Pj1 ? Pj2 1 ) ( Pj2 ? Pj3 1 ) ?( Pj K ? Pj K + 1 1 ) , 定義評(píng)判得分 Q =,其中函數(shù)h ( Pi) = 1 ,若Pi 在H1 , H2 中的劃分一致。下表為標(biāo)題中出現(xiàn)的人物名在各段落中出現(xiàn)的頻率:寶釵015003142011100000000寶玉3811033232551646562522經(jīng)過(guò)文本的層次分析,可以得到文本的邏輯結(jié)構(gòu),它的直觀形式體現(xiàn)為文本的結(jié)構(gòu)樹(shù):樣本一層次二層次一段落18段落14段落1段落13樣本二(第四十四回)1至8自然段為第一層,主題為變生不測(cè)鳳姐潑醋;9至本回結(jié)束為第二層,主題為喜出望外平兒理妝。從聚類圖中可以得出的人物關(guān)系與從文本內(nèi)容概述的得出的關(guān)系相符合。從概述可以看出鴛鴦與惜春因賈母大壽產(chǎn)生聯(lián)系,賈環(huán)、寶玉、賈蘭因?qū)?duì)子產(chǎn)生聯(lián)系,賈珍與賈璉因鬧仗的悍仆而產(chǎn)生聯(lián)系,在前幾組人物的關(guān)系發(fā)展中賈母的大壽是主要因素,因此賈母又與鴛鴦、惜春、賈環(huán)、賈蘭、寶玉之間存在聯(lián)系;賈蕓與鳳姐因送東西而
點(diǎn)擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1