【文章內(nèi)容簡介】
, 頻次最小的詞秩為 。 若用 Fr表示秩為 r的詞出現(xiàn)的頻次 , r表示詞匯的秩即序號 , 則有: Fr*r=C 另一種表達(dá): fr*r=c 二 、 齊普夫定律的文字描述及數(shù)學(xué)模型 第二節(jié) 齊普夫定律的基本表達(dá) 第七章 科學(xué)信息的詞頻分布規(guī)律 Pr*r=c l式中 C為參變數(shù) ,0C。 信息計量學(xué) 三 、 齊普夫定律的圖像描述 橫坐標(biāo)表示詞的等級序號 r,縱坐標(biāo)表示相應(yīng)的頻次 Fr。 第二節(jié) 齊普夫定律的基本表達(dá) 第七章 科學(xué)信息的詞頻分布規(guī)律 齊普夫分布曲線 信息計量學(xué) 對等級序號 r取對數(shù) lgr作為橫坐標(biāo) 對頻次 Fr取對數(shù) lgFr作為縱坐標(biāo) 第二節(jié) 齊普夫定律的基本表達(dá) 第七章 科學(xué)信息的詞頻分布規(guī)律 三 、 齊普夫定律的圖像描述 齊普夫分布對數(shù)曲線 信息計量學(xué) 四 、 齊普夫定律的適用性和局限性 ?比較符合西文文獻(xiàn)中詞頻分布的實際情況 ?對于出現(xiàn)頻次特別高的詞和特別低的詞 , 并不能準(zhǔn)確地反映其分布規(guī)律 。 第七章 科學(xué)信息的詞頻分布規(guī)律 第二節(jié) 齊普夫定律的基本表達(dá) 信息計量學(xué) 以 Rondld E. Wyllys: Empirical and Theoretical Bases of Zipf’s Law(齊夫定律的經(jīng)驗根據(jù)與理論基礎(chǔ))前兩段作為詞頻分布的統(tǒng)計對象,該文如下: Introduction One of the most puzzling phenomena in bibliometrics and, more broadly, in quantitative linguistics is Zipf’s law. As one mentator, the statistician Gustav Herdan, has put it:“Mathematicians believe in it (Zipf’s law) because they think that linguists have established it to be a linguistic law, and linguists believe in it because they, on their part, think that mathematicians have established it to be a mathematical law.” Let us start by considering a basic form of Zipf’s law. Suppose one has a natural language corpus, ., a book written in English. Next, suppose one makes a frequency count of the words in the corpus, ., counts the number of occurrences of t