【文章內(nèi)容簡介】
, 頻次最小的詞秩為 。 若用 Fr表示秩為 r的詞出現(xiàn)的頻次 , r表示詞匯的秩即序號 , 則有: Fr*r=C 另一種表達: fr*r=c 二 、 齊普夫定律的文字描述及數(shù)學模型 第二節(jié) 齊普夫定律的基本表達 第七章 科學信息的詞頻分布規(guī)律 Pr*r=c l式中 C為參變數(shù) ,0C。 信息計量學 三 、 齊普夫定律的圖像描述 橫坐標表示詞的等級序號 r,縱坐標表示相應(yīng)的頻次 Fr。 第二節(jié) 齊普夫定律的基本表達 第七章 科學信息的詞頻分布規(guī)律 齊普夫分布曲線 信息計量學 對等級序號 r取對數(shù) lgr作為橫坐標 對頻次 Fr取對數(shù) lgFr作為縱坐標 第二節(jié) 齊普夫定律的基本表達 第七章 科學信息的詞頻分布規(guī)律 三 、 齊普夫定律的圖像描述 齊普夫分布對數(shù)曲線 信息計量學 四 、 齊普夫定律的適用性和局限性 ?比較符合西文文獻中詞頻分布的實際情況 ?對于出現(xiàn)頻次特別高的詞和特別低的詞 , 并不能準確地反映其分布規(guī)律 。 第七章 科學信息的詞頻分布規(guī)律 第二節(jié) 齊普夫定律的基本表達 信息計量學 以 Rondld E. Wyllys: Empirical and Theoretical Bases of Zipf’s Law(齊夫定律的經(jīng)驗根據(jù)與理論基礎(chǔ))前兩段作為詞頻分布的統(tǒng)計對象,該文如下: Introduction One of the most puzzling phenomena in bibliometrics and, more broadly, in quantitative linguistics is Zipf’s law. As one mentator, the statistician Gustav Herdan, has put it:“Mathematicians believe in it (Zipf’s law) because they think that linguists have established it to be a linguistic law, and linguists believe in it because they, on their part, think that mathematicians have established it to be a mathematical law.” Let us start by considering a basic form of Zipf’s law. Suppose one has a natural language corpus, ., a book written in English. Next, suppose one makes a frequency count of the words in the corpus, ., counts the number of occurrences of t