freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

信息計量第七章ppt課件(留存版)

2025-06-26 06:25上一頁面

下一頁面
  

【正文】 文獻中或講話中 出現(xiàn)的 次數 ( 頻次 ) 。s BASIC ENGLISH Word List ? OPERATIONS 100 words( 100個動作的詞) ? e, get, give, go, keep, let, make, put, … ? THINGS 400 General words( 400 個普通名詞) ? account, act, addition, adjustment, … ? THINGS 200 Picturable words ( 200 個可畫圖的名詞) ? angle, ant, apple, arch, arm, army, … ? QUALITIES 100 General ( 100 個普通形容詞) ? able, acid, angry, automatic, beautiful, black, … ? QUALITIES 50 Opposites ( 50 個有反義詞的形容詞) ? awake, bad, bent, bitter, blue, certain, cold,… 2022/6/3 13 OGDEN39。 the next most frequency, rank 2。 ? 懷利斯( )對 8個不同樣本的研究結果: b。 ? “ 寡用冗長” ? “用盡廢退” ? 事多而寡用之, 意多而約出之。 :文獻中每一個詞都有一定的“分辨能” (discrimination power),而這種能力與詞出現(xiàn)的頻次有著密切的關系。如果摸到一個紅球,則往缸中加 s個紅球,如果摸到一個黑球,則不往缸中加球。常常是意欲省力,實則不然。 (二)低頻詞臨界值的確定 2022/6/3 41 ? 即:在按詞頻等級降序排列中 , 所有出現(xiàn)頻次小于 nT 的詞均為低頻詞 。r the 9 1 9 1 9 1 9 in, of 7 23 14, 21 3 21 a, one 6 45 24, 30 5 30 law 5 6 30 6 6 30 and, it 4 78 28, 32 8 32 suppose,that,Zipf’ s 3 911 27, 30,33 11 33 21個單詞 2 1232 24…64 32 64 43個單詞 1 3375 33…75 75 75 單詞 頻次 隨機排序 nrr =k 或 nr=kr1 ? 一 、 齊普夫的前期研究工作 ? (艾思杜 )的研究 ( 1916) 若將文獻 ( 文集 ) 中出現(xiàn)的詞匯 ( N) 按其出現(xiàn)的頻次 ( n) 的高低做遞減排序 , 并依次給予相應的等級序號 ( r) , ( r=1, 2, 3........, D) , 則等級序號 ( r) 與相應的頻次 ( nr) 的乘積 ( nr 2022/6/3 7 ? 《 毛澤東選集 》 ( 四卷合訂本 , 1967年 ) 總詞量約66萬 , 收錄 2775個漢字 。第七章 齊普夫定律 G. K. Zipf (19021950) 美國哈夫大學著名語言 學家和心理學家。 (一)文獻中對詞的利用 ? 《 漢語大字典 》 ( 四川辭書出版社 , 1986年 ) 全四卷 , 收錄單字約 56000多個 。 (二)詞頻統(tǒng)計工具 2022/6/3 17 2022/6/3 18 nrr 最大排序 nr 文章 Eldridge 總詞次數 N’ 4325 4409 8734 43989 單詞總數 N 1001 1211 1698 6002 I1 541 710 887 2971 I2 152 227 273 1097 I3 94 91 151 516 I4 56 41 90 294 I5 36 32 62 212 In/ I1 的理論值與實測值的比較 I2/ I1 I3/ I1 I4/ I1 I5/ I1 I6/ I1 I7/ I1 I8/ I1 I9/ I1 I10/ I1 計算值 實測值 )1(21 ?? nnII n2022/6/3 40 ? 高頻詞 ( c o m m o n) 與低頻詞 ( r a r e words) 出現(xiàn)的 “ 唯一性 ” 將隨著詞的出現(xiàn)的頻次的降低逐漸遭到破壞 , 即出現(xiàn)同頻詞的可能性逐漸加大 , 因此 , 我們可以把同頻詞是否出現(xiàn)作為判定高頻詞和低頻詞界限的 “ 尺度 ” 。 ? “最小省力原則”的實現(xiàn)因人而異。 9 0 5 7 7 0 0 0 0ln5 7 7 0 0 0 0lnlnln)()(???????????NmNRmR“ 四級” 考試 : 4500 % “ 六級”考試: 5500 % PETS5需要 6000 % TOEFL詞匯 8000 % 2022/6/3 64 第六節(jié) 布 齊 洛定律分布一致性 2022/6/3 65 ? 信息計量學的三大基本定律 研究和發(fā)展的兩個方面 : 一 ,對每一定律的內涵及經驗公式的深入研究 ,從而獲得更一般、更精確的定律表達式 二,發(fā)現(xiàn)并深入研究三定律之間內在分布的一致性及其理論基礎問題 2022/6/3 66 一、 三定律的形式及特點 (一)布拉德福定律及其特點 基本思想:將科學期刊按其刊載某學科論文數量多少,以漸減的次序進行排列,分為三個區(qū),每一區(qū)中期刊所載相關論文數量基本相等的條件下,得出各區(qū)期刊數量比例為 1:a:a2(a 為比例系數) 基本內容描述:文字表達與圖象表達 2022/6/3 67 ? 基本內容蘊涵三個基本特征: ? 1,期刊是按刊載專業(yè)論文數量的多少進行等級排列 ? 2,期刊分三個區(qū),核心區(qū)、相關和外圍區(qū)(為了突出核心區(qū)而強調相關論文在期刊上的集中與分散) ? 3,設定每一區(qū)中的相關論文數量基本相等,目的是通過同一標準來比較各區(qū)在期刊數量上呈現(xiàn)出的規(guī)律性 ? 等級排序是最基本的特征 2022/6/3 68 布拉德福定律數學表達式 ? 布魯克斯 () R(n)=kln(n/s) ? 萊姆庫勒 () ? R(r)=alog(1+br) ? F(x)=ln(1+bx)/ln(1+b) 相關論文累積數 等級排序的期刊級位 X為全部期刊中載文率最高的部分期刊的比率 X部分期刊中包含的相關論文對全部相關論文的比率 2022/6/3 69 (二)齊普夫定律及其特點 ? 基本思想:按一特定文本中詞出現(xiàn)的次數(詞頻)的多少,以漸減的次序排列起來,那么,詞的序號 r(詞級 )與詞頻 fr的乘積具有近似恒等的關系 ? fr=c/r (r=1,2,3….) 2022/6/3 70 ? 基本特點(是與其它定律比較的基礎): ? 1,詞匯是按詞出現(xiàn)的次數(詞頻)大小進行等級排列 ? 2,齊普夫定律的圖象表達在利用對數變換處理后得到的是一條斜率為 1的直線 2022/6/3 71 推廣齊普夫定律的有: ? 朱斯( ) ? Pr=crb 或 Pr=c/rb (詞頻大小由 b決定) ? 芒代爾布羅特( ) ? Pr=c/(r+a)b 第 r級詞之頻率 級位 r 2022/6/3 72 ( 三)洛特卡定律及其特點 ? 基本思想:某一學科領域中,寫若干篇論文的作者在整個學科著者群中占有一個固定的比例 ? 公式表達式: f(x)=c/x2 ? 反映科學論文在論文作者上集中與分散的分布現(xiàn)象 2022/6/3 73 ? 基本特點: ?
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1