freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

信息計量第七章ppt課件-在線瀏覽

2025-06-29 06:25本頁面
  

【正文】 I2 152 227 273 1097 I3 94 91 151 516 I4 56 41 90 294 I5 36 32 62 212 In/ I1 的理論值與實測值的比較 I2/ I1 I3/ I1 I4/ I1 I5/ I1 I6/ I1 I7/ I1 I8/ I1 I9/ I1 I10/ I1 計算值 實測值 )1(21 ?? nnII n2022/6/3 40 ? 高頻詞 ( c o m m o n) 與低頻詞 ( r a r e words) 出現(xiàn)的 “ 唯一性 ” 將隨著詞的出現(xiàn)的頻次的降低逐漸遭到破壞 , 即出現(xiàn)同頻詞的可能性逐漸加大 , 因此 , 我們可以把同頻詞是否出現(xiàn)作為判定高頻詞和低頻詞界限的 “ 尺度 ” 。 ? 高夫曼 ( ) 給出的 nT 轉(zhuǎn)換值( transition value) 公式: )( 181121In T ????(二)低頻詞臨界值的確定 2022/6/3 42 即:某一等級序號所對應(yīng)的低頻詞的數(shù)量與其在文獻中出現(xiàn)頻次的平方成反比 。 ? 多樣化的力 ——說話人希望組成語言的詞少 , 而且一詞多義 ,節(jié)省其精力 。 多樣化的力 單一化的力 2022/6/3 46 the Principle of Least Effort ? 一個詞的長度的演變并非隨機分布,而是與人們對其使用頻次有密切的關(guān)系。 漢語中 雙音節(jié)詞詞長適度、經(jīng)濟靈活,成為最合理的構(gòu)詞方式,促使許多新產(chǎn)生的多音節(jié)詞及專有名詞等都回縮到雙音節(jié)或三音節(jié)的模式中,向雙音節(jié)、三音節(jié)形式靠攏。 ? “最小省力原則”的實現(xiàn)因人而異。 ? 語言的使用將遵循“適度省力”的原則,以“可懂度”為前提,否則將影響語言的交流和思想的表達。 該模型最后導出的分布與齊普夫分布相當接近。 2022/6/3 52 第五節(jié) 齊夫定律的應(yīng)用 一 、 漢語詞頻分布的研究 ( ) 二 、 詞表的編制 —— 檢索詞的選擇 三 、 自動標引實踐 —— 有效詞的選擇 四 、 文件檔的組織 —— 數(shù)據(jù)庫存儲容量的判定 五、英語單詞的選擇 —— 對語言學習的指導 2022/6/3 53 自動標引原理: ?統(tǒng)計標引法、 句法分析法、語義分析法 統(tǒng)計標引法( statistical method of indexing)的理論根據(jù): 各種詞出現(xiàn)在原始文獻中的頻率和其區(qū)分文獻內(nèi)容功能之間存在著某種數(shù)量上的關(guān)系。 事實上,只有那些詞頻適中的詞的區(qū)分能力較強,它們被稱為“有效詞”( significant words)。 齊夫定律在主題詞表編制與標引理論和實踐中的應(yīng)用 有效詞的分辨力 下限 上限 有效詞 2022/6/3 55 齊普夫定律 在信息管理工作中的應(yīng)用 ? 最佳地理位置選擇,使得使用者能以最省力的途徑方便到達。 北京大學 2022/6/3 57 香港中文大學 2022/6/3 58 濱州醫(yī)學院圖書館 齊普夫定律的應(yīng)用 —— 英語單詞的選擇 ? 《 教師二萬詞詞書 》 —— 詞頻法統(tǒng)計詞匯的最重要的一部文獻 —— 美國教育學家桑戴克 (E L. Thorndike) : Teacher39。 ? ? 300萬字左右的圣經(jīng)和英國古典文學作品, ? 30萬字左右的小學課本, ? 5萬字左右的有關(guān)烹飪,縫紉,農(nóng)藝,商業(yè)之類的著作 ? 9萬字左右的新聞報紙 ? 5萬字左右的書信,共 41種不同的文獻 ? 根據(jù) Ogden在 1967年版的 Encyclopaedia Britanica中對 Basic English的定義,對于一個英語國家的成年人,應(yīng)認識 20220個單詞,除語言專家外,普通人遇到的單詞量一般不超過 60000個。 9 0 5 7 7 0 0 0 0ln5 7 7 0 0 0 0lnlnln)()(???????????NmNRmR“ 四級” 考試 : 4500 % “ 六級”考試: 5500 % PETS5需要 6000 % TOEFL詞匯 8000 % 2022/6/3 64 第六節(jié) 布 齊 洛定律分布一致性 2022/6/3 65 ? 信息計量學的三大基本定律 研究和發(fā)展的兩個方面 : 一 ,對每一定律的內(nèi)涵及經(jīng)驗公式的深入研究 ,從而獲得更一般、更精確的定律表達式 二,發(fā)現(xiàn)并深入研究三定律之間內(nèi)在分布的一致性及其理論基礎(chǔ)問題 2022/6/3 66 一、 三定律的形式及特點 (一)布拉德福定律及其特點 基本思想:將科學期刊按其刊載某學科論文數(shù)量多少,以漸減的次序進行排列,分為三個區(qū),每一區(qū)中期刊所載相關(guān)論文數(shù)量基本相等的條件下,得出各區(qū)期刊數(shù)量比例為 1:a:a2(a 為比例系數(shù)) 基本內(nèi)容描述:文字表達與圖象表達 2022/6/3 67 ? 基本內(nèi)容蘊涵三個基本特征: ? 1,期刊是按刊載專業(yè)論文數(shù)量的多少進行等級排列 ? 2,期刊分三個區(qū),核心區(qū)、相關(guān)和外圍區(qū)(為了突出核心區(qū)而強調(diào)相關(guān)論文在期刊上的集中與分散) ? 3,設(shè)定每一區(qū)中的相關(guān)論文數(shù)量基本相等,目的是通過同一標準來比較各區(qū)在期刊數(shù)量上呈現(xiàn)出的規(guī)律性 ? 等級排序是最基本的特征 2022/6/3 68 布拉德福定律數(shù)學表達式 ? 布魯克斯 () R(n)=kln(n/s) ? 萊姆庫勒 () ? R(r)=alog(1+br) ? F(x)=ln(1+bx)/ln(1+b) 相關(guān)論文累積數(shù) 等級排序的期刊級位 X為全部期刊中載文率最高的部分期刊的比率 X部分期刊中包含的相關(guān)論文對全部相關(guān)論文的比率 2022/6/3 69 (二)齊普夫定律及其特點 ? 基本思想:按一特定文本中詞出現(xiàn)的次數(shù)(詞頻)的多少,以漸減的次序排列起來,那么,詞的序號 r(詞級 )與詞頻 fr的乘積具有近似恒等的關(guān)系 ? fr=c/r (r=1,2,3….) 2022/6/3 70 ? 基本特點(是與其它定律比較的基礎(chǔ)): ? 1,詞匯是按詞出現(xiàn)的次數(shù)(詞頻)大小進行等級排列 ? 2,齊普夫定律的圖象表達在利用對數(shù)變換處理后得到的是一條斜率為 1的直線 2022/6/3 71 推廣齊普夫定律的有: ? 朱斯( ) ? Pr=crb 或 Pr=c/rb (詞頻大小由 b決定) ? 芒代爾布羅特( ) ? Pr=c/(r+a)b 第 r級詞之頻率 級位 r 2022/6/3 72 ( 三)洛特卡定律及其特點 ? 基本思想:某一學科領(lǐng)域中,寫若干篇論文的作者在整個學科著者群中占有一個固定的比例 ? 公式表達式: f(x)=c/x2 ? 反映科學論文在論文作者上集中與分散的分布現(xiàn)象 2022/6/3 73 ? 基本特點: ? 一,洛特卡采用頻次排序的方法,即按某類作者出現(xiàn)的頻次大小排位,而非按作者所寫的論文多少來對作者進行等級排位 ? 二,論文在作者上的集中與分散程度只限于平方反比關(guān)系,即只給出了這種集中與分散程度的單一描述 2022/6/3 74 洛特卡定律的推廣 ? 鮑( ) ?f(x)=c/xa ?不同的 a值能夠反映出某學科領(lǐng)域中論文在作者集中與分散的確切程度,a 值越大,集中與分散程度越高 2022/6/3 75 四、其它的分布形式及特點 ? 特征值 主體類別 作者(發(fā)現(xiàn)人) ? 文獻數(shù) 期刊
點擊復制文檔內(nèi)容
教學課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1