freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文改web中圖像的檢索技術(shù)研究(參考版)

2025-05-23 05:56本頁(yè)面
  

【正文】 14 參考文獻(xiàn) [1] 張量,詹國(guó)華,袁貞明, 基于 Web 的圖像搜索,計(jì)算機(jī)工程, [2] 朱學(xué)芳, 多媒體信息處理與 檢索技術(shù) [M],電子工業(yè)出版社, 20xx [3] 陳瀅 ,徐宏炳 ,王能斌,協(xié)作式 Web 資源發(fā)現(xiàn)系統(tǒng)模型,計(jì)算機(jī)學(xué)報(bào), [4] 陽(yáng)小華, 周龍?bào)J, World Wide Web 的索引與查詢(xún)技術(shù),計(jì)算機(jī)科學(xué) , 1997 [5] 吳立德等 , 大規(guī)模中文文本處理 , 復(fù)旦大學(xué)出版社, 1997 [6] 李唐, 解讀網(wǎng)絡(luò)圖像搜索引擎, Inter 網(wǎng)絡(luò), 20xx [7] 陳立娜, Inter 上的圖像檢索技術(shù),天極 yesky, [8] 黃博士,網(wǎng)絡(luò)環(huán)境下的圖像檢索技術(shù) ,中國(guó)計(jì)算機(jī)用戶(hù), 。 結(jié)束語(yǔ) 在 了解了搜索引擎搜索原理公式以及 反饋原理之后 ,我們 就能夠依 據(jù)其理論做出相應(yīng)的搜索引擎 ,并 且能作出 搜索效果 。 13 為決定 ITW, IAW, ICW, PTW在相似度 的 計(jì)算中的權(quán)值,測(cè)試 了 從 ~ 系數(shù)。從圖 3中 就 可以 得出 ,當(dāng)相似度臨界值 時(shí) 候 , 可以 保證檢索精度 80%,從圖 4中 得出 ,當(dāng)相似度臨界值 時(shí) 候 , 可以 保證檢索完全度 60%。在查詢(xún)語(yǔ)句建立后,通過(guò)詞條網(wǎng)對(duì)有相同語(yǔ)義的詞條進(jìn)行擴(kuò)充,構(gòu)建 了 符合查詢(xún)要求的多個(gè) IQW, 再 分別計(jì)算出各自的相似度, 依據(jù) 相似度 所 規(guī)定的臨界值,得 出查 詢(xún)的結(jié)果。從圖 1和圖 2又可以得 到 ,當(dāng)α =β =0無(wú)反饋 的 時(shí) 候 檢索 精準(zhǔn)度 =48%,當(dāng)α = ,β = 或 精準(zhǔn)度 =61%,引入反饋系統(tǒng)使檢索精度 可以 提高了 13%左右 。以上都是為了改善用戶(hù) 交互 界面,便于反饋系統(tǒng)應(yīng)用。實(shí)踐表明,帶 有反饋系統(tǒng)的圖像檢索系統(tǒng)要比沒(méi)有 反饋的圖像檢索精度提高 10%左右, 且 m越小,檢索 精度越高 . 在設(shè)計(jì)檢索系統(tǒng)的 過(guò)程中 ,提供有無(wú)反饋選擇,并且在反饋系統(tǒng)中提供取值 選 擇。反饋系統(tǒng)可根據(jù)用戶(hù)反饋 的結(jié)果,重新生成查詢(xún)語(yǔ)句 : 12 其中矢量 是檢索結(jié)果圖像網(wǎng)頁(yè)矢量表示,在矢量 中,選擇相似度計(jì)算中有貢獻(xiàn)的分量用作 反饋信息 。 文中 介紹的反饋系統(tǒng),主要對(duì)查詢(xún)語(yǔ)句 (Q1,W1,Q2,W2,? , Qm,Wm)中 Wj的修 改中,查詢(xún)語(yǔ)句中對(duì)初始 Wj的定義具有 偏差,反饋系統(tǒng)可以適量 調(diào)整 Wj,使查詢(xún)語(yǔ)句(Q1,W1,Q2,W2,? , Qm,Wm)更反映檢索 目的。 不過(guò),大多數(shù) 的 反饋并不 具備記憶能力,每次反饋 的結(jié)果只能 用于 本次查詢(xún)。 參考 文本信息檢索的方法,我們?cè)谙到y(tǒng)中也引入 到 了相關(guān)反饋 用 來(lái)修改用戶(hù)提交的查詢(xún),使得修改 以 后的查詢(xún) 慢慢接近用戶(hù)真正 需求, 用 來(lái)提高系統(tǒng)的性能。 以上通過(guò)將基于詞典的處理方法和基于頻率的統(tǒng)計(jì)方法結(jié)合起來(lái)匹配搜索運(yùn)算,不僅保證了切分速度快、精度高的優(yōu)點(diǎn),而且能夠結(jié)合上下文,最大限度的識(shí)別人名、地名、專(zhuān)業(yè)術(shù)語(yǔ)等未登錄 詞。 設(shè)已對(duì) C1?? Cn 進(jìn)行切分,由切分算法和歧義處理算法得到 C1?? Ci 為一個(gè)詞,Cj?? Cn為一個(gè)詞, Ci與 Cj之間皆為單字詞,即 C1?? Ci和 Cj?? Cn是相鄰最近的兩個(gè)多字詞,則將 Ci+1?? Cj1作為一個(gè)多字詞進(jìn)行詞頻統(tǒng)計(jì),在對(duì)文章全部切分完畢之后,若 Ci+1?? Cj1的出現(xiàn)次數(shù)達(dá)到 f時(shí),則將其看作一個(gè)詞,否則,將其拆分為單字詞。 9) 否則,轉(zhuǎn) 6)。 8) 若存在,分詞結(jié)束,返回最近一次能夠恰好匹配的 C3?? Cj(ji),并與 C1C2組合成詞。 6 ) i=i+1,若 i=n+3,轉(zhuǎn) 8);否則,轉(zhuǎn) 7)。 3) 存在,判斷 C1C2 是否為詞,并從詞典中獲取該詞下層節(jié)點(diǎn)漢字的最大長(zhǎng)度,設(shè)為 n 4) 若 n=0,一次分詞結(jié)束,保存結(jié)果。 (2)匹配方法 由于詞庫(kù)中的最大詞長(zhǎng)通常大于所切分出的詞長(zhǎng),為了提高切分的效率,不采用逐次減一個(gè)字的方法,而是使用正向逐一增 長(zhǎng)的方法。每一層各結(jié)點(diǎn)需按某種次序排列,可使用 hash、二分查找等方法進(jìn)行查詢(xún)。第三層存儲(chǔ)以某一雙字為首的所有詞。每一個(gè)可成詞的單字對(duì)應(yīng)一系列第二層結(jié)點(diǎn),用來(lái)存儲(chǔ)所有以該字為詞首的雙字(包括上述兩種情況 )。 2. 匹配方法: (1)詞典存儲(chǔ)格式: 首先對(duì)存儲(chǔ)形式進(jìn)行建模,結(jié)構(gòu)是 3層樹(shù)形結(jié)構(gòu),如下 A 1A 3A 2A 1 B 1 ( f , n 1 )A 1 C 1 ( t , n 3 )A 1 B 2 ( t , n 2 )A nA 1 D 1 ( t , n 4 )F 1G 2 H 1G 2H 1 R 1 T 1 一層存儲(chǔ)所有單字。在頻率超過(guò)某個(gè)預(yù)先設(shè)定得閾值時(shí),就將其作為一個(gè)詞進(jìn)行索引。 統(tǒng)計(jì)結(jié)果表明,單純使用正向最大匹配的錯(cuò)誤率為 1/169,單純使用逆向最大匹10 配的錯(cuò)誤率為 1/245,它切分的準(zhǔn)確率上比正向匹配法有很大提高 。若成功,則該子串為詞,指針后移 MAX 個(gè)漢字后繼續(xù)匹配,否則子串逐次減一進(jìn)行匹配。 分詞技術(shù)和匹配方法 1. 常用的切詞算法如下: (1)最大正向匹配法 基本思想是:設(shè) D 為詞典, MAX 表示 D 中的最大詞長(zhǎng), str 為待切 分的字串。 在查詢(xún)過(guò)程中,可以計(jì)算出每個(gè)文檔與查詢(xún)的相似度,進(jìn)而可以根據(jù)相似度的大小,將查詢(xún)的結(jié)果進(jìn)行排序。可以看出文檔含有完全相同的詞條時(shí),相似度 =1;而其中無(wú)相同時(shí)的詞條時(shí),相似度 =0。 TFIDF 公式有很多變種,下面是一個(gè)常用的 TFIDF 公式: ?????? ni iiiiinNdtfnNdtfd122 )(l o g))(() o g ()()(? 根據(jù)公式,文檔集中包含某一詞條的文檔越多,說(shuō)明它區(qū)分文檔類(lèi)別屬性的能力越低,其權(quán)值越??;另一方面,某一文檔中某一詞條出現(xiàn)的頻率越高,說(shuō)明它區(qū)分文檔內(nèi)容屬性的能力越強(qiáng),其權(quán)值越大。 檢索模型與相似度 在用向量空間模型進(jìn)行檢索的時(shí)候,首先 會(huì) 把描述網(wǎng)頁(yè)中的圖片的文字信息看作是有序的詞條序列,這樣把以上歸納的信息分別稱(chēng)為: ICW, ITW, IAW, PTW?,F(xiàn)在使用較多的為 布爾檢索 模型、概率檢索
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1