freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文改web中圖像的檢索技術(shù)研究-預(yù)覽頁(yè)

 

【正文】 支持多種語(yǔ)言和簡(jiǎn)單的自然語(yǔ)言 搜索 查詢。主要使用關(guān)鍵詞 搜索 ,可以用 符號(hào) + 或 - 來(lái)增加 、 排除關(guān)鍵詞,使 用 較少 關(guān)鍵詞會(huì)更有效。 (4) Amazing Picture Machine 是由 NCRTEC 開發(fā)的一個(gè) 真 —— 人工建立 完全 關(guān)鍵詞式索引 。 由于 是 人 工干預(yù)檢索過(guò)程,查準(zhǔn)率極好,但事物 的作用是相對(duì)的,人工干預(yù)也 限制了它的查全率。結(jié)果顯示信息非常 豐富,包括簡(jiǎn)圖、圖像大小、最后檢索 的日期、圖像文件名、圖像內(nèi)容 的描述詞、圖像所在頁(yè)面等。因?yàn)槭占Y料的 機(jī)器人,只可以從已知 的鏈接開始收集網(wǎng)頁(yè) 數(shù)據(jù),只有 小部分 Web 網(wǎng)頁(yè)和這些已知 的網(wǎng)頁(yè)有 鏈接 ;現(xiàn)在 為止還沒(méi)有一個(gè)搜索引擎可以 隨網(wǎng)頁(yè)內(nèi)容的更新 而 比較及時(shí)地更新 索引; (2)覆蓋面:地理 上 的 覆蓋面和主題 的 覆蓋面; (3)索引更新頻率:不同 類型 的 搜索引擎,索引更新頻率相差 非常大 ,有的是幾 月 ,有的是一年。并有 必要的幫助和 示范 。如 網(wǎng)頁(yè)排名 方法、位置方法、 概率方法、摘要方法 、詞性標(biāo)注法 、分類或聚類方法等,不僅技術(shù)發(fā)展 比較 成熟,同時(shí)分析和實(shí)現(xiàn)的難度 比較小 小。 但是 ,基于內(nèi)容的圖像檢索建立在多媒體信息 內(nèi)容語(yǔ)義上,可以 更為客觀地反映媒體本質(zhì)的特征。 并且 ,圖像庫(kù)檢索技術(shù)也 應(yīng)當(dāng) 面向網(wǎng)絡(luò),利用網(wǎng)絡(luò)技術(shù)進(jìn)行改造,提供新的 萬(wàn)維網(wǎng)訪問(wèn)界面 以 代替原來(lái)的應(yīng)用系統(tǒng)界面。從 最 基本的顏色檢索,到綜合利用多種圖像特征進(jìn)行檢索, 很多 原型系統(tǒng)已經(jīng)推出,其中, 有 部分已投入到實(shí)際應(yīng)用中以檢6 驗(yàn)其有效性?,F(xiàn)代多媒體信息系統(tǒng) 一個(gè)重要 的特征 就是信息獲取過(guò)程 中 的可交互性,人在系統(tǒng)中是 主導(dǎo)地位 。 一個(gè)優(yōu)秀的搜索引擎必須 能夠 處理以下幾個(gè)問(wèn)題: (1)網(wǎng)頁(yè) 分類 (2)自然語(yǔ)言 處理 (3)搜索策略 調(diào)度和協(xié)作 (4)面向特定用戶 搜索。隨著多媒體信息處理技術(shù)的日趨 發(fā)展和深化,圖像信息加工、處理和檢索標(biāo)準(zhǔn)的 陸續(xù) 出臺(tái),網(wǎng)上的圖像檢索技術(shù) 也會(huì)日趨完善,而圖 像搜索引擎也將成為 網(wǎng)絡(luò) 新寵。 當(dāng)然現(xiàn)在的人們也可以利用圖像的內(nèi)容特征去搜索所需的圖片信息,但現(xiàn)在這項(xiàng)技術(shù)就是到現(xiàn)在也還不夠成熟,其搜索效率還是不能令人滿意。比較基礎(chǔ)的技術(shù)有自動(dòng)分詞、人名和機(jī)構(gòu)名的自動(dòng)識(shí)別、自動(dòng)標(biāo)引等,其他像信息抽取、自動(dòng)文摘、文檔自動(dòng)分類、中文概念詞的自動(dòng)發(fā)現(xiàn)以及概念詞之間 的語(yǔ)義關(guān)系的確定等技術(shù)都必不可少。在 HTML 網(wǎng)頁(yè)中,根據(jù) HTML語(yǔ)言的格式,捕獲反映圖片信息的文字信息,分析這些文本的語(yǔ)義具有重要的意義。 (1)圖像的說(shuō)明,這些文本出 現(xiàn)在圖像的周圍,用一句過(guò)多句話表示出圖像的內(nèi)容,當(dāng)圖像被置于表格中時(shí),同一單元或相鄰單元格內(nèi)的文字也常用與表示圖像的含義。 以上討論的是 HTML中文檔和嵌入網(wǎng)頁(yè)中圖像文本信息的關(guān)系,當(dāng)然還存在其他的文本與多媒體信息和圖像有關(guān)。但以上信息在對(duì)圖像描述時(shí)側(cè)重于不同角度,同時(shí)與圖像信息的聯(lián)系程度也不一樣。根據(jù)信息的重要程度,他們所占的權(quán)值大小按次序如下: Image CaptionImage TitleImage AlternatePage Title 圖像信息檢索 Web 搜索引擎 使用 何種檢索模型,它所提供檢索質(zhì)量將 會(huì)直接影響到檢索效果。在應(yīng)用模型時(shí),我首先要將這些信息向量化,把文檔映射為一個(gè)特征向量 V(d)=(t1,ω 1(d);?; tn, ω n(d)),其中 ti(i=1,2, ? ,n)為一列互不雷同的詞條項(xiàng),ω i(d)為 ti在 d中的權(quán)值 , 一般被定義為 ti在 d 中出現(xiàn)頻率 tfi(d)的函數(shù),即 ))(()( dtfd ii ?? ? 在信息檢索中常用的詞條權(quán)值計(jì)算方法為 TFIDF 函數(shù) )l og ()( ii nNdtf ??? 其中 N為所有文檔的數(shù)目, ni為含有詞條 ti的文檔數(shù)目。 從而文檔 d與查詢 Q的相似度為 ???????? niiniiniiiqdqddQS i m12121))()(()(),(?? 根據(jù)文檔之間的相似度,結(jié)合 機(jī)器學(xué)習(xí)的一些算法如神經(jīng)網(wǎng)絡(luò)算法, K近鄰算法和貝葉斯分類算法等,可以將文檔集分類劃分為一些小的文檔子集。它是每次從 str 中取長(zhǎng)度為 MAX的子串與 D中的詞進(jìn)行匹配。 (3)基于詞頻的統(tǒng)計(jì)方法 統(tǒng)計(jì)方法一般不依賴于詞典,而是將原文中任意前后緊鄰的兩個(gè)字作為一個(gè)詞進(jìn)行出現(xiàn)頻率的統(tǒng)計(jì),出現(xiàn)的 次數(shù)越高,成為一個(gè)詞的可能性也就越大。第二層保存所有的雙字詞和多字詞的前兩個(gè)字(因?yàn)?,也許會(huì)出現(xiàn)ABC為詞,但 AB 不是詞的情況),并對(duì)兩者做不同標(biāo)記 (t/f)。為了減少存儲(chǔ)空間,只存儲(chǔ)除去該雙字以外的部分(如上圖所示)。 假設(shè)對(duì)一個(gè)句子 C1C2??進(jìn)行分詞處理,算法描述如下: 1) 兩個(gè)字(開始時(shí)為 C1C2),在詞典中查詢 C1C2是否存在 2) 不存在,則 C1為單字詞,一次分詞結(jié)束,返回 1。 11 7) 再取一個(gè)字(此處為 Ci),判斷第三層中是否有以 C3?? Ci 開始的字 (不需要恰好匹配,只要匹配開始的 i個(gè)字就 可以了 )。 (3)統(tǒng)計(jì)方法運(yùn)用 由于詞典的不完全性,許多詞可能不會(huì)在字典中登錄,為了處理句子中的未登錄詞,我們?cè)谠械乃惴ㄖ星度朐~頻統(tǒng)計(jì)方法,將某些出現(xiàn)頻率較高的連續(xù)字段作為一個(gè)詞切分,我們首先對(duì)頻度設(shè)定一個(gè)閾值 f。 檢索反饋 因?yàn)?開始 時(shí)的查詢語(yǔ)句 常常和 我們所要的圖 片 內(nèi)容不符 合,往往使我們找不到想要的圖片,因此,許 多 系統(tǒng)都引入了相關(guān) 的 反饋,就是 通過(guò)選擇一些例子 來(lái)作為反饋, 慢慢 提高檢索的結(jié)果。因此我們引入語(yǔ)義網(wǎng)絡(luò), 并且 把每次反饋的結(jié)果記錄到 語(yǔ)義網(wǎng)絡(luò) 當(dāng)中,使 系統(tǒng)的效果隨著使用次數(shù)的增多而慢慢 提高。在公式 5中, 通常 選γ =1 , 0〈 β〈 1 , 0〈 α〈 1 ,β與α值選取影響反饋深度,也直接影響檢索精度。下面是測(cè)得 如果 m=1時(shí),檢索精度與反饋中系數(shù)α、β之間關(guān)系的曲線,圖中可以得出α = 時(shí)檢索 精準(zhǔn)度 取最大值,圖 2中可以得 到 β在 ~ 之間時(shí)檢索 準(zhǔn)確度 取最大值。 實(shí)驗(yàn) 說(shuō)明了 ,合理地選取相似度臨界值可 以 保證 比 較高檢索精度 和 檢索完全度。最終 可以 得出 ICW, ITW, IAW, PTW的權(quán)值分別為 、 、 、 , 可 以 比較合理地反映出圖 像和 這些文本的相關(guān)性, 從而保證檢索 準(zhǔn)
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1