freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文改web中圖像的檢索技術(shù)研究-免費閱讀

2025-06-27 05:56 上一頁面

下一頁面
  

【正文】 最終 可以 得出 ICW, ITW, IAW, PTW的權(quán)值分別為 、 、 、 , 可 以 比較合理地反映出圖 像和 這些文本的相關(guān)性, 從而保證檢索 準(zhǔn)確性 。下面是測得 如果 m=1時,檢索精度與反饋中系數(shù)α、β之間關(guān)系的曲線,圖中可以得出α = 時檢索 精準(zhǔn)度 取最大值,圖 2中可以得 到 β在 ~ 之間時檢索 準(zhǔn)確度 取最大值。因此我們引入語義網(wǎng)絡(luò), 并且 把每次反饋的結(jié)果記錄到 語義網(wǎng)絡(luò) 當(dāng)中,使 系統(tǒng)的效果隨著使用次數(shù)的增多而慢慢 提高。 (3)統(tǒng)計方法運用 由于詞典的不完全性,許多詞可能不會在字典中登錄,為了處理句子中的未登錄詞,我們在原有的算法中嵌入詞頻統(tǒng)計方法,將某些出現(xiàn)頻率較高的連續(xù)字段作為一個詞切分,我們首先對頻度設(shè)定一個閾值 f。 假設(shè)對一個句子 C1C2??進(jìn)行分詞處理,算法描述如下: 1) 兩個字(開始時為 C1C2),在詞典中查詢 C1C2是否存在 2) 不存在,則 C1為單字詞,一次分詞結(jié)束,返回 1。第二層保存所有的雙字詞和多字詞的前兩個字(因為,也許會出現(xiàn)ABC為詞,但 AB 不是詞的情況),并對兩者做不同標(biāo)記 (t/f)。它是每次從 str 中取長度為 MAX的子串與 D中的詞進(jìn)行匹配。在應(yīng)用模型時,我首先要將這些信息向量化,把文檔映射為一個特征向量 V(d)=(t1,ω 1(d);?; tn, ω n(d)),其中 ti(i=1,2, ? ,n)為一列互不雷同的詞條項,ω i(d)為 ti在 d中的權(quán)值 , 一般被定義為 ti在 d 中出現(xiàn)頻率 tfi(d)的函數(shù),即 ))(()( dtfd ii ?? ? 在信息檢索中常用的詞條權(quán)值計算方法為 TFIDF 函數(shù) )l og ()( ii nNdtf ??? 其中 N為所有文檔的數(shù)目, ni為含有詞條 ti的文檔數(shù)目。但以上信息在對圖像描述時側(cè)重于不同角度,同時與圖像信息的聯(lián)系程度也不一樣。 (1)圖像的說明,這些文本出 現(xiàn)在圖像的周圍,用一句過多句話表示出圖像的內(nèi)容,當(dāng)圖像被置于表格中時,同一單元或相鄰單元格內(nèi)的文字也常用與表示圖像的含義。比較基礎(chǔ)的技術(shù)有自動分詞、人名和機(jī)構(gòu)名的自動識別、自動標(biāo)引等,其他像信息抽取、自動文摘、文檔自動分類、中文概念詞的自動發(fā)現(xiàn)以及概念詞之間 的語義關(guān)系的確定等技術(shù)都必不可少。隨著多媒體信息處理技術(shù)的日趨 發(fā)展和深化,圖像信息加工、處理和檢索標(biāo)準(zhǔn)的 陸續(xù) 出臺,網(wǎng)上的圖像檢索技術(shù) 也會日趨完善,而圖 像搜索引擎也將成為 網(wǎng)絡(luò) 新寵?,F(xiàn)代多媒體信息系統(tǒng) 一個重要 的特征 就是信息獲取過程 中 的可交互性,人在系統(tǒng)中是 主導(dǎo)地位 。 并且 ,圖像庫檢索技術(shù)也 應(yīng)當(dāng) 面向網(wǎng)絡(luò),利用網(wǎng)絡(luò)技術(shù)進(jìn)行改造,提供新的 萬維網(wǎng)訪問界面 以 代替原來的應(yīng)用系統(tǒng)界面。如 網(wǎng)頁排名 方法、位置方法、 概率方法、摘要方法 、詞性標(biāo)注法 、分類或聚類方法等,不僅技術(shù)發(fā)展 比較 成熟,同時分析和實現(xiàn)的難度 比較小 小。因為收集資料的 機(jī)器人,只可以從已知 的鏈接開始收集網(wǎng)頁 數(shù)據(jù),只有 小部分 Web 網(wǎng)頁和這些已知 的網(wǎng)頁有 鏈接 ;現(xiàn)在 為止還沒有一個搜索引擎可以 隨網(wǎng)頁內(nèi)容的更新 而 比較及時地更新 索引; (2)覆蓋面:地理 上 的 覆蓋面和主題 的 覆蓋面; (3)索引更新頻率:不同 類型 的 搜索引擎,索引更新頻率相差 非常大 ,有的是幾 月 ,有的是一年。 由于 是 人 工干預(yù)檢索過程,查準(zhǔn)率極好,但事物 的作用是相對的,人工干預(yù)也 限制了它的查全率。主要使用關(guān)鍵詞 搜索 ,可以用 符號 + 或 - 來增加 、 排除關(guān)鍵詞,使 用 較少 關(guān)鍵詞會更有效。 能夠漫游 Web、 Use、 Use FAQs 等等。 此外 ,由于圖 片所包含的信息量 很 龐大,不同 類 型 用戶對同一張圖 片 的看法又不盡相同, 就像 一萬個讀者有一萬個哈姆雷特一般,從而導(dǎo)致了對圖像 標(biāo)注缺乏統(tǒng)一標(biāo)準(zhǔn)。 圖像搜索引擎檢索途徑 傳統(tǒng)圖像檢索技術(shù) 是 靠關(guān)鍵字 精確 的 匹配 來 檢索 , 即輸入 關(guān)鍵字,輸出圖 片 。 當(dāng) 前,圖 片 搜索引擎 大多 通過以下兩 類 方法 來 識別圖像: (1)自動查找圖像 檔 。頁面信息是通過元數(shù)據(jù)這類 形式 來保存的,經(jīng)典的元數(shù)據(jù)有 標(biāo)題、 IP 地址、該頁面簡要的介紹、關(guān)鍵字抑或是索引短語、文件大小和最后 更新的日期 等等。 2 網(wǎng)絡(luò) 檢索 的基本原理 其實就 是通過 Spider 定期在 web 上運行,發(fā)現(xiàn)新的數(shù)據(jù),把其取回到本地數(shù)據(jù)庫中,讓用戶 查詢 的 請 求可通過查詢本地的數(shù)據(jù)庫 得到。 由此 , 便出現(xiàn) 了 搜索引擎。雖然 搜索引擎 的出現(xiàn) 給 用戶提供了不少的 便捷 ,但 是 離 精準(zhǔn)、快速、全面的檢索到 自己所 想 要的圖像還 是有一段 距離 ,所以對圖像 搜 索的 研究還要下大力氣研究。 常用的網(wǎng)絡(luò)信息檢索實現(xiàn)機(jī)制可 分為 兩種, 通過手工方式對網(wǎng)頁進(jìn)行索引 是 一種方法 , 但它的缺陷 是 Web覆蓋 率 低, 且 不能保證 是最新的 息。雖然 元數(shù)據(jù)有一定的標(biāo)準(zhǔn),但是很多站點都 是使 用自己的模板。通過 IMGSRC 和 HREF( HTML 標(biāo)簽)來檢 查 是否 有 可顯示的圖片 文件, IMGSRC 表達(dá) 的是 “ 顯示下面的圖像文件 ” ,導(dǎo)向 嵌入式 的 圖 片 ; HREF 則 是 用來 表示 “ 下面是一個鏈接 ” ,導(dǎo)向 被鏈接的圖 片 。它 包3 括兩種途徑: (1)基于圖 片 外部信息進(jìn)行 搜索 。 2. 圖像可視屬性 檢索 基于圖像內(nèi)容的 搜索 主要是由圖 片 分析軟件自動 提取 圖 片 的顏色、 類型 等特征, 從而 建立特征 數(shù)據(jù) 庫,其輸入 的 弱國為用戶要查找圖 片 的大致特征 或示例, 則 通過一定相似 匹配規(guī)則,輸出為與 該 圖片具有相近特征的圖 片 ,按相似 的 程度 來 排列, 以 供用戶選擇,從而 解決了 在傳統(tǒng)圖像檢索技術(shù)中一 般用戶難以完成的圖像特征描述、提取與識別等難題 。 不過不支持布爾操作,但可以使用 +和 。在高級 模4 式 中,可以將檢索結(jié)果圖像 鎖定 在 GIF、 PNG、 JPEG 等格式中。它 檢索范圍很有限,只包括 web 上人工選擇的部分站點。索引更新頻率 一般有 兩種定義,一種 用的比較少 的 定義是新的網(wǎng)頁能被收進(jìn)索引數(shù)據(jù)庫中,另 外 一種是同一頁多 長 時間才 會 被檢查一次,有必要時 會 更新索引。但是 由 于 受控詞匯本身的局限, 容易產(chǎn)生 歧義,更新慢,所以不太 好應(yīng)對網(wǎng)絡(luò)上日新月異的各類圖像。同時 把 巨大的圖像庫資源利用網(wǎng)絡(luò)實現(xiàn)共享 (4)對基于內(nèi)容編
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1