freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于深度神經(jīng)網(wǎng)絡(luò)的圖像檢索系統(tǒng)設(shè)計與實現(xiàn)-wenkub

2022-12-17 01:14:27 本頁面
 

【正文】 ........................................................ 3 課題背景及意義 ................................................................................................... 3 相關(guān)領(lǐng)域研究現(xiàn)狀 ............................................................................................... 4 ...................................................................................... 4 ...................................................................................... 5 論文研究內(nèi)容及成果 ............................................................................................ 5 論文結(jié)構(gòu)安排 ..................................................................................................... 7 第二章 基礎(chǔ)知識及技術(shù) .............................................................................................. 8 引言 ................................................................................................................... 8 卷積神經(jīng)網(wǎng)絡(luò)( CNN) ........................................................................................ 8 歷史 .......................................................................................................... 8 結(jié)構(gòu) .......................................................................................................... 8 特性 .......................................................................................................... 8 訓(xùn)練 .......................................................................................................... 8 稀疏自編碼( Autoencoder ) .............................................................................. 8 歷史 .......................................................................................................... 8 Autoencoder 結(jié)構(gòu) ...................................................................................... 8 Sparse Autoencoder 結(jié)構(gòu) ............................................................................ 8 特性 .......................................................................................................... 8 訓(xùn)練 .......................................................................................................... 8 相關(guān)工程技術(shù) ...................................................................................................... 8 Caffe 機器學(xué)習工具 ..................................................................................... 8 flann 近鄰檢索庫 ........................................................................................ 9 Cassandra amp。另一種方式是 20 世紀90年代興起的,基于內(nèi)容的圖像檢索( contentbased image retrieval , CBIR),也就是常說的“圖找圖”方式,人們不用去描述, 可以 直接表達完全所需搜索的圖片,確定性更高,更能滿足當今移動互聯(lián)網(wǎng)的發(fā)展趨勢。 BOV應(yīng)用很廣,各種各樣的改進版本層出不窮。 互聯(lián)網(wǎng)上能夠爬取到的圖片大多是無標注圖片數(shù)據(jù),即沒有文字標注的信息,僅能用于無監(jiān)督訓(xùn)練,而可用于有監(jiān)督訓(xùn)練的有標圖片數(shù)據(jù)為很少,并且人工標注數(shù)據(jù)成本大,一般任務(wù)很難承受其成本?,F(xiàn)在深度神經(jīng)網(wǎng)絡(luò)已經(jīng)得到了極大發(fā)展,發(fā)展出多種 類型:深度循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、 Deep Autoencoder 網(wǎng)絡(luò)等, 有監(jiān)督方法和無監(jiān)督方法均有,對圖片分類、標注、分割等任務(wù)的發(fā)展都起到了跨越式的促進作用, 它 不 僅能用于提取圖片深層特征,還能提取圖片的深層語義表示等。 Bag of Visual Words( BOV)模型,它首先對海量圖片提取特征描述符,然后通過 Kmeans 方法選出基描述符,做成詞典,再對每個圖片用 KNN方法轉(zhuǎn)換成描述符文檔,最后利用文本檢索積累下來的技術(shù)進行搜索,這種方法成熟有效,并且出現(xiàn)各種改進方法,例如嵌入 hamming 碼減少經(jīng)驗誤差,增進單個描述符的表現(xiàn)能力。 LSH的研究是最多的,改進也 最多,但是仍然很難突破其極限,模型本身限制很多。 神經(jīng)網(wǎng)絡(luò) Hash 采用的是 Autoencoder Hash,使用深度 Autoencoder 計算Hash,其輸入為原始圖片像素值,通過大規(guī)模數(shù)據(jù)訓(xùn)練,求解到 Autoencoder 網(wǎng) 絡(luò)訓(xùn)最符合數(shù)據(jù)分布的模型。 CNN特別適合處理 多維 信息,尤其是圖片信息 。 2021 年 Hinton 發(fā)表文章 [3], 將 Autoencoder用于 高緯度數(shù)據(jù)降緯, 引起 很大反響, Autoencoder很快被人們熟知。 ( 1)實現(xiàn)基于深度神經(jīng)網(wǎng)絡(luò)的圖像檢索系統(tǒng) 一個完整的圖像檢索系統(tǒng)包括圖片爬取、存儲、建立索引、檢索系統(tǒng)等幾部分組成,其中最為關(guān)鍵的是索引和檢索兩部分, 本文 分別對兩部分進行研究、 實現(xiàn) 。此外,工程實現(xiàn)方面又包括兩方面:一方面,需要設(shè)計出符合要求且拓展性強的框架,采用優(yōu)秀的網(wǎng)絡(luò)框架實現(xiàn),尤其是采用分布式及存儲相關(guān)技術(shù)構(gòu)建整個檢索系統(tǒng);另一方面,最大的任務(wù)在于將神經(jīng)網(wǎng)絡(luò)實現(xiàn)代碼與網(wǎng)絡(luò)檢索服務(wù)在工程上結(jié)合,完成基于深度神經(jīng)網(wǎng)絡(luò)的圖像檢索系統(tǒng)后臺服務(wù),由于主流神經(jīng)網(wǎng)絡(luò)工具未考慮上線問題,本文修改相關(guān)代碼完成該任務(wù)。大多數(shù)情況下,特征用多維空間的點(或矢量)來描述,空間的維數(shù)可能低至幾維,也可能大至數(shù)千維。 LSH 模型本身限制很多,對尺度、旋轉(zhuǎn)、視角變化的敏感,僅能用于高度相似搜索,很多應(yīng)用中,將其與 用于提升BOV 方案效果,但已經(jīng)成了一種輔助手段。 ( 3)綜合利用有標、無標數(shù)據(jù)進行檢索系統(tǒng)設(shè)計 本文對綜合利用有標圖片和無標圖片來實現(xiàn)圖像檢索系統(tǒng)進行設(shè)計,利用有標數(shù)據(jù)訓(xùn)練 CNN 神經(jīng)網(wǎng)絡(luò),通過 CNN 神經(jīng)網(wǎng)絡(luò)提取出圖片的深層語義特征,然后利用無標特征數(shù)據(jù), 訓(xùn)練 Autoencoder Hash。 CNN 特征是一種利用有標數(shù)據(jù)獲得的全局特征, 更適合 注重整體的語義檢索,而不是高度相似的檢索,符合設(shè)計需求。 Autoencoder Hash 是的數(shù)據(jù)相關(guān) Hash,對 Autoencoder 網(wǎng)絡(luò)中間增加一個二值化的過程,整體的訓(xùn)練目標及訓(xùn)練過程不變,這就形成了一個等效的語義 Hash 模型,使用 Autoencoder Hash 擬合數(shù)據(jù)分布的, 表現(xiàn) 更優(yōu)秀。最后針對 CNN 抽取出來的圖像數(shù)據(jù)集,實現(xiàn)并修改 LSH、 Spectical Hash、 Autoencoder Hash 三種Hash 索引算法,在該數(shù)據(jù)集上進行實驗、并對分析。 第五章 為總結(jié)與展望 ,該章對全篇 論文進行了總結(jié) , 分析當前 系統(tǒng)設(shè)計實現(xiàn)上的 優(yōu)劣,然后對未來可改進的方向進行了深 度 地 探討。 Caffe 是 純粹的 C++/CUDA架構(gòu) ,支持命令行、 Python 和 Matlab 接口,可以在 CPU 和 GPU 間直接切換 。 ? 速度快 。 Caffe 可以說是各個框架中唯一能夠穩(wěn)定線上部署深度學(xué)習的框架。 ? 開放性 。 Caffe 由于速度和穩(wěn)定的原因可以說非常適合本系統(tǒng)開發(fā)、實驗, 作為 線上服務(wù)的不二選擇。 LevelDB 數(shù)據(jù)庫 Apache Cassandra 是一套開源分布式 KeyValue 存儲系統(tǒng)。 ? 模式靈活:使用 Cassandra,像文檔存儲,你不必提前解決記錄中的字段。 Leveldb 是一個 google 實現(xiàn)的非常高效的 KeyValue 數(shù)據(jù)庫,目前的版本能夠支持 billion 級別的數(shù)據(jù)量了。 本系統(tǒng)分別采用了這兩種 KeyValue 數(shù)據(jù)庫,可以任意切換,實現(xiàn)分 布式環(huán)境和單機環(huán)境不同的檢索系統(tǒng)。 Thrift 允許你定義一個簡單的定義文件中的數(shù)據(jù)類型和服務(wù)接口,以作為輸入文件,編譯器生成代碼用來方便地生成 RPC 客戶端和服務(wù)器通信的無縫跨編程語言, 用法 非常簡單。它可以給開發(fā)者以最大的靈活性,既能創(chuàng)建非常小的網(wǎng)站也能構(gòu)建大型的企業(yè)應(yīng)用,可以幫開發(fā)者構(gòu)建一個完美的網(wǎng)絡(luò) APP,而且每行代碼都可以簡潔、富于表達力。 Laravel 的擴展包由世界各地的開發(fā)者貢 獻,而且還在不斷增加中。Laravel 幾乎可以搞定任何 web 應(yīng)用,和 js的一些前端框架兼容得非常完美。所有開發(fā)者都能快速上手、所有設(shè)備都可以適配、所有項目都適用你的網(wǎng)站和應(yīng)用能在 Bootstrap 的幫助下通過同一份代碼快速、有效適配手機、平板、 PC 設(shè)備,這一切都是 CSS 媒體查詢的功勞。 本章小結(jié) 第三章 圖像檢索算法研究 基于 CNN 特征的圖像檢索 Hash 模型 圖片檢索系統(tǒng)的圖片來來源于互聯(lián)網(wǎng), 而 互聯(lián)網(wǎng)上能夠爬取到的圖片大多是無標注圖片,即沒有文字標注的信息,僅能用于無監(jiān)督訓(xùn)練,學(xué)習效果不佳,可用于有監(jiān)督訓(xùn)練的高質(zhì)量有標數(shù)據(jù)很少,如果采用人工標注數(shù)據(jù)則成本大,一般來說很難承受其成本。 一般 來說, 這種 相似最理想的是人眼看到的相似,可是 這很難通過計算度量, 所以 就需要一些模擬“人眼觀察”的可計算特征來度量兩張圖片的相似性,例如: SIFT、 HOG等。這樣條件下, 如果 能夠 降低對檢索結(jié)果精確的要求, 近似 求解, 但是 檢索速度大幅提升, 尤其 是能夠設(shè)計出線性時間檢索的系統(tǒng), 更 具有誘惑力。 從公式 ? ?? ? prxqDP ??, 中可以得出,在 r一定的條件下,概率 p值越大,效果 越好。 圖像檢索系統(tǒng)中特征具有至關(guān)重要的地位,它的好壞直接關(guān)系到系統(tǒng)的性能。 這 4096 特征為整個實驗的基礎(chǔ),為下文提供標準的可度量數(shù)據(jù)。在原空間中的相近的點,在 hamming 空間中具有相同的 Hash 值為終極目標。 就圖像任務(wù)而言, Rerank 采取與 CNN 特征相同的度量線性查找,即通過 CNN 特征抽取器計算待檢索圖像的 4096 特征,再計算 Hash 值,找到與其粗略近似的小候選集,再對小候選集合進行使用 4096 特征進行距離計算,對檢索結(jié)果重新排序,再給出新的檢索集合(小于或者等于候選集大?。@樣最先出現(xiàn)在 用戶面前的圖片, 具有 最高的相似度。在本文中為原實數(shù)空間O為 CNN 提取出的圖像 4096 特征,點的相近用歐氏距離表示, Hamming 空間 X代表二進制 Hash 值,點的相近用 Hamming 距離表示,此時,函數(shù) f 表示 Hash索引建立中的 Hash 函數(shù)(或者外加重排序操作)。 39。 【 Indyk P,Motwani nearest neighbortowards removing the curse of
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1