【正文】
late the emotional feeling of people caused by the observed image and the image using semantic representations emotionally, is leading subject of a great challenge. Emotional image retrieval research in medicine, psychology, smart science, sociology, puter science, etc. in the field of agricultural science has great value. Lowlevel visual features and the relationship between highlevel semantic image this study, such as static, dynamic relationship between the images and emotions. First, create the image database containing dynamic static. Collected 200 contains dynamic and static sense, the art of image content on the Inter (such as oil painting, watercolor painting, Chinese painting, including Eastern and Western works). Then ask students to make three dynamic image assessment, scoring, and finally get that contains 200 quiet sense of class and the dynamic class image database. Secondly, the use of lines to extract image edge direction histogram feature information, then it can be improved algorithm based on paring the classification accuracy. And bined Weighted kNN, kNN, BP neural work classifier three kinds of emotional image database categorize improve the image retrieval accuracy. Use classification principle is: if the classification accuracy, then retrieved the results are correct, and vice versa. Through this experiment proved that with respect to the kNN, Weighted kNN classifier, BP neural work classifier correct rate is relatively high, the classification was . kNN, Weighted kNN were and . Can be improved by improving the training samples to improve the classification rate. This paper focuses on the line direction histogram, kNN, Weighted kNN, BP neural work classifier algorithm. Keywords: Visual features calculation emotional image retrieval line direction histogram the classifier 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 1 引言 隨著信息化時(shí)代的到來(lái)和信息傳播速度大力的提升,越來(lái)越多的圖像信息被人們所接觸。雖然文本圖像檢索大大的提高了圖像檢索的效率,但是有些圖像的關(guān)鍵字比較抽象、難以描述,加之一千個(gè)讀者便有一千個(gè)哈姆雷特,中國(guó)漢字的多義性使得結(jié)果往往不如人意。情感圖像檢索的研究與人類的視覺(jué)感受到的信息密切相關(guān),通過(guò)研究這兩者之間的關(guān)系,對(duì)未來(lái)的發(fā)展具有什么重要的意義和作用。它是先對(duì)圖像進(jìn)行文字內(nèi)容的注解,然后在圖像數(shù)據(jù)庫(kù)里進(jìn)行檢索。再者,不同地區(qū)不同國(guó)籍之間的自然語(yǔ)言理解和表述問(wèn)題對(duì)文本的描述也存在差異,這又給檢索造成了新的困難,盡管可以借用詞典或者互聯(lián)網(wǎng)得到簡(jiǎn)化,但是,同時(shí)使得檢索的表達(dá)能力受到了極大的限制。 圖 11 搜狗圖像搜索示例 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 3 由圖可以看出,圖 11 中的第二排最后一幅圖檢索到了大猩猩,第三排第 5列檢索到了海龜,這些圖片都是不符合要求的。根據(jù)實(shí)驗(yàn)結(jié)果,基于內(nèi)容的圖像檢索比較以前的檢索系統(tǒng)有很大的進(jìn)步。 圖 13 圖像檢索系統(tǒng)概念示例 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 4 基于情感圖像檢索的概念 圖像語(yǔ)義有好幾層 [ 4, 5 ]。情感圖像語(yǔ)義的自動(dòng)推導(dǎo)將延長(zhǎng)圖像索引和檢索目前的可能性范圍。圖像中的顏色、形狀、紋理與圖像中包含的情感是緊密相關(guān)的。同理,色彩 飽和度的差異也給人不同的感受。例如,紅玫瑰代表熱情、興奮、強(qiáng)烈、好戰(zhàn)、希望、奮進(jìn),綠色 的草地代表新鮮、清新、和平,藍(lán)色的天空代表清爽、自由、寧?kù)o。 形狀中的情感 形狀特征是情感圖像中最核心的特征,它可以清晰的反映出圖像的區(qū) 域、輪廓的基本特征。 未來(lái)的研究趨勢(shì) 三個(gè)關(guān)鍵問(wèn)題的改進(jìn)依賴于對(duì)其他相關(guān)領(lǐng)域進(jìn)一步的了解,例如,使用認(rèn)知科學(xué)和心理學(xué)的輸出來(lái)設(shè)計(jì)更好的圖像特征,這與圖像的情感有著密切的關(guān)系并且可以表達(dá)圖像語(yǔ)義;使用最 新的研究人工智能成果和機(jī)器學(xué)習(xí)來(lái)改善情感的重組和推理效率。總的想法是建立一個(gè)特定的配置文件為特定用戶或用戶組,來(lái)記錄個(gè)人喜好和共同的情感之間的自適應(yīng)信息。 在產(chǎn)品的圖像檢索, BAEK[ 11 ]定義的用戶配置文件僅僅通過(guò)感性的重量,通過(guò)用戶反饋,這些關(guān)鍵的重量和感性可以學(xué)習(xí)和變化 。從文本和圖像梳理功能,從不同媒體的更多的信息可以被集成到推導(dǎo)出情感語(yǔ)義。這種方法可用于提取圖像的情感語(yǔ)義理解之間的語(yǔ)義關(guān)系和一般情感語(yǔ)義。羅 斯 [ 14 ]研究基于美觀的圖像自動(dòng)合成拉爾夫的審美方式。 建筑實(shí)踐的目的一般系統(tǒng) 由于大多數(shù)的圖像檢索系統(tǒng)目前提出的情緒基于特定領(lǐng)域的知識(shí)和具體的畫廊喜歡繪畫,圖案,紡織品,工藝對(duì)象,背景或景觀,它們是簡(jiǎn)單的,在特定的領(lǐng)域有限公司。 原始的線條方向直方圖 對(duì)于某個(gè)圖像某點(diǎn)的方向梯度相角 ( ),xyq ,可以通過(guò)求它在某一點(diǎn)的導(dǎo)數(shù),然后對(duì)它的正切取導(dǎo)數(shù),例如 ? ?? ?? ?f x ,yxθ x ,y = a r c tg f x ,yy?????? ???? (21) 其中, ? ?90 90? ??? , ,因?yàn)閳D像邊緣點(diǎn)的方向和此點(diǎn)的梯度方向垂直,所以此點(diǎn)的方向即此點(diǎn)的切線方向夾角范圍是 ? ? ? ? ? ?α x ,y = θ x ,y + 9 0 ,α 0 ,1 8 0? ? ??。 ? ? ? ? ? ?? ? 2nE Q I Q Ij 1d H ,H = H j H j? (22) (1)原圖 (2)線條圖 (3)直方圖 圖 21 動(dòng)感圖像特征 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 8 (1)原圖 (2)線條圖 (3)直方圖 圖 22 靜感圖像特征 (1) (1)原圖 (2)線條圖 (3)直方圖 圖 23 靜感圖像 特征 (2) 改進(jìn)的線條方向直方圖 根據(jù)研究表明,水平線和垂直線同樣給人以安靜溫馨的感覺(jué),也就是說(shuō),在0176。與 180176。到 45176。它由輸入層、輸出層和隱含層組成。首先,信號(hào)傳遞到輸入端,通過(guò)第二隱含層的多層復(fù)雜的運(yùn)算加工,傳遞到輸出端,比較實(shí)際結(jié)果與輸出端的期望值,如果他們之間存在誤差,那么就將結(jié)果重新反饋回隱含層,經(jīng)過(guò)隱含層的多級(jí)處理,又重新反饋給輸入層,輸入層又重復(fù)第一次的過(guò)程,一次次運(yùn)算,減 少誤差率,已達(dá)到滿意的結(jié)果。 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 10 Weighted kNN 分類器 圖 26 K近鄰法 圖 27 Wighted k近鄰法 k近鄰法中,當(dāng)樣本比較少時(shí), kNN 法就不合適了。 圖 31 基本框架 [ 16 ] 由圖 31 可知,情感圖像檢索系統(tǒng)主要研究如下四個(gè)方面的內(nèi)容 : 1) 建立圖像感性特征數(shù)據(jù)庫(kù),即通過(guò)定義圖像的感性認(rèn)識(shí),抽離概括引起人們情感變動(dòng)的重要特征; 2)收集用戶情感信息,利用形容詞的感性特點(diǎn),讓其與情感數(shù)據(jù)庫(kù)進(jìn)行匹配; 3)通過(guò)圖像數(shù)據(jù)庫(kù),提取特征子函數(shù),然后將其與情感圖像數(shù)據(jù)庫(kù)進(jìn)行檢索; 4)通過(guò)學(xué)習(xí)能力,依據(jù)不同的情況,確保正確率提高的情況下,自主調(diào)節(jié)情感用戶模型。MATLAB 軟件的圖標(biāo)如圖 32 所示。標(biāo)量也被 MATLAB 當(dāng)作數(shù)組,只不過(guò)只有一行和一列。當(dāng) MATLAB 程序啟動(dòng)時(shí),一個(gè)叫做 MATLAB 桌面的窗口出現(xiàn)了。( 4)控制系統(tǒng)的設(shè)計(jì)。( 8)財(cái)務(wù)和金融工程。評(píng)分標(biāo)準(zhǔn)采用 10 分制, 15 分代表靜態(tài), 1 時(shí)表示靜感最強(qiáng)烈,靜感強(qiáng)度依次減弱, 5 時(shí)靜感最低; 610 分代表動(dòng)態(tài),動(dòng)感強(qiáng)度依次增強(qiáng), 10時(shí)表示動(dòng)感最強(qiáng)烈。表 41 為三位同學(xué)評(píng)估情感圖像的部分匯總表。 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 15 圖 43 ImgDB 數(shù)據(jù)庫(kù) 動(dòng)感語(yǔ)義的圖像 靜感語(yǔ)義的圖像 圖 44 ImgDB 數(shù)據(jù)庫(kù)下的靜感和動(dòng)感圖像示例 線條方向直方圖的改進(jìn)算法與原始算法的分類正確率的比較 圖 44 分別代表的是 5176。 基于情感圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 16 圖 44 線條方向直方圖的改進(jìn)算法與原始算法的分類正確率的比較 圖 44 的左列的圖片是動(dòng)態(tài)的,右列的圖片是靜態(tài)的。量化。 15176。 神經(jīng)網(wǎng)絡(luò)分類器 ( 基于 Matlab 工具包實(shí)現(xiàn) 2 BPNeuralNetworkClassifier 實(shí)現(xiàn)了 39。 特征 . 4 CalcVectorCosineDistance. 用來(lái)進(jìn)行計(jì)算 2 個(gè)特征向量之間的 39。 近鄰分類器 , 分類一個(gè)未知樣本的類別 8 kNNClassifierTestingDataSe 用于實(shí)現(xiàn) 39。 和 39。 神經(jīng)網(wǎng)絡(luò)分類器 ( 基于 Matlab 工具包實(shí)現(xiàn) ) 14 用于實(shí)現(xiàn)權(quán)重 39。 近鄰分類器 特征庫(kù)的計(jì)算過(guò)程 首 先,在 MATLAB 運(yùn)行 ,然后彈出圖 45,表明系統(tǒng)正在進(jìn)行特征數(shù)據(jù)庫(kù)的計(jì)算。 例如,我們選擇了 這張圖片,正常情況下,分類結(jié)果應(yīng)該是 static 靜態(tài)的,但是由于 BP 神經(jīng)網(wǎng)絡(luò)分類器 分類的正確率不是 100%,肯能就會(huì)有分類錯(cuò)誤的情況發(fā)生,如圖 49,系統(tǒng)輸出錯(cuò)誤的提示,錯(cuò)將 static 分類成了 dynamic,并錯(cuò)誤的檢索出相似度按由小到大順序排列的 19 幅相似圖片,由圖 410 所示 。量化 圖 413 正確檢索到 19 幅與示例圖像相似的動(dòng)態(tài)圖片 由以上圖 4圖 411 兩幅圖可知,當(dāng) k 值、量化單位相同,分類器不同時(shí),分類出來(lái)相似度的結(jié)果不相同;由圖 41圖 412 兩幅圖可知,當(dāng)分類器、k 值相同,量化單位不同時(shí),分類出來(lái)相似度的結(jié)果不相同;由圖 41圖 413兩幅圖可知,當(dāng)分類器、量化單位相同時(shí), k 值不同,分類出來(lái)相似度的結(jié)果不相同。量化下,我們做了 5 組實(shí)驗(yàn) 表 44 5176。量化下,我們做了 5 組實(shí)驗(yàn),做出了 kNN 與 Weighted kNN 分類正確率的比較表 表 46 10176。量化下,我們做了 5 組實(shí)驗(yàn),做出了 kNN 與 Weighted kNN 分類正確率的比較表 表 48 15176。量化時(shí), kNN 分類正確率最高,為 。 由表 410 可知, 10176。下的單位量化,由研究可得在 10176。的情況我們將在下面的實(shí)驗(yàn)中做出比較。首先,我學(xué)會(huì)了 MATLAB 的使用,在畢設(shè)之前從來(lái)沒(méi)有接觸過(guò) MATLAB,對(duì) MATLAB 的使用和操作也一概不