【正文】
基于安全KNN查詢技術 Wong W K, Cheung D W, Kao B, et al. Secure kNN putation on encrypted databases[C]//Proceedings of the 2009 ACM SIGMOD International Conference on Management of data. ACM, 2009: 139152.中索引向量與查詢向量間“內積相似度”來實現排序查詢并進行隱私保護增強。該應用方案利用MapReduce并行計算模型技術設計該應用方案的并行搜索引擎,把一些開源技術和分布式計算思想應用到該應用方案之中,充分利用云計算技術優(yōu)勢提高對海量密文的搜索效率。同時在客戶端和云服務器之間釆用公共信道來傳送加密的數據,減少了建設安全信道的費用。這種方案基于雙線性對構造,并采用公共信道來傳輸密文。結果:RQED , RQED機制中用戶只需存儲一對公私鑰,現有方法則需存儲密鑰矩陣且隨著關鍵詞詞典規(guī)模增大而帶來巨大空間開銷,并且當涉及多數據擁有者選擇性 查詢授權時,客戶端更是無法承受。b) 基于RQED框架,設計支持多屬性數據隱私保護詞權重、查詢詞權重及用被授權可訪問數據范圍等更客觀、合理的密文查詢排序函數。2012年,程芳權等提出了云環(huán)境下在大規(guī)模加密云數據上進行高效且具有隱私保護能力的個性化密文排序查詢方法 程芳權, 彭智勇, 宋偉, 等. 云環(huán)境下一種隱私保護的高效密文排序查詢方法[J]. 計算機學報, 2012, 35(11): 22152227.。與不分類的返回結果相比,能夠提高系統的穩(wěn)定性。2012年,Wang等人為解決以往密文檢索中布爾檢索(Boolean search)的局限性,提出了一種分級檢索(Ranked search)方法 Wang C, Cao N, Ren K, et al. Enabling secure and efficient ranked keyword search over outsourced cloud data[J]. Parallel and Distributed Systems, IEEE Transactions on, 2012, 23(8): 14671479.。RSSE方案正是通過使用OPSE和OPM來實現數據和索引的隱私保護。因此,相同的明文不再是確定的加密成確定的密文。如果服務器上的數據集中包含很多此類背景信息,例如每個明文關鍵詞的相關性分數的分布,那么就能反向推導出關鍵詞。通過這個方式,相關性分數的排序將會像在明文中一樣高效。(王偉,單關鍵詞or多關鍵詞) 分級檢索(Ranked Search)2010年,Wang等人 Wang C, Cao N, Li J, et al. Secure ranked keyword search over encrypted cloud data[C]//Distributed Computing Systems (ICDCS), 2010 IEEE 30th International Conference on. IEEE, 2010: 253262.考慮關鍵詞詞頻信息,提出基于對稱密鑰保序加密技術 OPSE Boldyreva A, Chenette N, Lee Y, et al. Orderpreserving symmetric encryption[M]//Advances in CryptologyEUROCRYPT 2009. Springer Berlin Heidelberg, 2009: 224241.的單關鍵詞分級密文排序查詢方法(RSSE),采取了OPSE方案來提高實際性能,采用此方案后,明文的數值順序在加密后將被維持原狀。他們使用單詞查找樹(一種數據結構)來保存序列跟編碼,把檢索的復雜度從O(N)降到了O(1)。對于Li等人提出的基于編輯距離d的加密字符串模糊檢索方案,他們解決的是d=1的情況,當d1時,Wang等人提出了方案 Wang C, Ren K, Lou W, et al. Toward publicly auditable secure cloud data storage services[J]. Network, IEEE, 2010, 24(4): 1924.來擴展它。它使用編輯距離來量化字符串的相似度,并為每個字符串附加一個基于通配符的模糊字符串組,用多個精確匹配來實現模糊檢索。Bloom Filter能夠支持數據庫模糊檢索,根據數據庫索引的匹配可將部分不符合檢索條件的數據庫記錄排除。不足之處為:它需要大量的預處理,而且不能簡單地處理動態(tài)分數,所以安全級別很低。在此基礎上,提出了在加密數據中進行安全的排序搜索的方法。2009年,Zerr等人 Zerr S, Olmedilla D, Nejdl W, et al. Zerber+ r: Topk retrieval from a confidential index[C]//Proceedings of the 12th International Conference on Extending Database Technology: Advances in Database Technology. ACM, 2009: 439449.發(fā)現即使列表元素(倒序包含每個關鍵詞的文檔ID)被加密,仍然可以根據發(fā)布列表的詞頻分布來重新確認關鍵詞。這種索引通過將字符信息轉換為數值型來記錄字符間的關系特征,利用索引過濾掉部分不符合檢索條件的數據庫記錄,再對剩余一記錄解密,進行二次檢索后返回檢索結果。2007年,Zhu等人提出一種基于字符特征矩陣的數據庫加密策略 Zhu H, Cheng J, Jin R, et al. Executing Query over Encrypted Character Strings in Databases[C]//Frontier of Computer Science and Technology, 2007. FCST 2007. JapanChina Joint Workshop on. IEEE, 2007: 9097.。2005年,Wang等人 Wang Z F, Dai J, Wang W, et al. Fast query over encrypted character data in database[M]//Computational and Information Science. Springer Berlin Heidelberg, 2005: 10271033.提出一種基于對偶編碼的特征值提取方法,將字符型明文數據拆分為多個字符對偶,根據這些字符對偶提取字符型數據的特征值,存儲到一個新的字段中,在數據庫密文檢索時,根據這個輔助字段將不符合關鍵詞字符特征的數據庫記錄過濾掉,再對剩余的數據庫記錄做解密處理,得到明文的解密結果,最后在解密結果中進行明文檢索,獲得最終檢索結果。在該方案的驗證階段,用戶一旦需要驗證就要進行必須的、相關的解密操作,這樣無形中就增大了服務器的開銷。缺點:計算開銷因為雙線性對的引進而加大,特別是對操作(pairing operation)的計算開銷較大,使得該方法在海量數據處理場景中的應用性受到一定的限制;另外,PEKS的安全性是在隨機語言機模型(random oracle model)下成立,并不適合現實應用。這項新技術的提出開啟了可搜索公鑰加密技術的新時代。2004年, Boneh D, Di Crescenzo G, Ostrovsky R, et al. Public key encryption with keyword search[C]//Advances in CryptologyEurocrypt 2004. Springer Berlin Heidelberg, 2004: 506522.(簡稱:PEKS方案),為此業(yè)界把2004年定義為可搜索公鑰加密的元年。結果:能夠利用哈希函數計算快速的特點,快速地查找關鍵字所在的密文文件。如果映射到的位置之前都有記錄的痕跡,則說明這個關鍵字有很大的概率是在該文件中。在文件加密之前,需要對文件中的關鍵字使用私鑰加密,再使用哈希函數映射到filter之上并記錄,最后,將映射后的filter和文件的密文上傳到服務器中。