freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于游程編碼數(shù)據(jù)壓縮算法的設(shè)計與實現(xiàn)畢業(yè)論文-資料下載頁

2025-06-27 20:35本頁面
  

【正文】 ,不平等查詢或高選擇性查詢,它們更小于位圖索引。 第二種方法是基于所謂的 位切片指數(shù) [4,17,37] 。 的有序列表,它被定義每一個索引值屬性上的相同數(shù)量的 n個比特來表示 。 作為一個因此,編碼值表中的格式為 n位圖。 該位圖被稱為位片。 數(shù)據(jù)檢索和計算重刑支持的位分片索引算術(shù)metic [20]或通過一個專用的檢索功能[37] 。 另外,映射的數(shù)據(jù)結(jié)構(gòu)所需的編碼值映射到他們的真實值 [37] 。在第二種方法中,以提高工作效率位圖索引的高基數(shù)上定義的屬性,使用不同的位圖的壓縮技術(shù)。 二在主無損耗的技術(shù)可以區(qū)分,即 字節(jié)對齊的位圖壓縮錫永 (BBC) [2]和字對齊混合 (WAH) [26,3335] 。英國廣播公司(BBC)和華是基于所謂的 運行長度編碼。 基本上,在這種編碼中,連續(xù)的向量。位相同的位值(無論是39。39。 039。39?;?9。39。 139。39。)的一個實例的值(例如,39。39。 139。39。),表示為計數(shù)的值。BBC英國廣播公司(BBC)和華的基本區(qū)別是位圖劃分成8位字,而華分位圖到31位的話。 。 英國廣播公司(BBC)和華提供最好的壓縮比位圖描述行有序索引屬性的值。 否則,壓縮比為惡化。 對于密集均勻分布分布式數(shù)據(jù)位的值“1”是密集的,但他們分離與比特值“0”,因此,它可能是很難找到連續(xù)位向量的值39。39。 039。39?;?9。39。 139。39。長度為 n 的有8位,為英國廣播公司(BBC)和N個 31位華。然而,另一種技術(shù),稱為 近似編碼(AE),用于壓縮位圖索引,提出了在 [3] 。AE提供近似查詢結(jié)果。 假命中保證不會發(fā)生,即,滿足查詢的所有行謂詞納入查詢結(jié)果。 此外,本誤報(即準確性,行不滿足有時包含在查詢查詢謂詞結(jié)果集)的范圍從90%到100%。 AE是基于Bloom過濾器。 在AE,設(shè)置位圖被視為一個布爾值矩陣。 的矩陣表示中以壓縮格式所謂的 近似位圖 (AB)。 為了壓縮的布爾矩陣,它的編碼分為AB多個哈希函數(shù),基于布魯姆過濾器。 對于每一個向量在矩陣位,散列字符串 HS是作為一個行號的功能構(gòu)造和矩陣中的列數(shù)。 接下來,K獨立的哈希功能應(yīng)用了 HS。 所指出的位置哈希值被設(shè)置為39。39。 139。39。 AB。在 [11,18] ,重新排序的列或行討論矩陣可以提高集群的相關(guān)細胞。 這樣技術(shù)也可以適用于位圖索引被看作是矩陣。 主要的想法是重新排列位圖矩陣,以獲得更好的聚類39。39。 039。39。和39。39。 139。39。細胞,然后壓縮矩陣。 由于采用了重新排序時,壓縮比可以得到改善。不幸的是,在重組問題是NPhard的 [11] 位圖索引,實施了重大市售CIAL數(shù)據(jù)庫管理系統(tǒng)中,可以是明確由用戶定義的,例如,甲骨文,Sybase IQ中,模型204,可以隱式地由系統(tǒng)使用,例如,MS SQL服務(wù)器,IBM DB2。 高級研究實現(xiàn)位圖索引表示由 FastBit [24,15,19]RIDBit [15] 。FastBit實現(xiàn)基本的位圖索引,分級,華位圖壓縮技術(shù)。在 RIDBit,密集位圖存儲在B樹的葉子。位圖替換的行ID,原本存儲在B樹葉子。 稀疏將自動轉(zhuǎn)換成位圖行ID。另一個研究領(lǐng)域相關(guān)的位圖索引COM的是文本PRESSION壓縮和倒排文件壓縮錫永在文本數(shù)據(jù)庫。 幾個壓縮技術(shù)壓縮文本已經(jīng)提出,例如, [1,8,6]他們要么是基于哈夫曼編碼 [10]或謝夫的Lempel編碼 [38] 。 幾項技術(shù)也提出了用于壓縮倒排文件,例如, [7,13,23,29,30,39] 。在 [13,39]的作者提出了一種倒排索引列表中出現(xiàn)的壓縮技術(shù)項t為代表的數(shù)據(jù)文件中塊差距(整數(shù)),而不是塊編號。 差距進一步由埃利亞斯編碼克編碼 [7] 。 埃利亞斯克編碼正整數(shù) x由一個一元部分和二進制的一部分。 一元部分指定的比特數(shù)必須代表 X,而二進制碼X位。編碼延伸埃利亞斯克編碼。 在編碼的 x,一元部分被替換為克代碼。壽等人 [23]的報告性能測試的壓縮唱倒名單(偏移,文件的不同元素號),不同的編碼技術(shù)(埃利亞斯克和編碼 [7]以及哥倫布編碼[9] )。 Vo和莫法特 [29]提出了一種壓縮技術(shù),倒列表是基于一元編碼 [31] 。 它是用于壓縮文件號碼。 [30]比較不同的方法來壓縮整數(shù),包括埃利亞斯克和編碼,哥倫布編碼,和可變字節(jié)整數(shù)編碼。開發(fā)的壓縮技術(shù)的倒立文件,壓縮整數(shù),可能代表增量(不同分配辦法)之間的值的序列。 在RLH和RLHN壓榨技術(shù),我們提出,距離位之間的值“1”對應(yīng)這樣的增量。 然而,RLH和RLHN編碼這些三角洲哈夫曼編碼,而不是通過克或編碼。比較RLH,RLHN,和華就CPU時間和I / O處理時間。這些字符ISTICS測定:(1)行無序,部分有序,并下令由一個索引值屬性,(2)索引的屬性不同的樞機主教伊蒂埃斯(多達20,000個不同的值),和(3)的數(shù)據(jù)集由100,000,000股行。相對于比較RLHN和RLH效率壓縮位圖的修改。本文的結(jié)構(gòu)如下。 第2部分介紹了基本本文中使用的定義和概念。 第3節(jié)提出RLH和RLHN壓縮技術(shù)。第4節(jié)討論的實驗結(jié)果RLH的,RLHN和華的評價 。最后,第5節(jié)總結(jié),并得出結(jié)論的文件。 造紙重點,貢獻和輪廓 在本文中,我們提出了一個替代的位圖壓縮技術(shù),提供精確的編碼:(1)良好的查詢響應(yīng)時間和(2)的尺寸小壓縮的位圖。 位圖壓縮技術(shù)我們開發(fā)被稱為 運行長度霍夫曼 (RLH),的。同樣,在英國廣播公司(BBC)和華,建議技術(shù)基于游程長度編碼。 然而,它不同于英國廣播公司(BBC)和華就以下。 首先,RLH計數(shù)位的值之間的距離39。39。 139。39。,而不是相同的值的連續(xù)位的長度。 該距離成為接下來編碼的符號哈夫曼編碼技術(shù) [10] 。 其次,RLH確實將位圖轉(zhuǎn)換為字提高了一個位圖的壓縮比。 為了更好地支持位圖更新中,我們提出的一個變種的RLH壓縮的技術(shù),稱為RLHN。 RLHN一個位圖壓縮被分成 N比特的長度的話 ,則每個 N位的字被壓縮RLH。RLH和RLHN壓縮技術(shù)實施和華實驗比較。 作為一個參考我們選擇華,因為壓縮位圖華提供更好的查詢響應(yīng)時間比位圖壓縮與BBC [26,32] 。本文擴展了我們以前的工作 [25]就到:RLHN的壓縮技術(shù)的發(fā)展接受字的長度等于256,512,1024,2048位。比較RLH,RLHN,和華就CPU時間和I / O處理時間。這些字符ISTICS測定:(1)行無序,部分有序,并下令由一個索引值屬性,(2)索引的屬性不同的樞機主教伊蒂埃斯(多達20,000個不同的值),和(3)的數(shù)據(jù)集由100,000,000股行。相對于比較RLHN和RLH效率壓縮位圖的修改。本文的結(jié)構(gòu)如下。 第2部分介紹了基本本文中使用的定義和概念。 第3節(jié)提出RLH和RLHN壓縮技術(shù)。第4節(jié)討論的實驗結(jié)果RLH的,RLHN和華的評價 。 最后,第5節(jié)總結(jié),并得出結(jié)論的文件。2 基本定義 位圖索引是基于所謂的位圖。 一位圖是一個位向量。 從域的每一個值索引的屬性相關(guān)已自己的位圖。 該每個位圖中的位的數(shù)目的數(shù)目等于行 存儲了表 T中 。 創(chuàng)建一個位圖值 v索引屬性,A介紹了這些在T的行A 值是v。 在該位圖中,位編號n設(shè)置為“1”,如果A的第n行的價值 等于 V。 否則位設(shè)置為0。 位圖索引的概念說明一個例子。讓我們考慮表 的客戶和創(chuàng)建位圖索引其 性別屬性,如圖所示。 1 。 由于域索引的屬性只包含兩個不同的價值觀,指數(shù)是由兩個位圖。 例如,第一位圖描述值 39。女39。 位設(shè)置為0,因為的屬性 性的第一行中的值是不是一個女性 如前所述,華和BBC壓縮SION技術(shù)都是基于運行長度編碼。 該運行長度編碼的基本思想包括編碼連續(xù)的比特具有相同的值的向量(無論是39。39。 039。39?;?9。39。 139。39。)為:(1)中的所有位共同的價值矢量(即,無論是“0”由零組成的一個矢量或39。39。 139。39。的向量組成的)和(2)的長度矢量(即,具有相同值的位的數(shù)量)在編碼之前,位圖被分成詞。 接著,詞語被分組為所謂的運行。 運行組成的話,可以是填充或尾巴。 填充代表一系列的比特組成的字相同的值。 字表示序列的 尾部兩個“0”和“1”比特組成。 填充被壓縮因為他們同質(zhì)化的內(nèi)容,而尾巴沒有。 英國廣播公司(BBC)和華之間的主要區(qū)別是:英國廣播公司(BBC)劃分成8位字位向量,而華將其劃分為31位字。 此外,英國廣播公司(BBC)使用四個不同類型的運行時,根據(jù)填充的長度和結(jié)構(gòu)的尾巴。 議員只使用一個不同的運行。說明的WAH壓縮的總體思路一個例子。 為了簡單起見,讓我們假設(shè)使用一個32位的處理器。 位圖的COM壓制是由5456位組成的,如圖中 所示。 2 一[26] 。華壓縮的位圖被執(zhí)行三個下面的步驟。在第一步驟中,位圖被分為若干組由31位組成的,如圖中 所示。 2灣 在該示例中176創(chuàng)建組。 在第二步驟中,相鄰的被合并成一個組含有相同位基,如 圖 中所示 。 2 。 由于第 1 組是異類,即,它是由“0”和“1”的位,它是不被合并與一組。 組2175是同質(zhì)(39。39。 039。39。位組成),他們合并成一個大基,中 圖 表示 。 2 c為2175 組 。 本組包括174了31位。 最后一 組 176,類似于第 1 組 ,是異質(zhì)的,它不能被與合并前組。 作為結(jié)果合并組,三最終組被創(chuàng)建,如圖中 所示。 2 三。在第三步驟中,被編碼的最后三個組如下所示(參見 圖2中的 32bit字 D)。 第一組代表在第一次運行的尾部。 的最重要的位(最左邊)有值“0”表示一個尾巴。 31下一頁位 1 組的 原始位 。 第二組 (A組2175)表示第二次運行的填充。 的最顯著位(位置31)被設(shè)置為“1”表示填充。在位置2的位30設(shè)置為39。39。 039。39。表示所有位原 組 2175值“0”,即填充用于壓縮組的所有位具有價值39。39。 039。39。 該其余的30位被用于編碼數(shù)字同質(zhì)群體充滿39。39。 039。39。在這個例子中,有174組。 均質(zhì)的數(shù)量組所表示的二進制值等于000000000000000000000010101110,存儲上在其余30位。 最后31位,記為176 組 ,代表第二次運行的尾巴。 的最在這組有顯著位值“0”表示一個尾巴。其余31位是原組 176 位 。 霍夫曼編碼 在霍夫曼編碼 [10] ,原始符號從壓縮的文件被替換的位串。 更多一個給定的符號經(jīng)常出現(xiàn)在壓縮文件用于表示符號的較短的比特串。編碼后的符號和它們的相應(yīng)的位串表示為所謂 哈夫曼樹 。 哈夫曼樹用于壓縮和解壓。 霍夫曼編碼算法,用一個例子說明。3. RLH壓縮 RLH技術(shù)中提出的壓縮位圖本文是根據(jù)游程長度編碼和Huffman編碼。 有兩個特點RLH區(qū)別于其競爭對手(英國廣播公司(BBC)和WAH)。 首先,RLH計數(shù)的價值位之間的距離“1”,而比位向量的長度相同的值,這是類似于增量編碼。 其次,RLH不劃分位圖轉(zhuǎn)換為字,即整個位圖被壓縮。兩位值39。39。 139。39。之間的 距離代表數(shù)位值“0”這兩個位之間。 為在RLH,例如,位載體000011110100編碼以下的數(shù)字序列:400012。 我們假設(shè)的開始和結(jié)束的位向量被解釋為位值“1”這種假設(shè)沒有任何影響的RLH壓縮技術(shù)的概念。代碼400012應(yīng)解釋如下。 第一明確39。39。 139。39。中的編碼比特矢量000011110100處于隱式地從“1”(位)的四個位置的距離開始的矢量在最左邊的位置,第二個“1”是在距離為0位,距離最近的39。39。 139。39。的左側(cè)。第三39。39。 139。39。是在距離為0的位,從最近的“1”到左邊,等這樣的解決方案可以保證,當密度減小,則位圖使用的符號的數(shù)編碼位圖降低過。 運行長度編碼用距離將進一步被稱為 游程長度編碼 。修改后的運行長度編碼所編碼的位圖接下來Huffman編碼壓縮。 的輸入值霍夫曼編碼算法的頻率所有所有編碼位值“1”之間的距離位圖。 一個常見的哈夫曼樹建頻率,它是進一步用于編碼的距離。哈夫曼樹的大小影響的性能位圖的壓縮和解壓。 從每形成的實驗事實證明,霍夫曼的大小樹是小。 例如,對于一個測試表,存儲100,000,000行和索引的基數(shù)屬性等于20000,哈夫曼樹的范圍的大小。從71到92 KB的值的分布,這取決于索引的屬性。 出于這個原因,哈夫曼樹很容易地存儲在主存儲器中,大大提高了位圖的壓縮與解壓縮效率。解壓縮位圖的過程中,解壓縮的位圖的壓縮RLH是一個標準,即,它使用霍夫曼樹,這是保持在主存儲器中。 為了解壓縮壓縮的位圖的位圖,后續(xù)位讀取的解壓縮算法。 是用該位哈夫曼樹,其根葉中的導(dǎo)航。從一片樹葉讀出的符號(距離)取代了霍夫曼編碼所代表的導(dǎo)航路徑根葉。 當整個位圖被分解按下時,即,它是在序列的距離的一種形式位之間的值“1”,那么距離轉(zhuǎn)換到原來的位串,結(jié)束減壓的程序。RLH壓縮解壓縮位圖需要更大的操作數(shù)比的情況下,華英國廣播公司。 盡管這樣,它的表現(xiàn)是好的,因為霍夫曼樹被存儲在主存儲器。更新位圖RLH壓縮并發(fā)比更新壓縮的位圖華和BBC。 華,壓縮位圖可以是無需解壓整個位圖修改。 在為了壓縮的與RLH一個有修改位圖為:(1)解壓縮的整個位圖,(2)修改位圖,以及(3)再次壓縮的位圖。 所有三個操作是必需的,因為更新位圖的變化在修改后的運行長度的距離的頻率編碼。 如果老哈夫曼樹,然后可以得到位圖壓縮非最佳。 ADDI倚重,新的距離(不存在的一個老霍夫曼樹)可能會出現(xiàn)的結(jié)果位圖的更新。這些類型的問題的研究中已知的文學(xué)。 它們部分地解決了通過動態(tài)霍夫曼算法 [28] 。 不幸的是,這些算法計算太復(fù)雜,適用于衍生權(quán)證。RLH的壓縮技術(shù)將是合適的索引結(jié)構(gòu)的衍生權(quán)證加載之前被丟棄DW,從頭開始重新構(gòu)建的結(jié)尾數(shù)據(jù)加載過程。 對于這樣的衍生權(quán)證,上述限制的RLH壓縮技術(shù)是減重要的。 將創(chuàng)建位圖索引和每加載一個DW壓后,從頭開始。然而,為了支持修改RLH壓縮位圖索引中的應(yīng)用衍生權(quán)證不從頭開始重建索引和其他應(yīng)用中,我們提出了修改RLH壓縮技術(shù),稱為RLHN。參考文獻 [1] Lu Z, Kim DY, Pearlman WA. Wavelet pression of ECG signals by the set
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1