【正文】
hiding is a technology which embeds the important data into the digital audio, picture or video to hide the existence for copyright identification or undercover munication. Echo hiding is an important branch of the information hiding based on audio signals.At first, this paper introduces the concept, the basic structure, characteristics, classification, application, evaluation criteria and the development status of digital audio watermarking technology. Then, the paper introduces the concept, principle and characteristic of echo hiding, and analyzes its current situation, developmental trend and the key research points.In the fourth chapter, on the basis of Kim’s backward and forward kernels, this paper propose an echo hiding algorithm which improve the echo kernel by the PN sequence bining the Bilateral timedomain extension ideas. The algorithm is different from the traditional timedomain embedding and the cepstral domain extraction, whose watermark embedding and extraction are pleted both in the time domain. Besides, the algorithm can maintain a high detection rate in the case of very small echo amplitude and improve the watermark security and invisibility.Usually, the original audio affect the value of cepstrum of the embedded audio to a certain extent, this paper study the mirrored kernel echo hiding method. The cepstrum value for determining the embedded datum is affected by the difference of the cepstrum ponents in the front and rear parts of a host audio segment in the proposed scheme whereas that value is directly affected by the cepstrum ponent from host audio signals in the conventional schemes. Comparing to the conventional method, the proposed method not only decrease the effect of the audio carrier, but also is more robust to many attack operations, such as noise addition, resample, requantization, filter, MP3 encoding/decoding, pitch scaling and so on.Finally, this paper makes a summarization and points out some prospects of the next step of the research work.Key Words: Audio Digital Watermarking Technology。 PN sequence。相對傳統(tǒng)的圖書館和博物館的區(qū)域化模式,今天的網(wǎng)絡(luò),給了人們更加方便、先進、和廣闊的獲取知識、文化交流的空間,在全世界的范圍內(nèi),傳統(tǒng)的工藝、美術(shù)以及傳承和傳播各個不同地域文化的作品,就可以通過數(shù)字化,多媒體化呈現(xiàn)在世界每個角落的計算機屏幕上。所以,在因特網(wǎng)普及的今天,版權(quán)保護的工作已經(jīng)不僅僅限于圖書,音像作品,如何讓網(wǎng)絡(luò)環(huán)境下的多媒體數(shù)字作品的版權(quán)得到保護也應(yīng)該得到應(yīng)有的重視。目前,數(shù)字水印技術(shù)所涉及的領(lǐng)域很廣泛,包括數(shù)字視頻,音頻,圖像等多個方面。音頻數(shù)字水印技術(shù)可以實現(xiàn)音頻作品的版權(quán)保護和認(rèn)證,對盜版的音頻作品進行跟蹤,還可以用于拷貝保護,在廣播領(lǐng)域中,音頻水印技術(shù)可以發(fā)揮更智能的作用,比如廣播站或節(jié)目類型的標(biāo)識、廣告效果的統(tǒng)計分析、廣播覆蓋范圍的分析研究等。所以,對音頻數(shù)字水印處理算法的研究,不僅具有現(xiàn)實的學(xué)術(shù)意義,而且具有長遠(yuǎn)的經(jīng)濟效益和社會效益。 一般來說,人們所能接受的數(shù)字音頻產(chǎn)品必須是滿足人們聽覺要求的,所以在不破壞其使用價值和大部分聽覺特性的前提條件下,嵌入數(shù)字水印而不被人耳察覺是有可行性的。音頻數(shù)字水印的嵌入可以看作是將水印信息作為附加噪聲與原始音頻信號融合的過程,只要附加的噪聲強度能夠遠(yuǎn)遠(yuǎn)小于人的感覺器官能察覺到的最小強度,水印信息就可以不被人耳感知。音頻數(shù)字水印技術(shù)的框架典型的音頻數(shù)字水印系統(tǒng)應(yīng)涵蓋水印的生成、嵌入和提取或檢測三部分。一般由偽隨機數(shù)字發(fā)生器來產(chǎn)生水印序列,而且還要利用密鑰進行加密。在實現(xiàn)版權(quán)保護的水印系統(tǒng)中,具有優(yōu)秀的魯棒性是算法應(yīng)該必須具備的。音頻數(shù)字水印嵌入模型如圖 所示。如果嵌入的是 1 比特水印信息(如 m 序列等) ,則需要檢測音頻中是否含有水印信息。原始音頻對象嵌入水印信息加密密鑰檢測或提取算法 后續(xù)處理原始水印對象提取水印對象水印提取或判定圖 1. 2 音頻數(shù)字水印系統(tǒng)的提取或檢測模型對音頻數(shù)字水印的要求理論上,一個成功的數(shù)字音頻水印算法應(yīng)該具備以下幾方面的要求(1)魯棒性魯棒性亦稱健壯性,是指含有水印信息的隱秘信號在經(jīng)過各種信號處理操作之后,產(chǎn)生了一定失真情況下,仍能保持水印的完整和可檢測性。二是抗干擾性:數(shù)字音頻水印應(yīng)具有抵南京郵電大學(xué)碩士研究生學(xué)位論文 第一章 緒論4抗一般的數(shù)字信號處理的能力,并繼續(xù)保持較好的可檢測性和完整性。嵌入水印后,為使第三方不易察覺這種嵌入信息,需謹(jǐn)慎選擇嵌入方法,使嵌入前后不產(chǎn)生聽覺上可感知的變化,另外,嵌入的水印應(yīng)較少或不會影響到音頻產(chǎn)品的效果。(4)安全性依賴因素 安全性表現(xiàn)為水印在抵抗惡意攻擊方面的能力。水印嵌入的算法應(yīng)該公開,安全性最好依賴于密鑰而不是算法的秘密性,并且只有擁有密鑰才能提取到正確的水印。水印存在的情況下,卻檢測不到水印存在的概率稱為漏警概率;反之,水印根本不存在,卻檢測到水印存在的概率稱為虛警概率。在拷貝控制應(yīng)用中,對可靠性要求很高。(7)數(shù)據(jù)提取誤碼率數(shù)據(jù)提取誤碼率也是音頻水印方案中的一個非常重要的技術(shù)指標(biāo)。(8)是否為盲水印是否需要原始數(shù)據(jù)進行信息提取,原則上水印的檢測不應(yīng)該需要原始音頻,即實現(xiàn)盲檢測,因為尋找原始音頻是非常困難的。就是說水印在判定所有權(quán)的問題上能夠作為唯一判定的證據(jù)。在以上的十個特性中,最突出的問題是魯棒性,透明性和水印容量三者之間的平衡關(guān)系,但這三者之間又是存在矛盾的,其中,透明性和魯棒性是音頻水印的最基本要求,這兩個特性是一個矛盾的兩個方面, 魯棒性與嵌入的強度直接相關(guān),即水印嵌入的強度越大,則魯棒性越好;但當(dāng)嵌入的強度超過一定范圍(HAS 所限定的范圍) ,又會影響到水印的透明性。 音頻數(shù)字水印技術(shù)的分類音頻數(shù)字水印技術(shù)按照不同的標(biāo)準(zhǔn)可以分成很多種類別,分類的出發(fā)點不同導(dǎo)致類別的各不相同,它們之間既是相互聯(lián)系的,又是相互區(qū)別的,具體地說,可進行如下所述的分類:(1)按照水印的特性劃分可以分為脆弱水印和魯棒水印 脆弱水印是指對常見的信號處理操作比較敏感的一類水印,只要嵌入水印的原始信號稍加處理或修改,其中的水印就會變化或消失。魯棒水印是一類抗攻擊性能非常強的水印。(2)按照水印的透明度可以分為可見水印和不可見水印可見水印一般為較淡或半透明的不礙觀看的圖案,就像是人名幣上的水印,也可以理解為一般意義上的圖像融合。 (3)按照嵌入信息的容量可以分為 1 比特水印和多比特水印1 比特水印是指只有“有水印”和“無水印”兩種情況,而水印本身不帶有任何信息,這種水印只含有 1 比特信息。如版權(quán)信息、產(chǎn)品的標(biāo)識碼、發(fā)表時間、版權(quán)所有者姓名、地址、單位等等。(4)按照水印檢測的方式可以分為盲水印和非盲水印。從應(yīng)用角度來看,有著廣泛的發(fā)展前途。非盲水印則是指在水印的檢測過程中,需要未加水印的原始數(shù)據(jù)作為參考。文獻[4] 中提出了一種基于子波變換的水印處理方法,在數(shù)字音頻信號中嵌入了一個隨機的序列,該方法在提取水印時,需要用到原始的數(shù)字音頻信號。時域的方法因為不需要對原始信號進行變換域計算,所以計算量較少。水印的分類方法有很多,它們的區(qū)別是分析問題的角度不同,一種水印方案通常融合了多種方法。(1)廣播監(jiān)控 水印技術(shù)可以進行對識別信息的編碼,利用自身隱藏在數(shù)字作品之中的特點,可以再沒有廣播信號相關(guān)片段的情況下,通過在媒體中搜尋這個唯一的數(shù)字水印,這些媒體被播放的時間、次數(shù)等相關(guān)信息便可以確切知道。(3)版權(quán)保護 版權(quán)保護是音頻數(shù)字水印最主要的應(yīng)用之一。如果發(fā)生版權(quán)糾紛,合法的版權(quán)擁有者就可以從作品中提取出水印,保護其權(quán)益。南京郵電大學(xué)碩士研究生學(xué)位論文 第一章 緒論7(5)拷貝控制在因特網(wǎng)上,發(fā)布數(shù)字作品的作者大多是希望人們只參閱其發(fā)布的媒體數(shù)據(jù),卻不希望這些數(shù)據(jù)被拷貝。(6)隱秘通信水印技術(shù)用于通信中具有良好的隱藏性,因為它不僅隱藏了通信的內(nèi)容,而且還將通信過程的存在性也一并隱藏,這一點在軍事上有著非常重要的指導(dǎo)意義,特別是在戰(zhàn)爭狀態(tài)下,多一種通信方式可能就多一點獲勝的把握。 一是主觀測試法。最常見的主觀測試法應(yīng)該是平均意見分法(Mean Opinion Score, MOS) ,該方法需要若干個測試者,根據(jù)他們對聽過的音頻信號質(zhì)量的優(yōu)劣進行評分,把這些測試者的平均分?jǐn)?shù)作為對音頻信號質(zhì)量評價的結(jié)果。表 11 MOS 主觀標(biāo)準(zhǔn)分?jǐn)?shù)54321音頻質(zhì)量優(yōu)良中差不能分辨描述音頻非常清晰 , 相當(dāng)于專業(yè)錄音棚的質(zhì)量音頻自然流暢 , 相當(dāng)于長距離 P S T N 網(wǎng)上的語音質(zhì)量達(dá)到通信質(zhì)量 , 但聽起來有一定困難音頻質(zhì)量很差 , 很難理解音頻基本被破壞 , 聽不清楚此外,在 ITUR 中還定義了一個主觀標(biāo)準(zhǔn),即是主觀聽覺區(qū)分度(Subjective Difference 南京郵電大學(xué)碩士研究生學(xué)位論文 第一章 緒論8Grade)見表(22)表 主觀聽覺測試區(qū)分度 SDGS D G描述0 . 0 1 . 0 2 . 0 3 . 0 4 . 0不可感覺可感覺但不刺耳輕微刺耳刺耳非常刺耳 一般來說,主觀判定的評價會受到測試者的知識、背景、測試環(huán)境等因素的影響和限制,所以評價結(jié)果的一致性較差,而且需要耗費相當(dāng)?shù)臅r間和人力,因為對于研究和開發(fā)階段來說,這個方法并不是很適用。客觀測試法在判定音頻水印的質(zhì)量方面占有十分重要的位置,因為客觀測試法可以定量的評價音頻數(shù)字水印的質(zhì)量。假設(shè)宿主信號為 ,嵌??nx入水印的音頻信號為 ,則信噪比表示為:??nx? ()????l10 2102????????????????LnLnxSNR? 其中,n 為音頻信號的采樣點數(shù),L 為音頻信號的長度,且 0≤n<L ,單位為 dB。峰值信噪比的計算公式為南京郵電大學(xué)碩士研究生學(xué)位論文 第一章 緒論9 ()????????????????????1。假設(shè) 與 分別表示嵌入的水印信號和提取的水印信號,M,N??nm,w?,分別為水印信號行數(shù)與列數(shù),歸一化相關(guān)系數(shù)的計算公式為