《武汉工程大学学报》  2008年02期 91-93   出版日期:2008-02-28   ISSN:1674-2869   CN:42-1779/TQ
基于多分辨分解的乐音水印算法实现


0引言数字水印技术在图像版权信息保护中得到了比较广泛的应用,各种水印嵌入方法也被诸多学者提出并验证.随着互联网技术的普及,原创音乐版权的保护成为一个较为突出和棘手的问题.原创音乐在网络上的肆意盗链和下载甚至篡改其中的旋律片段等违反版权法的行为层出不穷,如何有效地保护音乐知识产权,如何对违法行为进行有力的取证成为一个热点问题.1乐音信号特性分析从技术角度来看,乐音信号是一维时变离散信号,而图像是二维离散信号,两者在结构上有较大的区别.重要的是,乐音有很多独有特性,诸如基音、泛音、旋律、时长,因此,乐音水印的研究应结合乐音的信号特性,并充分利用乐音信号在变换域的一些本质特征.乐音是由单音按照时间先后规律构成的,一段连续的乐音中包含诸多的单乐音音符.乐音音符音调、响度、音色特征由乐音音符的物理特性基频、振幅及倍频所确定,乐音的这种特性使其能够用物理的方法进行分析和测量.单乐音音符的音调(即音高)是由这个音符的基频决定的;一个单音的响度(即音强)是这个单音的空气振动到达人耳处的能流.音色由单乐音音符频谱(即各谐波成份比例)构成决定.对于弦鸣乐器,系统的固有频率为:fn=nπl T0ρA,(n=1,2,3,…)当n=1时f1=πl T0ρA称为基频,由它所确定的音称为弦的基音,决定了音高.较高频率fn(n=2,3,4,…)确定的音称为泛音,它是基音的整数倍,弦乐器如小提琴、钢琴、吉他等的音调和响度通常以基音为主.对于人的歌唱乐音,可以用语音的声管模型加以描述.按照十二平均律,相邻乐音的音高(频率)符合:f2/f1=122十二音平均律为乐音音符的定量刻画提供了可靠的科学手段,这为诸多乐器发音的研究提供了一个统一的度量.乐音各频率成分中,按照能量分布,占主要部分的是基频成分,由基频的整数倍频所构成的泛音成分决定了音色的甜润程度.所以在乐音中嵌入水印,从变换域来看,应尽可能地在基频部嵌入.2二进离散小波变换小波变换[1]是应用较为广泛的信号处理手段之一,它可以很好地刻画信号时频突变信息.设t(x)为一维输入信号,记:jk(x)=2-j/2(2-jx-k),ψjk(x)=2-j/2ψ(2-jx-k),这里(x)与ψ(x)分别称为定标函数与子波函数,{jk(x)}与{ψjk(x)}为二个正交基函数的集合.记P0t=t,在第j级上的一维离散小波变换.通过正交投影Pjt与Qjt将Pj-1t分解为:
Pj-1t=Pjt+Qft=∑kcjkjk+∑kdjkψjk其中:cjk=∑p-1n=0h(n)cj-12k+ndjk=∑r-1n=0g(n)cj-12k+n(j=1,2,…,L,k=0,1,…,N/2j-1)这里,{h(n)}与{g(n)}分别为低通与高通权系数,它们由基函数{jk(x)}与{ψjk(x)}来确定,r为权系数的长度.{C0n}为信号的输入数据,N为输入信号的长度,L为所需的级数.小波分解把信号分解为低频部分的近似信号和高频部分的噪声信号,由于噪声主要集中在高频部分,而有效能量主要集中在低频部分,所以对原始信号实施小波变换可以在进行信号高频滤波的同时,得到低频有效系数.Mallat[2]在MRA的基础上给出了小波系数快速分解的金字塔算法,并构造了用于小波分解和重构的高、低通滤波器组,大大简化了小波系数的计算.3基于低频基音特性的乐音水印方
法利用二进离散小波变换,将原始乐音信号进行频带分解,按照文献[3,4]对乐音进行基音求解,由于多声部乐音的基音频率不单一,本文采用在低频频带内的能量最高的基频分量作为嵌入位置,使用这种嵌入方法的优点是隐蔽性强,并且具有最佳的抗高频滤波攻击,具体的过程为:(1) 使用二值图像作为水印,将水印图像在时域上进行信息置乱,以达到加密效果.所使用的函数为:
PN(k):x′
y′=11
kkx
ymodN其中,(x,y)和(x’,y’)为图像的像素点在变换前后的位置,每个像素点经过函数Pn(k)变换之后,若原始水印图像从n×n矩阵变换为一N×N矩阵.第2期徐国庆,等:基于多分辨分解的乐音水印算法实现
武汉工程大学学报第30卷
(2) 将原始乐音作频带分解,并求出低频的基音最大分量系数,选择一个起始位置P1,长度为N×N的一维系数矩阵,其大小与上一步水印图像变换后的矩阵的元素个数相等.(3) 在选择的系数矩阵中嵌入水印信息,由于是在一维信号中嵌入二维水印,所以对于水印信息采用逐行嵌入方法,与乐音低频基音系数进行叠加.在运用二进小波变换进行乐音的低频分解时,关于小波分解尺度的选择,可以按照[4]提供的公式求出:j=log2fsf0其中,j为小波分解尺度,fs为采样频率,f0为基音频率,[x]表示不超过x的最大整数.取fs=44 100 Hz,f0=450 Hz,得到j=6.经过j=6尺度的小波变换后的低频分量带宽为44 100/26=689.062 5 Hz,考虑到乐音中含有的高音乐器,可以适当加宽此低频带,经过实验,分解尺度为4时低通上限频率为2 756.25 Hz,这个频带包含一般人声乐音以及乐器等高音的频带,能量较为集中.分解以后,乐音仍然保持较高的可听度.图1原始乐音及含水印乐音的DWT低频分解
Fig.1The original music and the watermarked music with DWT decomposition水印的提取过程如下:(1) 将原始乐音进行离散小波频带分解,对于标准CD采样44,100 Hz信号,分解尺度为4,得到低频近似系数P;并确定低频最大的N×N个系数的位置S(i).(2) 将待测乐音进行同尺度分解,提取同位置低频近似系数P’.(3) 在S(i)位置计算P、P’之绝对值差ε,并与门限δ比较,比较的结果记入水印图像的相应位置:Bin(i,j)=1,ε>δ
0,ε<δ(4) 按照加密步骤(1)的逆运算,提取n×n的水印二值图像.4水印攻击实验乐音的常见攻击方法为:噪声污染、降噪、滤波,针对这几种攻击手段分别进行水印鲁棒性实验.乐音嵌入水印后没有经过任何攻击,从其中提取的水印如图2所示.图3为含水印乐音被噪声污染后提取的水印,从图中可以直观看出乐音噪声污染已经十分严重,并且严重影响了乐音的清晰度.但水印信息依然清晰可辨.图4为对被噪声污染的乐音进行一级离散小波变换,并将高频信号置零后进行小波逆变换信号重构,实现低通滤波消噪后提取的水印信息.图2原始水印及提取的水印
Fig.2The original and the distilled watermark图3原始乐音中混入白噪声及提取的水印
Fig.3Watermark distilled from noised music图4乐音降噪处理及提取的水印
Fig.4Watermark distilled from denoised music5结语基于基频特性的乐音水印方法根据乐音的本质属性,由于乐音的大部分能量和特性集中在基频和少数几个倍频段,所以通过选择基音频率分量作为嵌入水印的区域可以实现水印的隐蔽性和良好的抗高频滤波的能力,从实验结果来看,在维持乐音的可听质量的情况下,提出的水印算法对于几种常见的乐音攻击均具有较好的顽健性,可以作为提高乐音反盗版和抗压缩、滤波等攻击的参考方法.