《武汉工程大学学报》  2015年06期 67-72   出版日期:2015-06-30   ISSN:1674-2869   CN:42-1779/TQ
最小二乘支持向量机的自适应数字水印算法


0 引 言数字多媒体的迅猛发展,有关数字作品的版权问题、侵权问题等时有发生,因此研究出一种更加有效的数字水印算法是一个很紧迫的问题. 数字水印算法通常分为空域法和变换域法. 空域法是把水印信息直接地嵌入载体图像当中去,它具有算法比较简单、嵌入速度很快、嵌入的水印容量很大、容易实现等优点,在版权保护等方面都有着相当广泛的应用[1]. 然而,由于它是直接地在图像的表面修改水印信息,况且水印信息相对原始载体图片来说本身就是一种噪声信号,这些都导致空间域的数字水印算法抵抗一些常规攻击的能力普遍比较弱. 为了获得数字水印系统的不可感知性及稳健性达到最佳平衡,近年来一些学者将统计学习理论及机器学习的思想引入到数字水印中来,像神经网络、遗传算法、模糊聚类等. 黄雄华等[2]先把载体图像进行小波变换,再使用神经网络自适应地确定水印嵌入的最大强度. 王忠等[3]利用遗传算法优化不可见性的参数构成的目标函数. 虽然这些方法对数字水印系统的性能有着一定程度的改善,但都还有着一些局限性,像神经网络在确定网络的种类、参数时需要靠经验确定,没有科学的理论指导;遗传算法对于大量的数据集计算量特别地大,且泛化能力不是很好,容易陷入局部最优解. 图像的相关性理论表明:数字图像邻域像素之间存在着一种非线性映射的数学函数关系. Watson提出的人眼视觉模型[4],在图像水印算法中有着广泛的应用. 根据这个特性,张力等[5]利用颜色特征模型,进行车辆目标的检测. 生理学家发现,人眼对于色度信号的改变较亮度信号的改变不是很敏感,通过选择对比度函数值较大的图像子小块进行水印信息的嵌入和提取. 最小二乘支持向量机(Least squares support vector machine)(LS-SVM)[6]基于的是结构风险最小化理论,它有着很强的泛化能力和学习能力,在诸如小样本、非线性、高维数、局部极小值等模式识别问题中有着特有的优势. 此时,将LS-SVM理论应用于数字水印系统的嵌入和提取,建立水印嵌入位置的特征和水印信号之间的非线性映射的函数关系,并使用粒子群算法(PSO)优化超参数,这些都将会极大的提高水印嵌入和提取的成功率. 李松等[7]利用遗传算法优化支持向量机,建立小波系数方向树模型,自适应地确定水印的嵌入位置. 实验结果表明,该算法有着很好的不可感知性及鲁棒性. 1 最小二乘支持向量机最小二乘支持向量机[6]是支持向量机(SVM)的一种扩展,它利用误差的2-范数取代了SVM中的松弛变量,将误差的平方和的损失函数当作训练集的损失,这样就将一个二次规划的问题巧妙的转化成一个线性方程组的求解,这在一定程度上提高了求解速度和收敛的精度. (1)设样本集是一个n维向量,给定l个样本的数据集,xi、yi分别表示样本的输入、输出向量,数据集可以表示为 (xi,yi),…,(xn,yn)∈(Rn×R)(1)(2)对于最小二乘支持向量机,优化问题为 minJ(w,?着)=■w2+c■?着■■ s.t. yi[?准(xi)·w+b]=1-?着i(2)式(2)中:i=1,2…l(3) 使用拉格朗日算子求解公式(2)得0 y1 … ylyl y1y1K(x1,x1)+■ … y1yl K(x1,xl) ■yl yly1K(xl,x1) … ylyl K(xl,xl)+■ ×ba1 ■al=01 ■0 (3)(4)超参数的优化:选择最常见的RBF核函数,其中正则化参数c和宽度参数σ2的选择,对于LS-SVM的性能发挥有着极其重要的影响,利用粒子群算法对其进行优化处理,各个粒子的适应度函数值取预测值与真值的均方误差为 MSE=■■(pi-pi′)2 (4)式(4)中:pi、pi'分别是测试集的实际值与预测值,n表示测试样本的个数. (5)粒子群初始参数的设定:进化次数200次,粒子数20,局部搜索能力与全局搜索能力均为2,设定超参数范围c=[0.01 1000],g=[0.01 100]精度eps=1.0e-06;惯性权重wmax=0.9,wmin=0.4,且采用线性递减方式为 w=wmax-(wmax-wmin)×■(5)2 水印信息的嵌入与提取数字图像空间域邻域像素之间具有很强的相关性,利用LS-SVM强大的学习与泛化能力,建立中心像素与邻域像素之间的关系模型. 通过一些实验的综合比较,选取比较常见的图像3×3邻域. 设载体图像I是512×512的灰度图像,水印图像W是word上制作的含“南昌大学”字样的二值图像,其大小是32×32,I={Ii,j|1≤i≤M,1≤j≤N},其中Ii,j代表(i,j)位置的像素点的灰度值大小,W={Wi,j|1≤i≤P,1≤j≤Q },Wi,j={0,1},水印的嵌入与提取步骤如下:步骤1:用于LS-SVM操作子小块的选取,在空间域的YUV空间当中[8-9],首先引入对比度敏感函数模型[10]:若背景亮度值β≥128时, H(g)=ln■ 0≤g<128ln■ 128≤g<255(6)式(6)中:cl=■,cL=■,cH=■,k=■.若背景亮度值β<128时, 则有 H(g)=ln■ 0≤g<128ln■ 128≤g<255(7)式(7)中:cl=■,cL=-■,cH=■,k=■计算每一个3×3小块的对比度函数H(g)值,并且升序排列,选取其中最大的2×P×Q个子块当作LS-SVM的数据集[11]. 步骤2:选取LS-SVM训练样本. 选取步骤1中前面一半子块的中心像素P(i,j)及其3×3邻域分别作为输出输入向量,建立LS-SVM的训练模型.步骤3:修改回归样本值. 选取步骤1中后面一半子块,记作密钥Ⅲ,修改中心像素Q(i,j)的值,采用自适应加性嵌入法则: I′t=It+α×w(k)×|H(Bk)|(8)式(8)中:α是自适应强度因子. 步骤4:嵌入水印. 根据中心像素Q(i,j)的邻域作为测试数据,修改中心像素I■■的值,并与式(8)中I′t作比较,这样就嵌入了水印信息: I′t=max(I′t,I■■+λ),(wt=1)min(I′t,I■■-λ),(wt=0)(9)步骤5:提取水印. 水印提取与嵌入是一个逆过程,前面的步骤基本一样. 根据密钥Ⅲ定位到相关子块,根据中心像素Q(i,j)的3×3邻域预测其中心像素值I■■,与实际值I′t作比较,这样就提取了水印信息: w′t=wt=1,(I′t>I■■)wt=0,(I′t≤I■■)(10)下面将采用PSNR、SNR、NC、BER作为水印系统性能评价指标. 3 实验结果及分析3.1 粒子群优化超参数部分实验结果:均方根误差RMSE=40.664 1,平方相关系数r=0.819 03,训练时间t=1.683 5 s;参照文献[11]中的算法,对于同样的数据集,若采用BP神经网络,RMSE=48.454 8,平方相关系数r=0.739 03,训练时间t=90.982 0 s. 可见LS-SVM在提高数据集的预测精度及训练时间等方面,优势比较明显. 如果数据集的噪点进行有效处理,特定载体图像的特征提取更加完美,并且设定的PSO相关初始化参数非常恰当,其优势将会更加突出. PSO优化超参数的过程当中,适应度曲线刚开始下降得很明显,最终稳定在迭代40代左右,适应度值在2 348左右. 多次实验过程中,随着迭代次数增加,适应度值得到了一定程度的改善,但时间成本及计算机内存损耗都非常大,优化过程也容易陷入局部最优解. 参数的初始化设置也是PSO优化过程中的难点所在. 即便如此,由以下的图、表及相关数据可知,本套数字水印算法的主客观性能指标也是相当不错的. 本次PSO优化结果,取sig2=16.980 8,gam=0.01,然后将此值初始化LS-SVM的超参数,应用于相关的数字水印算法当中去. 图1是适应度曲线,图2为LS-SVM的训练模型.图1 适应度曲线图Fig.1 Fitness graph图2 LS-SVM的回归模型图Fig.2 Regression model figure of the LS-SVM3.2 数字水印仿真实验结果仿真实验使用的是MATLAB2013b版本,分别选取图像数据库中大小为512×512的灰度图像lena.bmp、brain.bmp、rice.bmp3组图片作为原始载体图像;水印图像是含“南昌大学”字样的二值图像,大小32×32,经过多次实验,最终确定水印信息的嵌进强度α=3.5. 图3~5是几组图片的测试效果.图3 测试图片lena.bmpFig.3 The test image of lena.bmp图4 测试图片brain.bmpFig.4 The test image of brain.bmp图5 测试图片rice.bmpFig.5 The test images of rice.bmp 通过观察以上三组测试图片的仿真结果,肉眼几乎观察不出原始载体图像与嵌入水印信息之后图像之间的区别所在,这说明水印信息的不可见性很强,提取出来的水印图像与原始水印图像也极为相似. 它们的主客观评价参数均为:峰值信噪比PSNR=Inf、信噪比SNR=Inf、NC=1、错位率BER=0,这些都表明本套数字水印算法的主客观质量都比较优良. 相比文献[11]中算法的结果:PSNR=55.37、NC=0.994,本算法在没有受到攻击时其性能要比文献[11]相关部分的效果好一些. 为测试本套数字水印算法的鲁棒性能,下面还将对上述三组含有水印信息的图像作一些常规性的攻击操作. 其中rice.bmp图片攻击测试实验结果与文献[11]对比如下表1所示.表1 rice.bmp攻击测试实验结果Table1 Attack test results of rice.bmp从表1看出,本套数字水印算法除了对亮度增强、中值滤波、平均值滤波、旋转、模糊、锐化及缩小等操作,其抵抗能力稍弱一点,对于其它常规攻击与联合攻击操作,其鲁棒性相当地不错. 参照文献[11]相关部分的算法,本套数字水印算法对于绝大多数常规攻击的抵抗力明显优于文献[11].4 结 语本套数字水印系统充分利用人眼HVS及LS-SVM很强的学习能力和泛化能力,体现出如下优点:(1)水印系统的不可感知性及稳健性非常优良,肉眼几乎观察不出载体图像与含水印图像的细微区别,提取的水印图像与原水印图像也是极为相似,水印系统的主客观评价参数非常好,有着一定的实用价值;(2)对于一些常规性攻击操作,水印系统表现得也很不错,可为空间域水印算法的继续深入研究提供一种新的思路;(3)更加充分合理的利用HVS特性,结合性能优良的机器学习算法,这些都有利于水印系统的不可感知性与稳健性达到最佳的平衡. 致 谢本研究是在南昌大学机电学院微流控实验室完成的,向给予帮助和支持的同仁表示衷心的感谢!