您的当前位置:首页正文

图像处理的流行的几种方法

2021-07-05 来源:钮旅网


图像识别的流行的几种方法

一般来说,图像识别就是按照图像的外貌特征,把图像进行分类。图像识别的研究首先要考虑的当然是图像的预处理,随着小波变换的发展,其已经成为图像识别中非常重要的图像预处理方案,小波变换在信号分析识别领域得到了广泛应用。

现流行的算法主要还有有神经网络算法和霍夫变换。神经网络的方法,利用神经网络进行图像的分类,而且可以跟其他的技术相互融合。

一 神经网络算法

人工神经网络(ArtificialNeuralNetworks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(ConnectionistModel),它是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。

在神经网络理论的基础上形成了神经网络算法,其基本的原理就是利用神经网络的学习和记忆功能,让神经网络学习各个模式识别中大量的训练样本,用以记住各个模式类别中的样本特征,然后在识别待识样本时,神经网络回忆起之前记住的各个模式类别的特征并将他们逐个于样本特征比较,从而确定样本所属的模式类别。他不需要给出有关模式的经验知识和判别函数,通过自身的学习机制形成决策区域,网络的特性由拓扑结构神经元特性决定,利用状态信息对不同状态的信息逐一训练获得某种映射, 但该方法过分依赖特征向量的选取。许多神经网络都可用于数字识别,如多层神经网络用于数字识别:为尽可能全面描述数字图像的特征,从很多不同的角度抽取相应的特征,如结构特征、统计特征,对单一识别网络,其输入向量的维数往往又不能过高。但如果所选取的特征去抽取向量的

各分量不具备足够的代表性,将很难取得较好的识别效果。因此神经网络的设计是识别的关键。

神经网络在图像识别的应用跟图像分割一样,可以分为两大类:

第一类是基于像素数据的神经网络算法,基于像素的神经网络算法是用高维的原始图像数据作为神经网络训练样本。目前有很多神经网络算法是基于像素进行图像分割的,Hopfield神经网络,前向反馈自适应神经网络,其他还有模糊神经网络、RAM神经网络、S0FM神经网络、细胞神经网络等。

第二类是基于特征数据的神经网络算法。此类算法中,神经网络是作为特征聚类器,有很多神经网络被研究人员运用,如BP神经网络、模糊神经网络、SOM神经网络、RAM自适应神经网络、细胞神经网络和Hopfield神经网络。

例如神经网络的方法在人脸识别上比其他类别的方法有独到的优势,它具有自学习、自适应能力,特别是它的自学能力在模式识别方面表现尤为突出。神经网络方法可以通过学习的过程来获得其他方法难以实现的关于人脸识别规律和规则的隐性表达。但该方法可能存在训练时间长、收敛速度慢的缺点。

二 小波变换

小波理论兴起于上世纪80年代中期,并迅速发展成为数学、物理、天文、生物多个学科的重要分析工具之一;其具有良好的时、频局域分析能力,对一维有界变差函数类的“最优”逼近性能,多分辨分析概念的引入以及快速算法的存在,是小波理论迅猛发展的重要原因。小波分析的巨大成功尤其表现在信号处理、图像压缩等应用领域。小波变换是

一种非常优秀的、具有较强时、频局部分析功能的非平稳信号分析方法,近年来已在应用数序和信号处理有很大的发展,并取得了较好的应用效果。在频域里提取信号里的相关信息,通过伸缩和平移算法,对信号进行多尺度分类和分析,达到高频处时间细分、低频处频率细分、适应时频信号分解的要求。小波变换在图像识别的应用,包括图形去噪、图像增强、图像融合、图像压缩、图像分解和图像边缘检测等。小波变换在生物特征识别方面(例如掌纹特征提取和识别)同样得到了成功应用,部分研究结果表明在生物特征识别方面效果优于PCA、ICA、傅里叶变换等方法。 对于含有“点奇异”的一维信号,小波能达到最优的非线性逼近阶。而在处理二维或者更高含“线奇异”的信号时,不能达到理想的最优逼近阶。小波变换的不足使人们开始寻求更好的非线性逼近工具。

脊波分析可以理解为radon 域上的小波分析,而radon 变换把空域的直线奇异映射为radon 域上的点奇异,小波又能有效表示点奇异,所以脊波可以有效表示含有直线奇异的二维信号。自然图像中包含有大量的纹理特征信息,线奇异性和曲线奇异性表现非常突出。小波变换无法实现最优逼近。脊波(Ridgelet)作为一种新的多尺度分析方法比小波更加适合分析具有直线或超平面奇异性的信号,而且具有较高的逼近精度和更好的稀疏表达性能.将脊波变换引入图像融合,能够更好地提取原始图像的特征,为融合图像提供更多的信息,在融合过程中抑制噪声的能力也比小波变换更强.因此,提出了基于脊波变换的SAR与可见光图像融合方法,并采用偏差指数与等效视数指标对融合效果进行评价。实验结果表明,该方法在保留合成孔径雷达SAR(synthetic aperture radar)与可见光图像重要信息、抑制噪声能力方面均优于小波变换方法。但脊波变换的数字实现十分困难,脊波变换是基于radon变换实现的,而radon变换的关键步骤是笛卡尔坐标与极坐标之间的转换,与连续域不同,数字图像进行这种转换十分困难,为了解决这个问题,人们也提出了不同的插值方法,各种方法都是以提高计算复杂度或冗余度为代价来提成变换精度的。

例字:对图像处理领域准确提取出指纹纹理的问题,将小波变换应用于图象指纹纹理提

取处理。小波变换在用于图像处理时,具有放大、缩小和平移的数学显微镜的功能,能够很方便地产生各种分辨率的图像。同时,由于小波变换可以将图像分层,按小波基展开,我们可以有效地控制计算量,满足实时处理的需要。

三 霍夫变换

Hough变换于1962年由Paul Hough提出,并在美国作为专利被发表。它所实现的是一种从图像空间到参数空间的映射关系。它是图像处理中从图像中识别几何形状的基本方法之一,应用很广泛,也有很多改进算法。最基本的Hough变换是从黑白图像中检测直线(线段)。Hough变换的基本原理在于利用点与线的对偶性,将原始图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点。这样就把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题。也即把检测整体特性转化为检测局部特性。比如直线、椭圆、圆、弧线等。

1、Hough变换的基本思想:

设已知一黑白图像上画了一条直线,要求出这条直线所在的位置。我们知道,直线的方程可以用y=k*x+b 来表示,其中k和b是参数,分别是斜率和截距。过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一族直线。方程y0=kx0+b在参数k--b平面上是一条直线,(也可以是方程b=-x0*k+y0对应的直线)。这样,图像x--y平面上的一个前景像素点就对应到参数平面上的一条直线。我们举个例子说明解决前面那个问题的原理。设图像上的直线是y=x, 我们先取上面的三个点:A(0,0), B(1,1), C(22)。可以求出,过A点的直线的参数要满足方程b=0, 过B点的直线的参数要满足方程1=k+b, 过C点的直线的参数要满足方程2=2k+b, 这三个方程就对应着参数平面上的三条直线,而这三条直线会相交于一点(k=1,b=0)。 同理,原图像上直线y=x上的其它点(如

(3,3),(4,4)等) 对应参数平面上的直线也会通过点(k=1,b=0)。这个性质就为我们解决问题提供了方法,就是把图像平面上的点对应到参数平面上的线,最后通过统计特性来解决问题。假如图像平面上有两条直线,那么最终在参数平面上就会看到两个峰值点,依此类推。

简而言之,Hough变换思想为:在原始图像坐标系下的一个点对应了参数坐标系中的一条直线,同样参数坐标系的一条直线对应了原始坐标系下的一个点,然后,原始坐标系下呈现直线的所有点,它们的斜率和截距是相同的,所以它们在参数坐标系下对应于同一个点。这样在将原始坐标系下的各个点投影到参数坐标系下之后,看参数坐标系下有没有聚集点,这样的聚集点就对应了原始坐标系下的直线。

在实际应用中,y=k*x+b形式的直线方程没有办法表示x=c形式的直线(这时候,直线的斜率为无穷大)。所以实际应用中,是采用参数方程p=x*cos(theta)+y*sin(theta)。这样,图像平面上的一个点就对应到参数p---theta平面上的一条曲线上,其它的还是一样。

2、Hough变换推广:

对于已知半径的圆:Hough变换可以检测任意的已知表达形式的曲线,关键是看其参数空间的选择,参数空间的选择可以根据它的表达形式而定。比如圆的表达形式为,所以当检测某一半径的圆的时候,可以选择与原图像空间同样的空间作为参数空间。那么圆图像空间中的一个圆对应了参数空间中的一个点,参数空间中的一个点对应了图像空间中的一个圆,圆图像空间中在同一个圆上的点,它们的参数相同即a,b相同,那么它们在参数空间中的对应的圆就会过同一个点(a,b),所以,将原图像空间中的所有点变换到参数空间后,根据参数空间中点的聚集程度就可以判断出图像空间中有没有近似于圆的图形。如果有的话,这个参数就是圆的参数。

3、Hough变换总结

图像空间中的在同一个圆,直线,椭圆上的点,每一个点都对应了参数空间中的一个图形,在图像空间中这些点都满足它们的方程这一个条件,所以这些点,每个投影后得到的图像都会经过这个参数空间中的点。也就是在参数空间中它们会相交于一点。所以,当参数空间中的这个相交点的越大的话,那么说明元图像空间中满足这个参数的图形越饱满。越像我们要检测的东西。

例子:视频扫描表头识别,对指针式仪表,利用霍夫变换识别出指针的偏转角度,再根据可读和角度的关系确定读书。

四 其他

自然图像的稀疏编码(sparsecoding,SC)算法(即神经稀疏表示法)是一种模拟哺乳动物视觉系统主视皮层V1区简单细胞感受野的人工神经网络方法,这种方法可以成功模拟V1区简单细胞神经元感受野的三个特性:空间的局部性、方向性和频域的带通性(在不同的空间尺度上具有选择性)。而且,这种方法编码方式的实现仅依靠外界感知信息的统计特性,并不依赖于输入数据的性质,因而是一种自适应的信号统计方法。 目前,稀疏编码技术已被广泛应用于语音信号分离、视觉图像处理、生物DNA微阵列数据分类和模式识别等诸多领域。但是,由于神经生理学家目前对主视皮层V1区的了解仍然知之甚少,所以稀疏编码技术尚处于发展阶段,其在理论和应用方面的研究还有待于进一步深化和完善。

在国外,Tan和Baker描述了一种图像定位和识别的方法,在一个小窗口内,该方法依据图像梯度进行。利用地面约束以及大部分图像外形受两条直线约束的事实,可得到图像的姿态。Fun等人利用高精度摄像机观察图像的运动来估计图像的形状,通过估计特征

点得到图像轮廓。基本思想就是高特征点的移动速度大于低特征点的移动速度,因为高特征点离摄像机近。图像轮廓就可用于车辆识别。Jolly等用变形模版进行图像识别,首先建立图像的侧视图和正视图的变形模版,边缘特征和颜色特征根据文献提起。通过直方图交集,图像的RGB直方图也需要比较。合适模版边的点集也通过点集之间的距离与其他图像的模版进行比较。

因篇幅问题不能全部显示,请点此查看更多更全内容