(广电运通股份有限公司智能金融设备研究院广东广州510663)
摘要:人工智能技术成型于上世纪七十年代,并于本世纪初同纳米科学以及基因工程并称为二十一世纪的三大尖端技术。它主要将人的行为、意识、感官进行复制,进而以计算机系统参数的形式输入识别芯片而生产制造出智能机器,这种智能机器与人类智能相似甚至超越人类智能,目前,被广泛应用于社会各个领域。尤其在图像识别领域,人工智能技术占据着主导位置。因此,本文结合图像识别技术的基本原理,针对在人工智能背景下,图像识别技术的识别过程以及实际应用效果展开全面论述。
关键词:人工智能;图像识别;实际应用
图像识别是借助于计算机系统对图像进行识别和匹配,而基于人工智能,能够使图像识别更加精准,匹配过程更加流畅,这项技术也给社会各行各业注入了新鲜血液。比如在工业制造过程中,应用图像识别技术,能够快速挑选出合格品与不合格品,在交通执法过程中,图像识别技术能够准确识别每一辆车的车牌信息、车辆信息,准确定位违法车辆。在农业生产过程中,图像识别技术能够根据不同的水果、蔬菜品种以及品质好坏,筛选出质量上乘的果蔬,进而为果蔬种植户增加更多的收入。在日常生活中,人们在购物、交易过程中,可以通过图像识别中的人脸识别技术、指纹识别技术快速完成交易过程,为人们的生活提供了诸多便捷服务。由此可见,基于人工智能的图像识别技术已经完全融入人们的日常生活当中。
一、图像识别技术的基本原理分析
图像识别技术的基本原理类似于人眼识别原理。当某一图像的角度、位置发生改变,人眼以及人的感官也会发生改变,图像在视网膜上面的图像形状会呈现出不同的样式,而人具有灵敏的感官,比如在人的背后写字时,人可以通过感官准确判断出写的是什么字。而图像识别技术恰恰根据这一原理,通过对图像特征的掌握和了解,来判断图像的性状。图像特征可以借助于一些简单的数字、字母图像予以说明,比如数字“8”,特征是上下两个对等的圆,字母“J”的上面有一个凸起的尖角,图像识别技术能够根据这些图像独有特征,对图像进行准确识别,进而分析出该图像的内涵与释义[1]。利用这一原理,科学家将各种图像制作成多种识别模型,计算机系统捕捉到某一个图像时,系统中的图像模型就被调取出来与之进行匹配,如果匹配成功,就说明该图像已经被有效识别。
二、基于人工智能的图像识别流程
图像识别系统主要包括:图像信息获取采集、图像预处理(二值化、反色等)、特征抽取和选择、训练过程(分类器涉及和分类决策)以识别过程。
图1-1图像识别基本流程图
图1-2基于人工智能车牌识别系统流程图
(一)图像信息的采集阶段
图像采集过程是针对被识别物体,将其转换为数字图像的形式,在采集过程中,需要多种图像采集设备的支持,最为常用的电荷藕合器件图像传感器(CCD)或者互补金属氧化物半导体摄像机(CMOS),具体的采集流程是光感器件接收到图像模拟信号以后,通过A/D转换将系统中的图像信息转换为数字图像,计算机系统对数字图像进行编解码处理,处理过程主要包括图像的对比度、清晰度以及噪点等参数。利用人工智能技术,这些模拟图像的像素具有噪点少、密集度高、易调节处理等优势,因此,这种图像识别系统的应用频率较高。人们平时使用的智能手机以及掌上电脑的图像识别系统就安装了互补金属氧化物半导体摄像机(CMOS)。
(二)图像的预处理阶段
图像预处理主要对图像进行去噪、变换及平滑处理,以得到满意效果的图像。这一阶段的关键步骤是图像特征提取,由于前期的图像输入存在各种不足之处或者偏差,比如对比度差、亮度不足、噪点多,因此,必须变换数字图像,首先是去噪过程,这一过程由各种不同的滤波环节组成,滤波主要包括中值滤波以及均值滤波等,将输入的模拟图像转化为可以解算的二值化图像,对图像进行分割,把图像的非识别部分与识别部分区分开,分割方法涵盖语义分割、实例分割以及普通分割三种,分割过程体现很强的智能性,可见,人工智能技术在图像预处理过程中发挥着至关重要的作用,这是过去单单依靠于人工技术而无法完成的一道工序[2]。
(三)图像特征的提取过程
任何一个图像都具有不同的特征、特性,在特定识别任务下,将模拟图像的相关信息参数转换为计算机处理的特征向量,这一特征向量实际上就是一个图像的信息集合,它包含了图像所有的共性特征,不同的图像,共性特征也有所不同。而特征可以划分为低级与高级两种,低级特征是图像的一些表层特征,比如像素特征、尺寸特征,高级特征又称之为全局特征,能够对图像中的各个属性对象进行有效辨识。因此,在特征提取过程中,应将低级特征与高级特征进行综合过滤,将提取出的特征信息与计算机系统中的图像存储特征相匹配,如果匹配成功,则可以忽略一些次要特征或者无用特征。
(四)图像识别过程
当提取可用的图像特征后,借助于人工智能技术,系统将特征信息转换为特征向量,然后针对这些特征向量有效识别,并与计算机的云存储数据库中的图像及时比对和匹配。如果图像特征较为复杂,对计算机软、硬件的配置要求也较高。目前,基于人工智能的图像识别技术包括模板匹配法、贝叶斯法、神经网络法以及非线性降维法等,根据图像识别任务不同,所采用识别方法也有所不同。
三、基于人工智能的图像识别方法
(一)模板匹配法
模板匹配法是应用较为广泛的目标检测识别算法,工作原理与搜索引擎有着异曲同工之处。即把图像的特征,比如图像颜色信息、尺寸信息等输入数据库,这些特征信息与数据库的原始图像信息模板进行比对和匹配,如果特征吻合,就能立刻得到该图像的全部信息。应用这种方法时,可以采取多级搜索方式,这样能够提升搜索效率,根据图像的高级特征锁定搜索范围,再根据图像的个性特征进行匹配,能够进一步缩小比对范围,而且图像匹配度也相对较高。
图1-3:基于模板匹配的车牌字符识别流程图
(二)贝叶斯法
这种方法的灵感来自于统计学的经典理论,主要利用贝叶斯定理算法对图像特征进行处理,通过概率统计的方式,得到图像的附加信息,经过科研人员的不断摸索和探寻,传统的朴素贝叶斯法已逐步被贝叶斯TAN算法取代,使图像识别的效率更高、精准度更高[3]。
(三)神经网络法
神经网络法借助于计算机,模拟人类的神经系统而采取一种人工智能分类方法,这种方法具有较强的学习能力,较为常用的方式包括:小波神经网络、BP神经网络以及RBF神经网络,而在此基础上所衍生出的深度学习法也是目前科研领域一直关注的焦点课题。神经网络是一种全新的图像识别方法,它模拟了人与动物发达的神经网络,比起其它图像识别技术,较为复杂,投入成本也较高,但是相比之下,这种方法的精准度也最高。尤其在现代交通网络管理系统中,道路的监拍系统就应用了基于人工智能技术的神经网络的方法,它可以在一瞬间准确识别出车牌信息与车辆信息,为交通违章提供了真实准确的数据参考。
(四)非线性降维法
对于一些分辨率较低的图像,采取以上方法,识别效果不明显,而非线性降维法是主要针对模糊图像以及辨识度不高的图像进行识别的高维识别技术,在识别过程中,能够获得图像的多维性特征,然后对图像信息进行非线性处理。不过在图像处理过程中,要求图像识别应在短时间内完成大量数据信息的计算,与线性降维技术相比,非线性降维技术的操作性更强,识别效果也较好。比如日常生活中,人们常用的刷脸功能,就很好的应用了非线性降维的方法,因为这种高维度的识别功能,能够快速准确识别出人脸的不同特征。
结束语:
基于人工智能的图像识别技术几经升级、改良,已逐步形成一个较为纯熟的图像识别体系,不仅为人们的日常生产、生活提供了诸多便捷服务,而且也推进了整个社会的智能化发展进程,为智能时代的到来注入了全新的生机与活力。
参考文献:
[1]牛张哲.基于人工智能的图像识别技术探究[J].通讯世界,2019,26(1):218-219.
[2]石铁山.人工智能中的图像识别技术探讨[J].科技资讯,2018,16(36):15-16.
[3]王雪淳.基于图像识别与生成技术的人工智能应用[J].科技传播,2019,11(7):153-154.