(燕山大学信息科学与工程学院通信工程系,河北省海港区066004)
摘要:通过迁移学习的方法,利用人脸识别的改进VGGNet模型对Oxford-17Flower和Oxford-102Flower中的花卉分别进行训练与识别,实验证明了改进VGGNet模型对花卉的小训练样本同样明显提升了运算速度与识别度。
引言:
随着近年来大数据时代的兴起与计算机硬件的不断发展,深度卷积神经网络成为了人工智能的新的发展方向,与传统机器学习方法相比有着更为强大的特征学习与表达能力。由于花卉的本身具有一定的相似性加之自然环境有一定的复杂性,依靠传统机器方法并不能模型容易造成数据冗余,浪费计算能力。
为了针对地区花卉品种较少的花卉样本,我们提出使用改进VGGNet在较小的数据规模与小的计算能力对其进行训练,结果显示在小样本条件下完全符合预期要求。
正文
1.VGGNet神经网络
VGGNet是牛津大学视觉几何组VGG(VisualGeometryGroup)小组开发的一个著名的应用于图片分类的卷积神经网络模型。且在2014年在ILSVRC比赛上获得了分类项目的第二名和定位项目的第一名。VGGNet网络与AlexNet[1]网络的框架有相似之处,但VGGNet更像是AlexNet的扩展版本,加深卷积层数来达到准确率提升的途径。通过VGGNet的相关文献我们了解到,VGGNet通过加深卷积层可以提升准确率但有一定的限度,有VGG16与VGG19两种。通过对两种的横向比较,我们最终选定利用VGG16作为我们的网络结构。
我们可以看出VGGNet是著名卷积神经网络模型AlexNet的扩展。相对于AlexNet网络,VGGNet作出如下有价值的改进
1)VGGNet网络使用连续3个3×3的卷积核替代1个7×7卷积核。对于C个通道的卷积核,7×7的卷积层含有参数72C2,而3个3×3卷积层的参数个数为3×32C2,因此使用参数的个数可大大减少。
2)使用3×3卷积核的原因是:3×3是可以表示“左右”、“上下”、“中心”三中模式的最小单元,同时采用较小的卷积核有利于更好地提取图像细节特征。更多的卷积层则增强了网络的非线性表达能力。
但我们也发现VGGNet网络不使用局部响应标准化LRN(LocalResponseNormalization),查阅文献表明,这种标准化并不能提升性能,却导致更多的内存消耗和计算时间[1]。同时VGGNet网络因为含有较大的训练量,但收敛的速度较慢,于是就需要花费大量的时间与运算资源,这一点对于计算能力有限的环境下开展VGGNet网络训练是十分困难的。于是我们参考LiteVGGNet[2]对模型进行改进。
2.改进的VGGNet模型[3]
我们通过减少全连接层以及使用均值池化层替换最大池化层,成功将VGGNet的参数由138M下降到了16M提升了运算速度。
3.模型训练与验证
我们通过使用Oxford-17Flowers与Oxford-102Flowers数据集对我们的模型进行验证。其花卉数据库的来源是牛津大学视觉几何实验室(VisualGeometryGroup)。其中大部分花卉的图像来源与网络,一部分则由他们自己拍摄而成。因此,这两个数据库的花卉图像不但具有着实际花卉的真实图像,更具有研究的重要意义。在Oxford-17Flowers数据集中,共有花卉1360张,其中共分17类花卉图像。而在Oxford-102Flowers数据集中,共有花卉8189张,其中共分102种花卉图像。
我们按照之前预设计的方案对VGG16网络进行Fine-tune训练,并按照LiteVGGNet模型对其进行修改,最终得出我们的模型。Fine-tune的时候我们采取随机梯度下降法(StochasticGradientDesent,简称SGD),而不采用其他自适应学习率的优化算法,是为了保证网络参数以小幅度进行更新,这样可以防止预训练的特征被破坏。
测试结果:表中为识别率
我们可以看出,相对于VGGNet模型,LiteVGGNet模型虽然略微低于其,但需求训练样本个数和图片数量较小能够适用于训练数据集较小的应用场景,对硬件计算力要求更低,因此该模型具有一定的实用性。
结语
为了针对VGGNet网络依赖大规模数据与计算资源的背景下,我们迁移了一种小模型下使用的VGGNet网络对花卉进行分类识别,并验证了其在小样本条件下的可行性。
参考文献
[1]KrizhevskyA,SutskeverI,HintonGE.Imaganetclassificationwithdeepconvolutionalneura-1networks[C].AdvancesinNeturalInformationProcessingSystems.Cambridge:MITPress,2012:1097-1105
[2]SimonyanK,ZissermanA.VerydeepconvolutionalNetworksforlarge-scaleimagerecognition[J].ComputerScience,2014:1409-1556.
[3]喻丽春,刘金清.基于改进的VGGNet算法的人脸识别[J].长春工业大学报.2018,39(04),378-385.
作者简介:陈鸿博(1998-),男,天津市人,学历:大学本科在读,研究方向:通信原理;
杨鹤,符明东,符传斌,李根雨,单位:燕山大学。