基于YOLO v5图像识别技术适配开发接触网鸟巢智能识别预标记系统

(整期优先)网络出版时间:2024-04-10
/ 3

基于YOLO v5图像识别技术适配开发接触网鸟巢智能识别预标记系统

张东杰、裴涛

中国铁路武汉局集团有限公司宜昌综合维修段

摘 要:鸟巢是造成铁路接触网供电中断的主要隐患之一。当前的管控手段主要依靠人工添乘和2C图像智能分析+人工判读,工作量大、劳效低、疏漏多,特别是在鸟巢爆发季,无法达到实时管控、避免接触网跳闸的目标。针对该现状,开发出一种利用YOLO v5智能识别系统,对2C数据预先标记处理,再对标记数据进行确认,可以大大提高2C数据的分析速度和效果。通过实际运用,该系统对成型鸟巢识别率达90%以上,极大地提高了分析效率,确保了接触网供电安全。

关键字:接触网2C图像,YOLO智能识别,鸟巢检测,分析效率

1引言

接触网作为电气化铁路的重要组成部分,其供电的安全稳定性直接关系着铁路运输的安全与效率。运营实践证明,接触网鸟巢病害造成的跳闸已成为接触网日常运营中的主要季节性隐患,严重挤占了接触网运营成本和劳效。

鸟类在接触网支柱上筑巢后,其窝巢材料(树枝、茅草、泥土、铁丝)在阴雨天气时极易引起接触网瞬时闪络。为了保证接触网供电的安全可靠,必须对鸟类在接触网支柱上的筑巢行为进行监测、预警和防治。目前,铁路供电运营单位主要是通过接触网安全巡检装置(2C)添乘拍摄图像,再由分析人员对采集回来的图像逐帧进行分析,标记判断鸟巢危害等级,限时处理。为了保证在鸟巢爆发季节达到实时监控的目的,通常会采取加密添乘,逐处研判的方式来管控,这样就会产生海量的2C图像,需要大量的人力进行分析,势必会让有限的分析人员倦怠,同时受分析人员情绪影响,分析质量良莠不齐,分析速度快慢不一,影响鸟巢隐患的处理优先级和时限。为了提高分析效率和研判精准度,通过YOLO v5智能识别算法开发出一套2C图像智能预处理标记系统,可以极大地提高分析效率和精准度。

2技术开发过程

2.1技术选型

通过参考相关研究资料得知,目前,目标检测算法大致分两类:一类是两阶段目标检测算法,代表有R-CNN、Fast R-CNN以及Faster R-CNN。另一类是基于回归的一阶段目标检测算法,典型代表是YOLO算法。从工业使用场景、开源资料量、技术研究深度、运行速度、稳定性、易用性、发展迭代速度、成熟性方面相比较,YOLO算法远优于其他算法。所以,笔者采用一阶段目标检测算法中的YOLO经典算法来开发智能识别系统。

2.2YOLO检测算法介绍

算法是指用什么方法进行图像信息处理。YOLO算法是由pvala等人在2016年提出的一种目标识别算法,迄今已经迭代发展到第五代-YOLO v5,其全称是:You Only Look Once:Unified,Real-Time Object Detection。该名称基本上已把YOLO算法的特点概括全了:只需要进行一次CNN运算,就能提供检测目标端到端的工程预测(神经网络架构见图1),工业场景运用极其广泛。

图1 YOLO v5 神经网络架构图

2.3运行平台搭建

该程序基于YOLO v5算法,Pytorch框架,使用GPU硬件加速来减少CPU的工作负荷,依赖CUDA工作台、cuDNN加速库,运用Python编程语言编写,微软公司的Visal Studio作为程序编辑器,适用于各种X86系统平台[3]

2.4系统拓扑图

本系统是通过封装好的卷积神经网络为核心,对检测参数进行了一系列的试验、整合、验证,最终完成了成型鸟巢智能识别标记系统,系统拓扑图如图2所示。

图2 智能识别系统拓扑图

2.5图像识别思路

图像识别包括图像采集、图像预处理、特征提取、模型匹配、参数调节、训练验证、部署安装等环节。识别过程主要分:对样本图像进行训练和对实际图像进行分类识别两部分。样本图像训练的基本思路是将样本图像特征所属的类别构成模板库;图像识别的基本思路是按照训练过程中的图像特点提取特征,再拿待测样本的特征与模板库中特征进行匹配对比,匹配程度最高的即推理为识别结果,识别详细过程见图3。因此,准确地提取目标特征是提高目标识别准确度和速度的关键。

图3  图像识别过程

2.6系统编程

利用微软公司的开源代码托管仓库GitHub网站上的开源智能识别框架,参考典型开发范例开发出此系统。系统主要库文件和顶层设计程序见图4,工作量占整个系统设计的一半,用时3月,难点主要是程序的理解和适应修改。

图4 系统主要库文件和顶层设计程序

2.7样本数据集的选取

智能识别基于深度学习,因此需要提前准备样本,用于机器深度训练学习。笔者首先通过人工分析2C设备采集的图像,筛选并收集鸟巢的原始图像,如图5所示。

由于数据集对于识别的准确率起着至关重要的作用,为得到多场景、多角度、多照度的训练素材,笔者挑选出了2000张鸟巢图像用于标注训练,涉及晴天、阴天、雨天、雾霾、模糊、曝光不足、曝光过度、远景/近景、镜头偏斜等不同天气、环境、条件的图像。

图5 筛选出的鸟巢原始图像

2.8标记样本

利用图像标记工具OpenLabeling对选取的鸟巢图像按标准的VOC2007数据集格式打好标签,标记生成.xml文件,用于模型训练,标记界面见图6。

在这里插入图片描述

图6 样本标记界面

2.9训练识别模型

制作好标签数据之后,就可以开始训练神经网络了。一般来说训练的时间取决于硬件的配置以及数据集的大小,正常情况下每个class值至少需要300张图像才可以有一个比较准确的结果。为了缩短网络的训练时间,并达到较好的精度,笔者在电脑上采用了加载预训练权重的方法进行模型训练,经反复比对,最佳的设置是:模型训练时优化器选择Adam,batch size设置为64,训练轮数epochs设置为200,学习率设置为0.001,调整加训练共用时一周。

2.10模型测试

任意抽未使用过的鸟巢图像1000张,对人工分析和智能识别结果进行对比,结果表明,智能识别对成型鸟窝的识别率为91.7%,目标识别较好。单张图像识别测试见图7所示,大批量图像识别测试见图8所示。

图7 单张鸟巢图像识别测试

图8 大批量图像识别效果测试

2.11数据加载接口

数据加载接口是指输入文件夹路径和检测识别后,保存输出的结果位置。

使用前,用户只需将要识别的图像复制到“原图”文件夹中,如图9所示,可选的图像文件可以为.jpg、.png、.bmp格式,运行Python程序,加载检测主程序,然后点击右上角开始运行,待进度条完成后,检测结果即在“识别输出”文件夹中全部按原次序显示,中途不需要人为干预。如图9所示。

图9 输入、输出文件夹

3应用效果

利用智能化助力鸟巢防控,可以节省人力、加快分析效率、避免错漏风险。为了验证该系统在实际使用中的作用发挥,宜昌综合维修段供电6C分析组将该系统嵌入到生产流程中进行实际试用,平均识别率可达90%(见表1),标记分类准确,操作简单,没有发生过宕机奔溃情况,大幅减少了分析人员的操劳,真正实现了降本增效。

待检测图像数/张

含鸟巢数/张

正确检测数/张

检测命中率

测试样本总数

150000

3900

3559

91.26%

表1 本识别系统在鸟巢集中检测测试中的检测效果

4创新点

4.1从根本上解决了生产难题。以往分析人员需要将海量的2C图像通过人工方式逐帧判读,耗时长且遗漏较多,而利用该系统进行自动分析标注后,分析工作可以在较短时间内完成,极大地解放了劳动力,提高了工作效率,从根本上解决了生产难题。

4.2该系统能安装到普通笔记本电脑中,具有便携、易用的特点,可以在添乘人员返程途中即开始自动分析,符合作业生产的实际需求。

4.3建立了汉宜线彩色800W像素2C鸟巢目标检测数据集,约2千张,这些数据集来源于当前汉宜线实际的场景拍摄,比从其他途径得来的图像更真实、更有针对性,具有很强的应用价值,既可用于目标训练,又能作为验证样本源。

4.4掌握了智能识别系统开发的流程和方法,为后续同类项目研发提供了借鉴。

5使用中的局限性和下一步优化方向

5.1使用中的局限性

5.1.1小目标识别率低。该系统对小鸟巢、零散树枝检测效果不好,这是因为小鸟巢、零散树枝在一张2C图像中的占幅过小,与背景反差小,特征提取后,特征不明显,影响识别率。

5.1.2不够智能化,还不能完全代替人工判读。图像成像质量较好时,识别率能达到90%,但只要不能达到100%,就不能确保识别万无一失,原则上就不能完全的缩减鸟巢专项分析人员。

5.1.3现有识别算法在汉宜线彩色800W像素2C图像条件下图像识别率最高,但没有对其他类型的数据进行过适配和多尺度样本训练,一定程度上影响了2C智能识别系统的通用性和目标识别的广泛性。

5.2下一步优化方向

5.2.1加装操作界面。需要为该系统增加前端操作界面,确保每个人都能无障碍的使用。按钮至少包括:导入原图像、开始标记识别、导出标记图像,可以使用OpenCV或网页来构建。

5.2.2增加少量树枝多模型识别模块,从而形成一套完整的鸟巢智能识别分析系统,最终全面嵌入到生产流程中,达到不再安排大范围对2C图像进行鸟巢判读的目的。

5.2.3集成其他智能识别项点,例如集成杆号识别、吊弦折断识别、杆号牌脱落识别、补偿装置a、b值计算、结构件脱落识别、线索断股识别、异物识别、线索交叉互磨识别、绝缘子闪络检测等,实现真正的多项目“智能识别”系统,达到一次巡检,所有项目全面检查一遍的目的。

5.2.4进一步提高算法的运行效率,可直接集成到2C采集设备中,实现实时采集,实时分析报警[12]

6结束语

笔者从实际需求背景出发,利用YOLO v5智能识别技术,以开源的深度学习框架为基础,开发出2C图像鸟巢智能识别预处理标记系统。该程序简单可靠高效,利用现有条件,解决了当前铁路供电运营中的实际困难,把先进技术转变成实际生产力,将分析人员从枯燥乏味的简单劳动中解放了出来,大幅提高了工作效率,对确保铁路供电运营安全具有重要意义。

参考文献

[1]周俊,陈剑云.基于DSSD的接触网鸟窝识别检测研究[J].华东交通大学学报.2019(36-6)70-78

[2]屈志坚,高天姿,池瑞,杨行.基于改进的YOLO v3接触网鸟巢检测与识别[J].华东交通大学学报.2021(8)72-80

[3]戴舒,汪慧兰,许晨晨,刘丹,张保俊.基于YOLO算法的行人检测方法[C].无线电通信技术.2020(3)360-365

[4]王桢.基于视频图像处理技术的输电线路杆塔鸟巢识别[D].华北电力大学硕士学位论文.2013-10079

[5]陈小龙.基于图像识别技术的变电站鸟巢智能辨识别技术研究与应用[J].电子测试.2018.16 48-51