山东建筑大学 山东 济南 250101
摘要:采用深度学习机器人工学习识别技术目前可以自动从每个芯片模板样本中自动提取需要学习到的字符类型特征、无需手动进行任何人工直接数据提取和自动正确设置芯片模板匹配参数等三大技术优点,因此本篇文章将利用深度机器学习技术应用于自动芯片模板表面字符识别检测.
关键词:芯片表面检测;字符识别;深度学习
一、前言
随着我国半导体电子工业的快速健康发展和企业人力资源成本的不断提高增加,人们对目前芯片自动检测质检算法系统的检测需求越来越迫切第二.目前芯片器件表面字符识别检测算法是芯片自动检测算法系统的一项重要检测功能.目前多数芯片器件模板表面没有芯片字符识别模板自动检测系统算法处理系统主要算法包括二值化、字符识别组合切割、基于多个芯片字符模板需要组合进行匹配的字符识别3个主要操作步骤,其中基于图像识别模板二值化、字符识别组合切割两个步骤算法比较鲁棒,但基于多个芯片字符模板需要组合进行匹配的字符识别自动检测系统算法主要还是存在一些技术上的不足。例如单个芯片字符模板上的组合需要设置复杂,需要为不同的单个芯片字符识别模板需要进行组合从而设置不同的芯片字符识别模板;芯片模板组合抗震强度降低噪性比较差,芯片上的器件模板表面不可避免地很有可能就会出现芯片字符上的划痕、污点等一些技术性的问题,虽然不错但可能直接影响自动检测算法芯片正常工作时的质量,但也有可能严重影响字符识别,这些技术问题可能导致字符误检。因此更通用、鲁棒的字符识别检测算法对实现芯片器件表面每个字符串的自动检测至关重要。
二、训练数据增广
训练网络数据对大量深度训练网络数据性能优化有重要因素影响.一般来说地,如果深度学习训练中的网络增广数据越丰富、对深度训练中的问题信息分析占用空间的大量信息分析覆盖度也就越高,那么通过采集深度训练网络数据分析所得的大量真实深度学习训练值在网络增广数据中其泛化性越好、性能越优.实际上所需要采集的深度训练网络数据真实可靠,但它通常也可能会因为存在实际应用采集训练数据时的成本高、数据分布难以准确进行控制等一些技术上的问题,因此通常我们需要研究采用深度训练网络数据泛增优化网络增广的各种泛化方法用以丰富其泛化和逐步优化深度学习训练中的网络增广数据.本文在分析通过国际合作服务公司三种网络增广收集真实深度训练网络数据的各种技术基础上,采用"放缩、偏移、加噪"3种网络增广泛化策略用以泛化增广其在深度学习训练中的网络应用数据.
2.1缩放
因为由于存在不同芯片信号批次不同、图像信号采集处理设备的芯片位置发生变化等容易因素造成不同采集结果所得不同字符的图像尺寸不尽相同,所以本文通过进行放大/减少缩小已知现有图像字符串的图像尺寸来同时模拟不同采集情况,以便于保证图像训练集成时能尽量全面性地覆盖已有问题采集空间.放大缩小释放方法即按一定的压缩比例进行放大或减少缩小已有图像的全部内容,其操作过程计算方法结构如下图2所示.
2.2偏移
因为一些被摄者在所拍摄的具体图像中该芯片不一定一直精确地达到和固定在具体图像芯片同一个精确度的位置,所以对于一些现实环境中的被摄者拍摄的具体图像中该芯片由于出现字符高度偏移而在图像芯片库中通常总会同时出现可能存在各种不同字符高度位置偏移的各种特殊情况,因此本文主要通过不同字符串的偏移高度变换各种操作尽量多地设计模拟各种不同字符串的偏移高度变换各种情况.字符高度偏移位置高度优化变换操作方法设计即在一个具体图像芯片显示器的平面上对一个具体图像按一定的数值的偏移距离对其相对应的平移位置进行高度改变从而使得这个图像具有显示具体内容的精确度和位置高度.下图可通过数量化简单地设计模拟各种不同字符串的偏移高度变换各种情况.
2.3加噪
因为对于芯片内部采集的原始两个芯片内部两个字符图片对象图像是在一个模拟相机工业环境中的一个流水线上在模拟工业环境中被进行拍摄的,所以其中可能总会出现可能同时存在一些干扰诸如声音噪声以及光源滤波添加声音扰动等复杂干扰情况,这样就使得对于芯片进行拍摄时所在输出的两个芯片内部字符图像对象所在图像中有可能会同时发生出现滤波添加声音噪声,因此本文对原始未来化的两个芯片内部字符对象进行了滤波添加声音噪声的干扰处理,尽量减少了在模拟未来化中可能还一定会同时发生的滤波添加声音噪声以及光源添加扰动.常见的采用椒盐滤波添加高斯声音滤波噪声干扰处理方式主要包括有在芯片字符对象图像中采用椒盐滤波添加高斯添加声音噪声、椒盐滤波添加声音噪声,但经过对移动现实模拟工业中原始芯片中的字符对象图像的大量统计分析观察,芯片中的字符对象图像中可能存在的添加噪声基本上以芯片块状、条状两种形式同时存在。
三、基于深度网络的芯片表面字符识别
3.1深度网络结构
lenetg5是一款手机经典智能手机芯片深度网络结构,在移动数码相机手写和简体字符识别等高新技术应用领域已经成功获得广泛应用,如曾被美国银行特别推荐用于手机用来准确识别手机银行卡和支票上的银行签字.现有手机芯片上的手机表面字符识别技术问题主要属于字符识别系统技术上的问题,本文以现有手机芯片lenetg5网络结构为主要技术设计基础,针对现有手机芯片字符识别技术问题进行优化后提出了手机lenetg5网络结构,以使其更好地能够适应于现有手机芯片上的手机表面字符识别.手机网络结构优化后的手机网络系统结构设计流程如本文软件流程图10所示.
3.2基于更高可信度的数据识别并对结果进行优化
在整个芯片功能检测中,漏测自检(将不检测合格的产品误认为不再产品本身是不能检测合格的)很有可能会直接影响导致不再产品是不能合格的或将产品直接输出流入其他芯片检测操作环节,可能还甚至会对其造成较大量的不良影响,因此基于整个芯片检测硬件贴在表面上的字符识别图像自动检测识别系统通常对漏检的概率函数有一个比较严格要求.对于每个经过芯片字符识别后的图像,基于整个芯片深度识别神经网络的识别系统对其直接输出的字符识别图像对象检测结果都一定有一个可能错误,进而就有可能直接导致整个检测芯片的全部字符识别漏检.为此本文通过引入字符识别对象结果中的可信度函数r的一个概念,用于准确衡量字符识别对象结果的准确可靠性.其中若这个可信度的值小于某个深度阈值中的ε,则可以认为该字符识别结果错误,从而进一步引入减少漏检的直接发生可能概率函数.理论上我们未来可能会通过不断更新提高这个检测阈度的确定值,不断扩大值来减少漏检的直接检测发生概率可能性的概率,但这可能会大大幅度增加一个芯片输出误检的直接发生概率可能性.
四、结语
本文将这种字符深度识别机器人工学习识别技术广泛应用于各种工业芯片内部信号表面字符识别,不仅可以完全避免了繁琐又片面的字符使用和以人工智能进行字符特征识别数据库的选取以及识别等的过程,同时大大幅度提升了各种工业芯片字符识别的检测技术性和准确率.在分析应用各种经典字符识别工业芯片内部网络识别技术图片lenetg5的相关研究成果基础上,针对各种工业芯片内部字符识别技术图片的固有识别技术应用特点(特别例如对比如各种高频噪音字符识别芯片形式)和各种新型工业芯片字符识别检测的特殊识别技术应用需求(例比如对各种误检率较高芯片要求苛刻),在识别数据能力增强、识别实验结果性能优化三个方面进一步进行改进.通过实验结果证明,本文主要提出的识别方法不仅具有良好的鲁棒性,是一个完全可以很好地解决各种工业检测半导体字符识别出现问题的解决方法.
参考文献
南京维睛视空信息科技有限公司.一种基于深度学习的字符识别方法:[P].
作者简介:丁良栋,1996.06.21 男,民族汉,山东青岛 在读硕士:山东建筑大学 研究方向:控制工程专业,模式识别方向