贝叶斯优化算法在磁计量仪器故障分析中的应用

(整期优先)网络出版时间:2020-10-14
/ 2

贝叶斯优化算法在磁计量仪器故障分析中的应用

胡圣航

中国船舶集团有限公司第七一○研究所,湖北 宜昌 443003

摘 要:针对磁计量仪器故障模式多样的特点,提出了一种基于改进的贝叶斯优化算法的故障模式聚类分析方法。该算法通过将免疫算法选择优良个体方法与先验信息运算算法这两种方法相结合对贝叶斯优化算法进行改进,既提高了优良种群的多样性同时又避免了信息浪费,从而综合提高了算法的全局性和快速收敛性。在理论上对贝叶斯优化算法在故障模式分析的应用进行了研究。

关键词:磁计量仪器;贝叶斯方法;亲和度;聚类分析

1 引言

贝叶斯优化算法(BOA,Bayesian Optimization Algorithm)使用概率模型来模拟种群中个体的分布情况,是一种基于概率进化的分布估算算法。由于传统的贝叶斯优化算法BOA采用由目标函数值确定的适应度作为优良个体选择依据,对于约束优化问题,采用由罚函数值确定的适应度作为依据。这样会导致优化进行到一定代数之后,所选个体相似度高,个体多样性差,抽样时难以生成更好的新个体,使得算法容易陷入局部最优。另外由于在常规算法中未考虑先验信息,结果又造成了信息浪费不能重复利用数据。

针对上述问题,本文对故障分析中的贝叶斯优化算法进行综合改进:首先是在优秀个体选择上引入了免疫算法中的亲和度和浓度概念,将个体适应度概率和个体浓度概率相结合,形成贝叶斯优化算法选择优良个体的依据。其次是在算法上结合先验信息修正贝叶斯网络,充分利用数据。最后应用改进的算法结合数据最优聚类分析方法,根据聚类分析的相似度和聚类目标函数进行故障判断。

2 贝叶斯优化算法

贝叶斯优化算法是一种基于概率分布的进化算法。BOA使用贝叶斯网络BN来模拟各变量之间相关性,这种相关性反映了模式理论中的模式。贝叶斯网络是一个有向无环图,用它来表示一组变量之间概率关系。在贝叶斯优化算法中,建立贝叶斯网络是算法的核心和关键。如图1所示。

5f86998bf1bd9_html_14be70d4f465fb0b.gif

图1 7节点的贝叶斯网络

贝叶斯网络是联合概率分布的图形表示形式。一个贝叶斯网络由两部分组成:结构B和参数θ。结构B是一个有向无环图,其节点表示各个变量,节点之间的有向边表示变量之间的条件依赖关系,两个节点之间若没有有向边,则说明这两个随机变量是相对独立的。

对于有向边5f86998bf1bd9_html_38c6479c355183ac.gif ,5f86998bf1bd9_html_cad7a5b96d163a6c.gif 称为5f86998bf1bd9_html_1d9b3e0c01130610.gif 的父节点,而5f86998bf1bd9_html_1d9b3e0c01130610.gif 称为5f86998bf1bd9_html_cad7a5b96d163a6c.gif 的子节点。参数θ是各变量条件概率分布表的集合,即5f86998bf1bd9_html_533b5192c99d3703.gif 。其中5f86998bf1bd9_html_8e5745dd2f59e72a.gif ,表示变量5f86998bf1bd9_html_cad7a5b96d163a6c.gif 在其父节点集5f86998bf1bd9_html_b9565593f13e535.gif 下的条件概率分布。由贝叶斯网络可以将个体的联合条件概率分布为:

5f86998bf1bd9_html_557f9e0e6d913d9c.gif (1)

贝叶斯网络是用来描述所选择的优秀解的特征和分布,以此来指导新解的生成。为了能够快速构建贝叶斯网络结构,通常采用基于BD打分测度的贪婪算法构建贝叶斯网络。

3 改进的贝叶斯优化算法

通过查阅相关文献资料,发现已有的对贝叶斯优化算法的改进往往有一定的局限性,如只在优良个体选择上进行改进[2]或只在是否结合先验信息运算上进行改进[3],而在优良个体选择上改进后的算法中未考虑结合先验信息,同样在结合先验信息的改进贝叶斯优化算法在个体选择机制上又相对简单,而这两种改进方法恰好能起到长短互补的作用。因此本文提出的改进贝叶斯优化算法的基本思想是:在参考相关资料的基础上将上述两种对贝叶斯优化算法的改进进行优化结合,从而达到最优改进的目的。

首先在优秀个体选择上对贝叶斯优化算法进行改进[2],引入了免疫算法中的亲和度和浓度概念,将个体适应度概率和个体浓度概率相结合,形成贝叶斯优化算法选择优良个体的依据。设有N个个体,每个由S={0,1}中的M个基因组成(一个二进制的字符位串),则第j个基因的信息熵为

5f86998bf1bd9_html_636c1ef8afe95b41.gif5f86998bf1bd9_html_9abf21b2be11c42c.gif (2)

式中:5f86998bf1bd9_html_5f0301d78d76159c.gif 表示S中第i个字符(0或1)在第j个基因位上出现的概率。若在位置j上所有个体的字符都相同,那么5f86998bf1bd9_html_abbbf9e138d78db9.gif 。平均信息熵5f86998bf1bd9_html_4560a1fb1d299fdf.gif ,它反映了多样性。由此,得到个体u与v之间的亲和度5f86998bf1bd9_html_711daeac74c7c6c2.gif5f86998bf1bd9_html_e5e2adbee9b15ab9.gif 的取值范围为5f86998bf1bd9_html_6a7acc4079df0d3a.gif5f86998bf1bd9_html_e5e2adbee9b15ab9.gif 越大表示两个个体基因相似度越高,5f86998bf1bd9_html_b1a254a90b40a6c4.gif 表示两个个体基因完全相同。个体浓度定义为: 5f86998bf1bd9_html_d6921e9f964a4090.gif5f86998bf1bd9_html_40662a072ec3b0a7.gif 表示与个体5f86998bf1bd9_html_1736468181fe6b37.gif 亲和度大于亲和度常数5f86998bf1bd9_html_b45272527abb021a.gif 的个体数。5f86998bf1bd9_html_b45272527abb021a.gif 一般取值5f86998bf1bd9_html_a803287386e944ef.gif 。这样每个个体的评价指标变为:

5f86998bf1bd9_html_5c2281c94ec39923.gif (3)

式中:5f86998bf1bd9_html_a10e5a143fc0adc5.gif 为个体适应度概率,对于最小化问题,目标值/罚函数值越小,5f86998bf1bd9_html_a10e5a143fc0adc5.gif 越大,且5f86998bf1bd9_html_598c9b9ad759d2b3.gif5f86998bf1bd9_html_e52729ceff6a250e.gif 为个体浓度概率,个体浓度越小,5f86998bf1bd9_html_e52729ceff6a250e.gif 越大,且5f86998bf1bd9_html_b681688d16cd0ac9.gif5f86998bf1bd9_html_b1414e0e8ca578a0.gif 是常数调节因子;若5f86998bf1bd9_html_f89ea9ab2c2cc0cf.gif ,则只使用个体适应度概率作为选择依据。以每个个体的5f86998bf1bd9_html_6aa3c7ebb83897e3.gif 值作为选择依据,使用确定性选择方式,选择种群中5f86998bf1bd9_html_6aa3c7ebb83897e3.gif 值大的那部分个体组成优良个体集合。这种选择依据能够有效地保持种群的多样性,提高算法的性能。

另外,通过分析发现,常规算法中没有考虑前一代种群提供的优秀解及构建的贝叶斯网络结构的特点,这样造成了信息浪费,影响构建网络的可靠性。因此可以把前一代网络构建的信息和结构作为后一代构建的先验知识,利用先验知识来修正贝叶斯网络。这样不但可以充分利用数据,而且可以提高所构建网络的可靠性,从而提高算法的收敛速度和全局收敛性。因此本文使用结合先验信息的BD(贝叶斯 dirichletmetric)打分法

[3]

5f86998bf1bd9_html_6b27bd132662cde9.gif (4)

其中:5f86998bf1bd9_html_aa036cbf6ee515f5.gif 是网络结构B的先验概率;对5f86998bf1bd9_html_cad7a5b96d163a6c.gif 的连乘表示对节点5f86998bf1bd9_html_cad7a5b96d163a6c.gif 的所有取值进行乘积,对5f86998bf1bd9_html_483d87270ebd2d11.gif 的连乘表示对节点5f86998bf1bd9_html_238d46666cc9346d.gif 的父节点5f86998bf1bd9_html_b9565593f13e535.gif 的所有取值的乘积;5f86998bf1bd9_html_a2ccc8dc2d7f5c54.gif 表示数据中5f86998bf1bd9_html_b060203d6b37b80.gif5f86998bf1bd9_html_e66b1652300bc196.gif 的例子数,5f86998bf1bd9_html_d21028d34666ee3f.gif 表示数据中5f86998bf1bd9_html_e66b1652300bc196.gif 的例子数;5f86998bf1bd9_html_84c092189439073.gif5f86998bf1bd9_html_3ab6f21f8a232d9c.gif 分布表示5f86998bf1bd9_html_a2ccc8dc2d7f5c54.gif5f86998bf1bd9_html_d21028d34666ee3f.gif 的先验信息,即5f86998bf1bd9_html_84c092189439073.gif 表示先验信息数据中5f86998bf1bd9_html_b060203d6b37b80.gif5f86998bf1bd9_html_e66b1652300bc196.gif 的例子数,其中参数为:

5f86998bf1bd9_html_a600a67ec734a329.gif (5)

如果无先验信息,则令5f86998bf1bd9_html_9ce951953df0d032.gif

4 故障模式识别

这里采用文献[3]提出的故障模式识别方法,即根据故障监控状态下系统的测量值进行聚类分析来进行系统的故障诊断。采样数据向量定义如下:

5f86998bf1bd9_html_a6970cc0a1f22bf.gif5f86998bf1bd9_html_1a033c74251c4015.gif (6)

其中:vi∈Rd(1≤i≤T)为采样数据向量; ci∈Rd(1≤i≤C)是聚类中心向量。数据x和y之间的方向相似度S(x,y)定义为:5f86998bf1bd9_html_6b5bb03f6c07e767.gif

定义如下的聚类目标函数:

5f86998bf1bd9_html_8896b7acdd672931.gif (7)

其中:W=uij为隶属矩阵。选择如下优化目标函数:

5f86998bf1bd9_html_a62593085ddc4e55.gif (8)

其中:s t5f86998bf1bd9_html_38d4c985097cabdc.gif =1, 5f86998bf1bd9_html_2b8f5f92e90d4a58.gif ,5f86998bf1bd9_html_a4658f568b599c13.gif5f86998bf1bd9_html_55a04ebed59c3be4.gif5f86998bf1bd9_html_a5b9b9b47b186ac7.gif ,1≤5f86998bf1bd9_html_66016458b2915b73.gif ≤d,1≤i≤C。5f86998bf1bd9_html_55a04ebed59c3be4.gif 是聚类中心向量的第5f86998bf1bd9_html_66016458b2915b73.gif 个元素;5f86998bf1bd9_html_b88e6943289353dc.gif5f86998bf1bd9_html_da3205a50769848a.gif ,1≤j≤T。迭代终止条件为:5f86998bf1bd9_html_dcdbc8ae27781b56.gif5f86998bf1bd9_html_365e1ff7e5aa67d6.gif5f86998bf1bd9_html_365e1ff7e5aa67d6.gif 取任意小的正数。对采样数据V的聚类就是在上述约束条件下优化5f86998bf1bd9_html_59faf37defc5f2e5.gif 。那么故障模式分类问题就转换为求解带约束的最优化聚类问题。

5 故障模式分类算法及运算过程

本文通过将上述两种对贝叶斯优化算法的改进融合起来形成一种新的改进后的贝叶斯优化算法,这种算法和常规的贝叶斯优化算法相比,既在优良个体选择上引入了免疫算法的亲和度和浓度的概念始终保持选择优良个体,又结合了先验信息提高了算法的快速收敛性。根据上文的聚类分析方法,以下就是本文提出的基于改进的贝叶斯优化算法的故障模式分类算法及运算过程:

  1. 根据系统实测数据,随机初始化种群5f86998bf1bd9_html_a9aa62fc6fab5ad7.gif ,设置种群规模5f86998bf1bd9_html_e17779f32117bdd0.gif ,参数5f86998bf1bd9_html_a279a03c71e4303f.gif ,参数5f86998bf1bd9_html_386d2d12bf6c9138.gif ,常数调节因子5f86998bf1bd9_html_975768ce8b66a2cf.gif ,亲和度常数5f86998bf1bd9_html_b45272527abb021a.gif ,令进化代数5f86998bf1bd9_html_535d78963a678dc8.gif

  2. 将个体适应度概率和个体浓度概率一起(5f86998bf1bd9_html_5c2281c94ec39923.gif )作为评价依据。从5f86998bf1bd9_html_a9aa62fc6fab5ad7.gif 中选择部分优秀个体(5f86998bf1bd9_html_a279a03c71e4303f.gif 个),组成集合5f86998bf1bd9_html_f813b61e122ab122.gif

  3. 5f86998bf1bd9_html_5a30466cfc301c57.gif 为算法的一个解,那么把它转换为隶属矩阵5f86998bf1bd9_html_fb85dc31122f255d.gif ,并且更新聚类中心向量:5f86998bf1bd9_html_4a4f01046753756f.gif ;由式(7)计算聚类目标函数5f86998bf1bd9_html_96e717be2d8aab48.gif ,作为适应度函数。

  4. 由集合5f86998bf1bd9_html_f813b61e122ab122.gif ,利用贪婪算法和结合先验知识的BD打分构建贝叶斯网络概率模型建立5f86998bf1bd9_html_f813b61e122ab122.gif 的概率分布。

  5. 依据概率分布,即对构建出来的网络5f86998bf1bd9_html_2d663408b416d4d8.gif 进行抽样,生成5f86998bf1bd9_html_386d2d12bf6c9138.gif 个新个体,组成集合5f86998bf1bd9_html_594712e705690256.gif

  6. 将个体适应度概率和个体浓度概率一起(5f86998bf1bd9_html_5c2281c94ec39923.gif )作为评价依据。从5f86998bf1bd9_html_a9aa62fc6fab5ad7.gif5f86998bf1bd9_html_594712e705690256.gif 中选择5f86998bf1bd9_html_e17779f32117bdd0.gif 个优良个体,形成新的种群5f86998bf1bd9_html_f53447bd1baaea5c.gif ,令5f86998bf1bd9_html_67f0f7e4888417af.gif

  7. 判断收敛条件是否满足,若满足,停止计算。否则转至2)。种群5f86998bf1bd9_html_a9aa62fc6fab5ad7.gif 为所求解。

  8. 根据所得的聚类中心和相似度函数值,对测试数据进行测试,以判断所采集的数据属于哪一类,即进行故障模式分类。

由以上运算过程可知,本文对贝叶斯优化算法的改进主要体现在:在算法步骤2)和6)中引入了个体适应度概率和个体浓度概率作为选择优秀个体的评价依据,这种选择依据能够有效地保持种群的多样性,提高算法的性能。同时在构建贝叶斯网络的步骤4)中的BD打分运算时结合先验信息,充分利用数据,提高了构建网络的可靠性。

6 结束语

本文对故障分析中的贝叶斯优化算法进行了综合优化改进。算法既引入了免疫算法中的亲和度和浓度概念提高了选择种群分布的多样性,又具有结合先验信息运算的快速收敛性,最后结合聚类分析方法完成了故障模式分类。本文的方法对磁计量仪器的故障分析有一定的借鉴作用。

参考文献

[1] 宋蕾. 优化贝叶斯的数据融合算法[J].电子技术与软件工程,2019,6

[2] 曾国斌,冉兆春. 基于贝叶斯算法的神经网络优化方法研究[J].数码世界.2017,12

[3] 梁瑞鑫,张长水,郭国营,等. 一种混沌贝叶斯优化算法[J].计算机工程与应用.2004,36

[4] 周东华,叶银忠.现代故障诊断与容错控制[M]. 清华大学出版社: 2008.

[5] 钟小平,李为吉,等. 改进的贝叶斯优化算法及应用[J]. 机械科学与技术,2006,4.

[6] 刘小雄,武燕,等. 一种故障诊断的贝叶斯优化算法研究[J]. 计算机应用研究. 2009,1