简介:针对传统聚类算法无法有效处理高维混合属性数据集的问题,对原有的数据归一化方法进行改进。在kmeans和DBSCAN聚类算法的基础之上,结合增量聚类的思想和数据之间相异度的计算方法,提出了一种基于密度的增量k-means聚类算法。该算法能有效处理具有高维混合属性的数据集,在准确度和效率方面都得到提高。
简介:摘要文章针对遥感图像的模糊聚类算法进行了研究。数字图像分类技术是数字图像处理技术中非常重要的一个内容。遥感图像固有的模糊性,对于遥感数字图像来说,尤其是中、低分辨率遥感图像,由于混合像元的影响使得分类结果并不是最优的,也就是说,传统的分类方法往往不能取得理想的分类效果。而应用软分类算法原理,采用模糊聚类方法进行遥感图像的非监督分类是解决这种分类模糊性的主要方法之一。文章研究模糊聚类中的模糊C均值聚类算法,并通过计算机程序来实现算法,从而达到对遥感图像非监督分类的目的。此算法与人工判读分类相比,提高遥感图像非监督分类的速度和效率,节省了人力和物力。
简介:针对Hadoop存在的不足,提出了利用分布式数据库来模拟共享存储空间的解决方案。并对DBIK-means聚类算法做了并行化设计和实验分析,验证了DBIK-means聚类算法在处理大数据时,能够获得较好的加速比。
简介:摘要在绝大多数情况下,电力变压器油色谱的在线监测数据是正常的,近似故障或者故障类数据是非常少的,数据样本的不平衡就为电力变压器故障诊断增加了难度。基于尽可能早的发现电力变压器内部的发展程度及其潜伏性故障的目的,通过利用ISODATA算法对其油中气成分数据进行聚类分析。实践表明,该算法的具有较强的实用价值。
简介:摘要本文将自组织映射(SOM)神经网络用于研究电力专变用户的用电行为习惯聚类。首先,对用户的负荷数据进行归一化,并提取四个有效性指标作为SOM神经网络的输入。然后采用Davies-Bouldin指数和k均值将94条用户负荷曲线分成5类,并描述每类型曲线。最后识别新用户,结果证明该聚类方法行的通。