简介:k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档聚类算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚类的正确性达99%以上.
简介:摘要本文通过对大量工程变更数据进行归纳,采用K均值聚类分析方法对工程变更数据进行分类,并进行参数测定,通过计算不同导致工程变更发生原因指标到各聚类中心的距离,来拟合预测未来类似情况下新建输变电工程中同一原因导致的工程变更对造价的影响程度,预测分析结果为今后类似建设工程的造价控制提供了参考依据。
简介:摘要本文浅谈了数字图像处理的发展概况、研究背景并对彩色图像K-means算法进行分析.主要详细谈论了是对K-means算法的一些认识,并且介绍K-means聚类的算法思想、工作原理、聚类算法流程、以及对算法结果进行分析,得出其特点及实际使用情况。
简介:摘要:经验模态分解(EMD)算法是由 NE. Huang 等人提出的一种将信号分解成特征模态的方法,它不以任何已经定义好的函数作为基底,而是将所分析的信号x(t)分解为一组本征模函数(Ci)和一个残余项(rn),涵盖了原始振动信号在各种时间尺度上的局部细节特征 。可以用于分析非线性、非平稳的信号序列,具有良好的时频特性。在基于经验模态分解(EMD)的基础上,利用k均值算法实现故障类型和故障程度的正确分类。
简介:摘要:随着快速发展,与体育相关的不同信息现在可以通过可穿戴和传感技术记录为有用的大数据形式。大数据技术已成为当前篮球训练中亟待解决的挑战,提高了棒球分析的效果。在本研究中,我们提出了基于内存计算的Spark框架进行大数据处理。首先,我们使用了一种新的群体智能优化布谷鸟搜索算法,因为该算法参数少,全局搜索能力强,支持快速收敛。其次,我们应用传统的K-clustering算法,在Spark分布式环境中使用聚类手段提高最终输出。最后,我们考察了可能导致高压比赛环境的方面来研究职业运动员的防守表现。招聘人员和培训师都可以使用我们的技术来更好地了解基本球员的素质,并最终评估和提高团队的表现。实验结果表明,所建议的方法在聚类性能和实用性方面优于以前的方法。它在移动时对射击训练效果的影响最大,在训练效果上产生了互补的结果。
简介:针对传统聚类算法无法有效处理高维混合属性数据集的问题,对原有的数据归一化方法进行改进。在kmeans和DBSCAN聚类算法的基础之上,结合增量聚类的思想和数据之间相异度的计算方法,提出了一种基于密度的增量k-means聚类算法。该算法能有效处理具有高维混合属性的数据集,在准确度和效率方面都得到提高。
简介:提出了一种基于改进蚁群算法的动态K-均值聚类算法思想,该算法首先利用蚁群算法的较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,再进行K-均值聚类弥补蚁群算法的不足。两者有机结合起来可以寻求到具有全局分布特性的最优聚类,实现了基于改进的蚁群聚类算法分析。