学科分类
/ 25
500 个结果
  • 简介:针对供配电系统中经常出现串联型故障电弧引发火灾等事故的问题,研制了串联型故障电弧实验装置,并针对典型负载开展了大量实验。首先,利用傅里叶变换提取了发生故障电弧前后电流的前20次谐波含量,并将其作为样本;其次,采用主成分分析对样本数据进行降维,提取出电流谐波变化的主要成分;最后,运用K均值判断出原始信号是否故障。结果表明,以电流谐波为特征,通过主成分分析和K均值可以有效地识别串联型故障电弧。

  • 标签: 串联型故障电弧 谐波含量 主成分分析 K均值聚类
  • 简介:针对传统算法无法有效处理高维混合属性数据集的问题,对原有的数据归一化方法进行改进。在kmeans和DBSCAN算法的基础之上,结合增量的思想和数据之间相异度的计算方法,提出了一种基于密度的增量k-means算法。该算法能有效处理具有高维混合属性的数据集,在准确度和效率方面都得到提高。

  • 标签: 基于密度 DBIK-means聚类算法 数据相异度
  • 简介:针对K-means算法在数据过程中初始值选取的随机性问题,基于非均匀采样原则对该算法进行改进。同时,针对算法并行化的需求,基于Spark平台对改进算法进行了并行化实现。单机串行处理和集群并行化实验证明了该改进算法在处理海量数据集时具有更高的准确性和稳定性,且在Spark平台上的并行化实现具有良好的加速比和可扩展性,从而表明该算法能在实际的海量数据处理中高效运行。

  • 标签: K-MEANS 聚类 SPARK 并行化
  • 简介:聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的算法.本文提出了一种基于kNN的算法k-NearestNeighborCluster(kNNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚簇数,它可以大致的找到的簇数.

  • 标签: KNN算法 K-MEANS算法 聚类分析 微博文本聚类
  • 简介:摘要文章针对遥感图像的模糊算法进行了研究。数字图像分类技术是数字图像处理技术中非常重要的一个内容。遥感图像固有的模糊性,对于遥感数字图像来说,尤其是中、低分辨率遥感图像,由于混合像元的影响使得分类结果并不是最优的,也就是说,传统的分类方法往往不能取得理想的分类效果。而应用软分类算法原理,采用模糊方法进行遥感图像的非监督分类是解决这种分类模糊性的主要方法之一。文章研究模糊中的模糊C均值算法,并通过计算机程序来实现算法,从而达到对遥感图像非监督分类的目的。此算法与人工判读分类相比,提高遥感图像非监督分类的速度和效率,节省了人力和物力。

  • 标签: 遥感图像分类 模糊聚类 模糊C-均值算法
  • 简介:针对Hadoop存在的不足,提出了利用分布式数据库来模拟共享存储空间的解决方案。并对DBIK-means算法做了并行化设计和实验分析,验证了DBIK-means算法在处理大数据时,能够获得较好的加速比。

  • 标签: HADOOP DBIK-means聚类算法 并行化
  • 简介:针对高职生职业能力测评,提出由5个方面23个细项组成的测评体系,采用了模糊算法实现对高职学生职业能力进行客观分类,给企业招聘毕业生和学院教学质量分析提供重要的参考。

  • 标签: 模糊聚类分析 职业能力测评 高职学生
  • 简介:目前很多已知的算法对于异常点的处理存在不合理的问题,将模糊集和粗糙集的相关理论加人到支持向量算法中,可增加异常点处理的合理性,并得到一种新的改进算法,将其称为模糊一粗糙支持向量算法.当支持向量集作为一个特殊的,通过元素间的亲密程度,模糊边界的隶属度可以被计算出来.而下近似集包含的样本点建立在算法训练阶段获得的超球体内.在检测异常值和计算任意轮廓的方面,该算法具有较大的优势和潜力.

  • 标签: 粗糙集 模糊集 支持向量集 超球体 数据挖掘
  • 简介:摘要根据环保部门对火电厂污染物排放监测考核标准,结合Ovation系统、I/A’S系统的特点,设计了不同DCS系统整点小时均值算法,供运行人员参考。

  • 标签: 氮氧化物NOX 整点小时均值 DCS算法
  • 简介:针对目前快速增长的智能数字电视的点播直播节目,观众对感兴趣的节目选择困难的现状,本文提出一种面向智能数字电视的点播直播节目数字电视推荐系统,它基于改进的和协同过滤组合推荐算法。系统统一了点播直播节目的节目标签,以便于用户点播直播历史数据统一打分,然后形成用户-评分矩阵表,再针对高维矩阵表进行基于PCA和K-means的分裂层次算法形成相似用户簇群。接着对用户所在的簇群进行基于协同过滤算法计算,得出用户对未观看节目的预测评分,给用户推送最佳节目。

  • 标签: 数字电视 层次分裂聚类 PCA K-MEANS 协同过滤
  • 简介:目的挖掘吕仁和教授治疗慢性肾衰竭临床处方用药规律,阐述吕教授治疗慢性肾衰竭的学术思路及用药经验。方法收集吕教授治疗慢性肾衰竭的门诊处方140首,应用中医辅助传承系统进行药物频次分析,并基于关联规则分析、改进的互信息法的药物间关联度分析得到核心药物组合及网络化视图,基于无监督熵层次算法获得新处方。结果通过处方分析得到了核心药物35种、高频药物组合24组、药物关联规则82种,核心关联药对31组及新处方15首。结论吕教授对慢性肾衰竭的治疗遵循标本兼治的治疗原则,在健脾和胃、益气养血、补肾固本的基础上,重视降浊解毒、活血利水药物组合的运用。

  • 标签: 慢性肾衰竭 用药规律 名老中医
  • 简介:摘要随着客户对供电服务的要求不断提升,供电企业有必要进行客户分群,实施差异化服务。基于数据挖掘的聚类分析,从客户行为特征、价值特征、需求特征三个维度,利用K-means算法构建了价值贡献度的客户分群模型,能够较好地满足供电企业客户分群的需求。通过甄别出不同价值贡献度的客户群体,合理分配资源,制定合适的经营策略,提升企业的竞争力和经济效益。

  • 标签: 客户分群 数据挖掘 聚类分析 K-means算法 价值贡献度
  • 简介:为了在保证计算精度的前提下使模型简化并便于计算,要尽量少地用对模型影响较大、相互独立的特征变量进行建模。在进行特征变量选择时,既要考虑选择对主因素有重要影响的变量,也要排除各影响变量间的多重相关性的干扰。首先建立各特征变量同费用的灰色关联度,根据关联度的大小对众多特征变量进行排序,排除关联度相对极小并同其他因素关联度差异明显的特征变量,减少次要影响因素对估算结果造成的干扰;其次,应用基于特征权值的模糊动态方法,并突出近期数据的重要性,对影响因素进行聚类分析,排除影响因素间多重相关性的干扰。论文通过实例分析进行了验证。

  • 标签: 灰色关联分析 模糊聚类 变量选择 特征加权
  • 简介:针对福建红茶(正山小种)图像中存在优劣茶叶颗粒的颜色差异,结合数字图像处理技术及应用机器学习,为达到更快更精确的自动识别图像中劣质茶叶的目的,提出一种基于K-Means和SVM耦合算法(KM-SVM)的茶叶图像识别方法.其算法首先进行K-Means算法自动选取训练样本,然后分别提取样本中的颜色特征和纹理特征作为SVM模型训练样本的特征向量进行训练,最后用训练好的分类器对图像进行识别.实验结果表明,该耦合算法具有较高的可行性和有效性.

  • 标签: 颜色特征 K-MEANS聚类 SVM 图像识别
  • 简介:摘要在绝大多数情况下,电力变压器油色谱的在线监测数据是正常的,近似故障或者故障数据是非常少的,数据样本的不平衡就为电力变压器故障诊断增加了难度。基于尽可能早的发现电力变压器内部的发展程度及其潜伏性故障的目的,通过利用ISODATA算法对其油中气成分数据进行聚类分析。实践表明,该算法的具有较强的实用价值。

  • 标签:
  • 简介:本文利用计量文本特征聚类分析的方法对《红楼梦》各章回进行著作权分析。聚类分析结果表明,后40回和第六十七回,与除第六十七回的前80回有明显不同,可判定后40回和第六十七回不是前80回作者原作;和第六十七回同样在一些脂本中缺失的第六十四回却和前80回有很高的相似性,可判定第六十四回为前80回的作者原作,而第六十七回可能是后40回作者补作。进一步分析表明,第一百〇五回与后40回的其他各回有明显不同,可判定为不同作者所作。

  • 标签: 红楼梦 著作权 文体特征 聚类分析
  • 简介:摘要电力系统线损分析一直以来都是研究的热点和难点。由于线损数据具有高维特性,传统数据挖掘方法很难直接应用于线损分析中。使用蚁群聚算法将线损数据划分为多个子空间,再对特征样本进行,并对每一组的线损特征规则进行了分析。

  • 标签: 线损分析 聚类 蚁群算法
  • 简介:摘要本文将自组织映射(SOM)神经网络用于研究电力专变用户的用电行为习惯。首先,对用户的负荷数据进行归一化,并提取四个有效性指标作为SOM神经网络的输入。然后采用Davies-Bouldin指数和k均值将94条用户负荷曲线分成5,并描述每类型曲线。最后识别新用户,结果证明该方法行的通。

  • 标签: 电力负荷 用电习惯 SOM聚类分析Davies指数 k均值
  • 简介:以灰色模型为理论基础,通过对下属分公司从收入,对市场的控制能力,为客户带来的服务质量以及企业执行力四个方面进行打分。根据评分结果确定评价对象的综合管理能力和水平,最后通过实例验证灰色模型在移动通信企业管理中的科学有效性。

  • 标签: 灰色聚类模型 移动通信企业 管理