学科分类
/ 25
500 个结果
  • 简介:数据挖掘从大量的数据中提取隐含在其中的有用信息和知识,采用关联规则挖掘方法,对多媒体图像进行关联规则挖掘,得出多媒体图像的关联规则

  • 标签: 多媒体图像 数据挖掘 关联规则 应用
  • 简介:摘要关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法。本文在对Apriori算法分析的基础上,针对该算法存在的缺陷,即会产生大量冗余的候选集并频繁扫描数据库,提出了改进的Apriori算法,并给予验证。实践证明,改进后的算法效率优于传统的算法。

  • 标签: 数据挖掘 频繁项集 Apriori算法 关联规则
  • 简介:随着信息化的发展,人类进入数据爆炸时代,从海量数据中查找到相关联的知识,并对其进行处理,从而满足用户需求已成为一种趋势。文章研究了基于数据挖掘关联规则,以此来寻找数据之间的潜在关系。通过分析海量数据中的有价值数据,将其转换为可供处理的数据格式;通过改进经典的Apriori算法来实现需求数据的预测和决策,应用结果也表明该算法能够获得较好的研究效果。

  • 标签: 海量 关联规则 数据挖掘
  • 简介:对Apriori算法进行优化,提出了一种Z_Apriori算法。该算法在首次产生频繁项集时。扫描数据库并通过二进制编码串记录每个项目在事务里是否出现过,在每次进行计算迭代过程中无需再对数据库进行扫描.避免了对数据库的重复扫描,在系统性能和效率上较经典的Apriori算法有一定的改善。

  • 标签: 关联规则 个性化推荐服务 频繁项集
  • 简介:设计了一种基于遗传算法的关联规则算法,该算法将遗传算法和关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法.

  • 标签: 数据挖掘 关联规则 遗传算法
  • 简介:摘要当今信息化发展速度惊人,大数据、云计算、人工智能技术应用于各行各业,给社会的发展带来了很多便利,也为我国经济的快速发展注入了新的血液。因此,根据实际情况研发出科学而有效的数据挖掘算法,对于整个信息行业来说都有不可估量的意义,在进行大规模数据信息处理的时候,在关联规则下的数据挖掘算法就体现出了它本身重要的优势。因此,本文将对关联规则下的数据挖掘算法进行详细的分析,以供参考。

  • 标签: 数据挖掘算法 关联规则 分析
  • 简介:摘要:飞机维修记录是技术人员评估飞机技术状态和分析故障规则的重要数据源。维修记录实际上主要是用自然语言描述的,不能作为一般的数学分析方法。在某些单位,技术人员无法通过对数据,故障率,事故率等进行简单的统计分析来获得有用的结果。在这种情况下,本研究分析了两种关联规则分析算法的c#语言编程,比较了两种算法的性能,以挖掘故障的关联规则,并确定飞行故障和其他因素之间的关系。

  • 标签: 维修保障 数据挖掘 关联规则
  • 简介:pattern用来存储频繁i—项目集某一项目,该频繁项目集是一最大频繁项目集,Answer=answer∪pvh→pattern/*pvh所在频繁k项目集加入到最大频繁项目集*/

  • 标签: 关联规则 挖掘方法 改进关联
  • 简介:本文在对数据挖掘相关技术、关联规则挖掘算法进行深入研究的基础上,归纳总结了基于粗糙集理论的关联规则挖掘模型和属性约简算法,并将其应用于高校教师的成长中。

  • 标签: 粗糙集 关联规则 教师成长 属性约简
  • 简介:在简要介绍数据挖掘关联规则以及词语关联度计算现状的基础上,对FP-growth算法进行了描述,并将其应用到词语关联度中,提出利用一种构建词汇社区结构的方法,实现对词语关联度的计算。通过实验分析,提出的计算词语关联度的算法取得了更好的准确率,具有一定的可行性和实用性。

  • 标签: 数据挖掘 关联规则 词语关联度
  • 简介:传统的关联规则Apriori算法在产生频繁项集的过程中,需要多次扫描事务数据库以及多次扫描频繁项集,从而造成算法性能下降.为了减少扫描事务数据库以及频繁项集的次数,在生成的候选k项集中,除了存储项集item-set以及支持度计数count之外,加入事务标识符列表Tidlist属性,在生成频繁k项集时,可以直接通过Tid-list的交集得出事务标识符列表以及项集的计数,不需要去扫描事务数据库,从而可以有效地提高算法的性能.文中提出了一种改进的关联规则挖掘模型以及关联规则挖掘算法I-Apriori算法.实验证明,I-Apriori算法相比Apriori算法的执行时间有明显改进.

  • 标签: 关联规则 频繁项集 候选集 事务数据库 计数
  • 简介:关联规则是一种重要的数据挖掘技术。现结合水文长期预报的特殊性,将关联规则挖掘分析方法应用于径流长期预报中。根据预报目标初选出预报因子,构成长期预报事务数据集。然后将其进行离散化处理,对离散化后的数据集进行关联规则分析,挖掘出满足事先设定的最小支持度和最小置信度的强关联规则,解释规则并建立模型。以嫩江江桥站汛期径流长期预报为例,挖掘出满足要求的强关联规则,这些强关联规则中蕴含着北太平洋海温变化和江桥汛期径流的关系,说明了关联规则挖掘分析方法在径流长期预报中的可行性。

  • 标签: 海温 关联规则 数据挖掘 长期预报
  • 简介:4由超市事务数据库发现关联规则的总体设计在现有的不少关联规则发现算法中,如何采用基于关联规则的数据挖掘技术发现超市事务数据库中的关联规则是本文所研究和探讨的重点,有必要采用快速算法从超市事务数据库中挖掘关联规则

  • 标签: 事务数据库 关联规则 挖掘关联
  • 简介:关联规则挖掘中,通常使用支持度和置信度来衡量一条规则是否为强关联规则,但从理论和实践中分析,发现传统方法挖掘生成的规则中存在大量冗余,甚至错误。本文通过引入统计学中的相关系数ρ作为新的阈值---兴趣度,对事务数据的关联属性进行度量,实验结果表明,改进后的算法在相同条件下可以得到质量更好、意义更明确的关联规则

  • 标签: 兴趣度 正负关联规则 挖掘算法 数据挖掘
  • 简介:目前在空间关联规则挖掘研究中,对数据的处理和算法的改进主要针对布尔关联规则挖掘,存在对空间关联规则的量化表示不够重视等问题.在FP-growth算法的基础上增加规则的事务信息,并使用模拟退火算法,对得到的规则进行进一步挖掘,得到量化空间关联规则.

  • 标签: 空间关联规则 量化关联规则 FP-GROWTH 模拟退火
  • 简介:随着“互联网+”技术的不断发展,人们在大数据时代所产生的数据量也呈现出急速发展的趋势,面对如此复杂的、海量的数据,如何进行有用信息和数据的提取成为重要的问题,数据挖掘便成为关键,而关联规则则是数据挖掘中的重要组成部分,主要用于对数据集中项等之间联系的发现,对于从大数据中通过关联规则来进行挖掘已是最成熟且最活跃的研究方向之一。

  • 标签: 数据挖掘 关联规则 算法研究
  • 简介:摘要:随着电网系统覆盖范围的扩展,监控设备前端呈现的告警数量也呈骤增状态,其中包括各网管系统中的大量重复或者无用告警,直接妨碍调度、运维人员对故障高效、准确的处理。关联分析技术可有效地过滤重复和无用告警,但规则系统缺乏记忆性,告警关联分析系统中的规则提取主要依赖于专家经验,为避免问题的重复查找及确保特殊情况的及时处理,设计一种基于分簇的分布式关联规则挖掘的告警相关性分析方法,通过缩小告警数据库中告警量及其告警频繁项集,提高规则系统的性能和健壮性,提升告警关联分析的效率。

  • 标签: 告警关联分析 分簇 告警频繁项集 分布式关联分析
  • 简介:在一个大型购物网站的数据库中,各个数据的属性之间存在着各种各样的关联,这些关联就隐含在数据库所包含的数据中,我们挖掘的目的就是找出这些隐藏的关联。模糊关联规则挖掘是数据挖掘技术的一个重要研究方向,也在众多应用领域中取得了理想的效果。向用户进行个性化的产品推荐是网站常用的吸引用户关注度的方法。研究模糊关联规则在推荐系统中的应用。

  • 标签: 数据挖掘 模糊关联规则 个性化推荐
  • 简介:数据挖掘是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。随着税务管理部门信息化建设的进行,各级税收数据库的规模迅速增长,在税务稽查系统中,存在大量涉税违法行为的数据,这些数据占据了一定数量的软硬件资源,但并没有得到很好的利用,成为闲置的资源。如何从这些历史的、闲置数据中发现有价值的信息已成为目前税务信息化研究的对象。将数据挖掘技术应用到税务稽查系统中,能为税务稽查人员提供决策支持,具有一定的

  • 标签: 数据挖掘 数据仓库 事务集 部门信息化 频繁项集 现有价值