数据挖掘技术在软件工程应用的主要方法

(整期优先)网络出版时间:2021-12-29
/ 2

数据挖掘技术在软件工程应用的主要方法

张镕萍 余荧 别格

武汉东湖学院 湖北省武汉市 430000

摘要:随着科学技术的快速发展,软件工程的研发不断完善和更新,未来满足人们不同使用需求,软件工程的程序在实际开发过程中出现了很多问题,例如工程代码编写失误、静态及动态规则的问题,这些问题已经严重的影响着当前数据信息时代的快速发展。为了解决这个问题,研发人员对于当前数据管理处理方式的方法也发生了巨大转变,这个转变意味着数据挖掘未来的方向已经开始发生变化。随着互联网信息时代的来临,数据挖掘技术面临着复杂的大数据信息,研发人员采用了云处理方法解决了复杂的数据信息问题,提升了数据挖掘速度。这种方法意味着数据挖掘技术面临着更多的不可预知的变化,因此研发人员需要不断学习,完善数据挖掘技术,从而最大化的提升数据挖掘效率。

关键词:数据挖掘;软件工程;方法;

1数据挖掘技术概述

1.1数据挖掘技术的定义

数据挖掘技术是当前数据库领域内使用的最多的一种应用研究技术。数据挖掘技术经过多年发展以后,成为了目前数据挖掘技术领域内的重要组成部分。当前数据挖掘技术得到了国内外专家的认同和使用,因此为了更高效的使用数据挖掘技术提取数据信息,本文对数据挖掘技术的内容进行了研究,可以从以下几个方面进行说明:

(1)数据挖掘的数据信息一定要真实、有效,且挖掘的数据信息比较新颖。

(2)数据挖掘技术主要应用于未知的数据信息。

(3)数据挖掘技术对知识含量没有特别的要求。

由此可知,数据挖掘技术具备了很好额科学性能,能够对数据化信息进行数据提取,在未来的数据挖掘道路上有很好的发展空间。

1.2数据挖掘技术一般流程

通常情况下,未来更好的实现数据信息提取,数据挖掘技术主要分成立三个部分:

第一、数据挖掘技术可以对原始的数据信息进行提取,可以按照原始数据的需求将特定的数据信息进行分析,然后根据获得的数据信息进行转换,以满足特定的数据信息需求。

第二、对于数据挖掘技术来说,首先需要对需要挖掘的数据信息进行分类,然后确定需要挖掘的数据算法,最后通过特定的数据算法计算。

第三、对于用户特定的兴趣度可以通过数据挖掘来实现,因为数据识别可以表示真实的数据度量特定值。

1.3数据挖掘技术当前应用领域

为了满足当前用户的使用需求,我们可以通过数据挖掘技术对电信、银行等等商业领域内的数据信息进行分析,对客户群体进行划分,例如客户关系管理、数据库营销等内容。在当前金融领域内,面临着大量的信息数据,如果在数据管理过程中出现了问题,就会导致金融机构受到经济损失,例如出现了假信用卡欺诈行为。因此为了避免这个现象的发生,企业需要通过数据挖掘技术降低企业的经济损失。目前数据挖掘技术主要应用于医学行业、军事领域、股票交易场所等等。

2数据挖掘技术在软件中的应用内容

上世纪末期,数据挖掘理论被提了出来,经过多年的发展和研究,数据挖掘技术已经从理论技术演变成为了实际应用技术。随着科学技术的快速发展,数据挖掘技术和软件工程技术已经互相渗透,通过新的研发方式不断更新。数据挖掘技术理论初期发展过程中和软件工程一样,受到了来自各方势力的争议。最后通过不断讨论和制定措施,软件工程最终脱颖而出,通过科学的构建方式,制定出了可用性较高的、软件质量较好的、研发项目成本较低的产品。

在当前软件工程领域内,数据挖掘技术是应用于作为广泛的一种技术,因此研发人员在研发系统的过程中,需要随时更新数据信息,满足用户的使用需求。因此在当前软件工程系统版本信息控制的过程中,研发人员应该重点研发软件开发信息变更这一块内容,通过深入分析研究,对不同程序模块的数据关系进行研究,从而更有效的分析和预测软件的问题。目前数据挖掘技术已经深入人心,使用数据挖掘技术可以一定程度上降低软件的运营成本,可以减少软件研发漏洞,有利于软件的后期维护,因此具有重要意义。

3数据挖掘技术在软件工程应用的主要方法

本文对软件工程的数据挖掘技术中应用的最多的几种方法进行研究和说明,可以从以下几点了解:

3.1分类

目前数据挖掘技术主要指可以预先分类的执行的某个动作,还指事先构建的特定分拆模型。因此在软件工程数据挖掘技术应用中,可以通过神经网络分类法、贝叶斯分类法、判断树等等方法来判断。其中判断树方法可以判断自上而下的判断树的构造特点,因为判断树中,不同的子节点分别代表着特定的软件类别标号。对于K-最邻近分类法来说,它主要应用于特定的样品特征空间样本,因此我们可以通过特定的空间样本计算出庞大的样本容量。

3.2聚类

聚类通常指在同一个对象内,对产生的具有较大差异性的对象进行研究的数据进行分类的方法,这种方法可以归属于无指导的、不可预知的方法。因此聚类分析方法通常运用于数据分布较为独立的算法,这种可以更有效的分析数据的有效性,例如一组诸如X或者(X,d)的有序数据中,d通常表示不同样本之间的相似度。

3.3关联

在软件工程数据挖掘技术运用过程中,对于规模较大的数据来说,可以通过数据挖掘技术将A与B之间的数据事务集D的概率计算出来,从而得出最小置信度和最小支持度。其中对于特定的事务集D来说,数据挖掘技术可以计算出软件终端的最小支持度。

3.4软件工程数据检索

数据挖掘技术作为软件工程中应用范围最广的方法,可以对录入的信息、数据信息进行挖掘,其中录入的信息主要指软件工程中对信息对象的检索。而数据信息主要指软件工程中用户获取信息的关键词的检索。因此使用数据挖掘技术可以检索出用户的个人数据信息,可以查阅用户获取的信息记录,并对获取的信息进行分析。

参考文献:

[1]梁吉业,钱宇华,李德玉,胡清华.大数据挖掘的粒计算理论与方法[J].中国科学:信息科学,2015,(11):1355-1369.

[2]李涛,曾春秋,周武柏,周绮凤,郑理.大数据时代的数据挖掘——从应用的角度看大数据挖掘[J].大数据,2015,(04):57-80.

[3]邓仲华,刘伟伟,陆颖隽.基于云计算的大数据挖掘内涵及解决方案研究[J].情报理论与实践,2015,(07):103-108.