论文查询检索-中国期刊网

简介：本文作者从实际应用出发，对现存数据挖掘决策树分类方法进行了研究，并应用到系统当中，实现了决策支持模块。关键词数掘挖掘；决策树算法；改进；实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong（ChangchunTechnologyCollege,Changchun130033,China）AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用，数据库中存储的数据量急剧增大，在大量的数据背后隐藏着许多重要的信息，如果能把这些信息从数据库中抽取出来，将会产生重要的作用。因此，数据挖掘涉及的学科领域逐渐扩大，数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务，分类算法可以分为决策树分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里，以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例，对决策树分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中，以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集，由于在真实的SQLServer数据库当中，为了降低存储要求和减少存储时间，并非真正存储每个数据项的属性值，而是用存储数字来对应相应的意义，如在数据库的数据表中，“性别”字段中“1”代表“男”、“2”代表“女”，反应到程序页面时再映射回原来的值，为了说理清晰又限于篇幅，这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策树对训练集的每一个属性，计算其信息增益。以“月龄”属性为例，每个结点中的正反例的个数分别为［2，3］、3，2、4，0，分别计算如下info2，3==0.971；info3，2==0.971；info4，0=0；计算信息熵E(月龄)＝＝0.693；计算该属性的信息增益量，选取信息增益最大的属性为节点，按该属性的值划分数据集合Gain(月龄)=Info(9，5)-E(月龄)=0.940-0.693=0.247；同理，对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数（由于篇幅有限，不作计算）。通过对各属性信息增益的计算结果，选择“月龄”属性作为根节点，然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时，“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2，3)-E(注射反应)=0.971-0.4=0.571；Gain(出生状态)=Info(2，3)-E(出生状态)=0.971-0=0.971；Gain(常住地)=Info(2，3)-E(常住地)=0.972-0.951=0.020；同理考虑“月龄>5”的情况，由于“月龄>5”时，各个节点都是纯节点，所以不再划分。三、产生决策规则遍历决策树，输出叶结点类属性值，用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别＝是)IF(月龄2…5AND注射反应=轻)THEN(类别＝是)IF(月龄2…5AND注射反应=重AND出生状态＝正常产)THEN(类别＝是)IF(月龄2…5AND注射反应=重AND出生状态＝非正常产AND常住地=城市)THEN(类别＝否)IF(月龄2…5AND注射反应=重AND出生状态＝非正常产AND常住地=农村)THEN(类别＝是)……依此类推，共可产生十三条规则。四、决策支持子系统的分析用上述基于决策树的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类，并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策树是否有效。首先，用整个数据集中2/3的数据作为训练集按照基于决策树的分类算法来建立模型，生成一棵决策树。然后，用余下的1/3的数据作为测试集，通过创建的模型进行预测，并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值，则可以认定该模型对于数据分类是有效的，能够在实际中应用；反之，则认定该模型的分类效果不好，需要按以上步骤来重新判断，直到分类准确率达到预定的阈值为止。在本系统中，经过测试预测准确率已达到87%，在可以接受的范围内，所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰（1980-），女，吉林长春人。长春职业技术学院信息技术分院，教师，讲师，硕士，研究方向为计算机应用。
标签：

全文阅读

信息技术作业中存在的问题与改进策略

作者：李雪
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2017-12-22
出处：《办公自动化》 2017年第12期

简介：作业的重要性不言而喻，但一直以来，作业给学生带来的不是学有所进的欣喜，而是苦不堪言的负担。而计算机课程实践性比较强，作业是课堂教学中最重要的一部分。因此，如何设计计算机作业值得我们教师关注和思考。计算机教师应以“提高学生学习兴趣、信心，养成好的学习策略和学习习惯”为出发点，设计真正有效的作业，让学生收获实在，体验学习的快乐。
标签：计算机作业批改

全文阅读

使用ASP．NET2。0改进ASP．NET Starter Kit

作者： Jayesh Patel;Bryan Acker;Robert McGovern
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2005-04-14
出处：《MSDN开发精选》 2005年第4期

简介：简介ASP．NETStarterKit包括5个示例应用程序，告诉Web开发人员如何利用ASP．NET1．x的功能。StarterKit包括一些重要功能的参考实现，如交互式HTML报表、更换皮肤和主题、身份验证和授权、移动Web浏览器支持等等。花费1小时研究StarterKit的源代码，可以省下大量编程与调试的时间。
标签： ASP.NET KIT WEB浏览器 WEB开发应用程序 HTML

全文阅读

“安全”的工作

简介：最近游戏国内最热闹的事，大概是某公司和其六位下属之间的争执，目前双方都已表明要诉诸法律，所以在事态未明的情况下，具体的谁是谁非，本刊暂且不做过多评述。但是这件事情的发生却在为同在游戏圈的你，我、他敲响了警钟，空间我们如何才能“安全”的工作，如何才能“双赢”的分手。《游戏创造》邀请到在游戏圈奋战近十载的资深老鸟，请他谈谈自己对此问题的看法和感受。
标签：游戏安全工作程序员代码

全文阅读

计算机网络的安全防护现状与改进

简介：目前，我国计算机网络正迅速普及和发展，给我们带来生活和学习工作上的便利的同时，也产生了许多安全防护上的问题。本文就对目前计算机网络的安全防护的现状进行了分析，并对此提出了加强安全防护的建议。
标签：计算机网络安全防护改进

全文阅读

改进型A*算法在物流配送网络中的应用

作者：李铭，田丰睿
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2010-05-15
出处：《计算机光盘软件与应用》 2010年第5期
机构：李铭，田丰睿

简介：摘要A*算法是目前路径搜索中应用最广泛的算法，最短路径搜索算法效率是研究人员普遍关注的重点，本文在分析A*算法的基础上，重点介绍了一种改进型A*启发式搜索算法，实验结果表明提出的改进方法极大地减少算法搜索区域，提高了算法的效率，更加适合交通网络的路径导航。
标签：空间顺序关系改进型A*算法启发式搜索优先级队列

全文阅读

提高网站投资效益的重要关键——改进“用户界面”的设计

作者：刘霞
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2003-06-16
出处：《办公自动化》 2003年第6期

简介：企业投资建入口网站,为提高效,就得借助网络行销,增加各项功能服务.常见的手法包括刊登网络广告、举办赠奖活动、寄发eDM或与其它网站实行策略联盟来宣传网站.但还很少有人提出,设计完善、实用的"用户界面"才是提高效益的关键催化剂.
标签：网站投资效益用户界面设计企业网站

全文阅读

彻底隐藏工作表

作者：杨杰晶
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2009-08-18
出处：《软件指南》 2009年第8期

简介：隐藏工作表，大家一般是先切换到相关工作表，然后通过单击菜单“格式→工作表→隐藏”命令来隐藏工作表，这种方法虽然很简单，但只能蒙蒙那些菜鸟，对于稍有一点经验的大虾米来说，
标签：工作表隐藏命令菜单

全文阅读

无线传感网中一种改进的层次数据融合策略

简介：在无线传感器网络中，数据融合是减少能量消耗的有效途径。本文针对多层数据融合方案的局限性提出了一种改进策略。该策略是在已建立的每一层上再划分为两个子层，数据在邻层的相应子层中传输，避免了节点之间能量消耗不均，延长了网络的生存周期。
标签：无线传感器网络层次数据融合数据传输

全文阅读

给Excel工作簿“减肥”

作者：愚人
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2007-02-12
出处：《软件指南》 2007年第2期

简介：单位同事经常在使用Excel时遇到这样的问题，在一个Excel工作簿中，并没有多少数据，但文件却很大，运行速度较慢，有时几乎到了无法忍受的地步。到底是什么原因造成的呢？笔者根据经验，分析一下Excet工作簿体积膨胀的原因，以及常用的解决方法，希望能对大家有所帮助。
标签： EXCEL工作簿减肥运行速度体积膨胀原因文件

全文阅读

电子商务中买家信息安全管理机制的改进与研究

简介：近几年来，电子商务作为一个新型的、虚拟的交易空间正在迅速发展，在交易平台上的信息安全问题也随之而来，尤其是买家个人信息安全问题未能得到很好的解决．本文针对这个问题，初步提出了一个新的买家信息管理机制，较好地保护了买家的个人隐私．
标签：电子商务信息安全个人信息

全文阅读

WF，构建微软工作流

作者：小气的神
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2006-11-21
出处：《程序员》 2006年第11期

简介：CSDN的欧阳在9月的某日来电．说他正在策划一个WinFX／．NETFramework3.0系列的专题，11月的程序员杂志会推出这个专题。我几乎毫不犹豫告诉欧阳自己对WF（windowsWorkflowFoundation）这部分的兴趣，最后他诚挚地邀请我写这个专题中有关WF这篇文章。
标签：工作流 WORKFLOW 微软 .NET CSDN 专题