简介:随着信息科学技术的不断发展,越来越多的设备可以产生数据,而硬件存储设备却越来越便宜,我们因此步入了数据爆炸式增长的时代。大数据如雨后春笋般地出现在各行各业中,车载导航公司也迎来了大数据。大数据是机遇,同时也是挑战,如何从导航数据中获取价值成了车载导航软件公司的难题。而与此同时,中国车险市场随着我国汽车市场发展不断扩大,竞争也越来越激烈。车险行业的竞争主要是服务于价格的竞争,归根到底是风险评估能力的竞争,而目前的广泛应用的车险定价策略存在难以取分投保人真实风险的不足。本文结合车险领域风险评估的情况以及车载导航大数据的特点,提出通过对车载导航大数据的分析,对用户的统计驾驶情况评估,并将结果应用到车险行业。
简介:结合数字化校园的数据源,给出了在数据仓库环境下构建的数字化校园体系结构图,阐述了数字化校园数据仓库逻辑模型的设计,并把数据挖掘算法应用到数字化校园中,为高校管理者提供了决策支持信息。关键词数据仓库;数据挖掘;数字化校园中图分类号TP274文献标识码A文章编号1007-9599(2010)04-0000-01DigitalCampusApplication&StudyagainstDataWarehouseandDataMiningTechnologyWangYanpin1g,WangXiaoting2,ChangXianfa2(1.HeyuanTechnologyCollege,Heyuan517000,China;2.KaifengUniversity,Kaifeng475004,China)AbstractCombinethedatasourceofthedigitalcampus,giveanarchitecturemapofdigitalcampuswhichisbasedondatawarehouseenvironment,focusonthedigitalcampusdatawarehouselogicalmodeldesign,Andthedataminingalgorithmapplytothedigitalcampus,providethedecisionsupportinformationforuniversityadministratorsKeywordsDatawarehouse;Datamining;Digitalcampus一、引言高校数字化校园数据主要存储在关系型数据库中,这些系统中,大量的数据和数据模型,都是反映历届学生的学习成绩和教师的教学任务以及教学计划。随着高校对决策信息需求的日益广泛、复杂和迫切,这些传统的数据库系统存在的问题也越来越明显。本文利用数据仓库和数据挖掘技术在数字化校园中应用进行了研究。二、数字化校园数据仓库体系结构设计在对数字化校园各个子系统进行深入调研和需求分析的基础上,针对数据仓库的三个基本功能,提出了一个集中式数据仓库(数字化校园数据仓库)、分布式数据库(各个部门数据库)等适合数字化校园的数据仓库体系结构,如图1所示。该系统由五个部分组成(一)数据源来源于操作性数据库,其主要是完成日常业务处理,其数据将成为数据仓库的数据源。(二)多数据源集成将来自于不同数据源(SQL、Oracle等)的数据通过数据转换服务进行导入。(三)中心数据仓库在已有业务系统的基础上,通过数据的抽取、转换、加载,建立数字化校园数据仓库。(四)OLAP分析服务器通过建立OLAP分析服务器,从数据仓库中提取数据,完成数据的统计和分析。(五)决策支持工具是面向用户的数据需求的前端服务,支持各种OLAP和DM操作。三、数字化校园数据仓库逻辑模型设计在学生等级事实维表中存储七个维表,通过这几个维表的主键,将事实表和维表连接在一起,形成星型模式用二维关系表示数据的多维概念建立星型模型后,通过维表的主键,对事实表和每一个维作连接操作,其模型如图2如示。四、数据挖掘算法在数字化校园中应用分析针对学生等级多维数据集,把平均成绩、借书次数、平均消费、学生等级、家庭出身既作为输入列又作为可预测列,分析处理后可得到如图3所示学生等级一层决策树模型。在学生等级表中,所有事例为4925,其中学生等级为C的事例最多,为1726例,可能性为35.04%;学生等级表现为A的有495例,可能性为10.05%;学生等级表现为B的有1478例,可能性为30.01%;学生等级表现为D的有983例,可能性为19.95%;还有学生等级表现为E的极差事例有243例,可能性为4.93%。在这一事例图中,我们可以看到PJCJ是决定XSDJ最重要的因素,在高校教育中,抓学生成绩才是教学的关键所在。五、结束语采用DW+DM框架结构的决策支持系统是一种比较理想和完善的架构,该系统功能齐全、性能稳定,能对数据进行快速和准确的分析,从而帮助高校管理者做出更好的决策,提高高校管理效率,对数字化校园的利用具有一定的实用性和参考价值。参考文献1ZhaoHuiTang,JamieMaclennan.数据挖掘原理与应用M.邝祝芳,焦贤龙,高升.北京清华大学出版社,200725-262木根.数据仓库技术与实现M.北京电子工业出版社,20023王艳萍,常贤发.基于数据仓库的数字化校园的设计J.电脑知识与技术,2009,124薛红,王敏.基于DW+OLAP+DM的超市销售决策支持系统J.计算机工程,2007,33145王成,李民赞.基于数据仓库和数据挖掘技术的温室决策支持系统J.农业工程学报,2008,11作者简介王艳萍(1982-),女,硕士研究生,河源职业技术学院教师,研究方向为计算机应用技术。
简介:当你的SQLServer数据库系统运行缓慢的时候,你或许多多少少知道可以使用SQLServerProfiler(中文叫SQL事件探查器)工具来进行跟踪和分析。是的,Profiler可以用来捕获发送到SQLServer的所有语句以及语句的执行性能相关数据(如语句的read/writes页面数目,CPU的使用量,以及语句的duration等)以供以后分析。但本文并不介绍如何使用Profiler工具,而是将介绍如何使用read80trace(有关该工具见后面介绍)工具结合自定义的存储过程来提纲挈领地分析Profiler捕获的Trace文件,