简介:所谓奇异点,粗略的说,就是游离在众多的点群之外,明显的偏离了回归直线的一个点或者是几个点。在经济计量学的学习中,我们会经常遇到奇异点的问题。这个时候在采用最小二乘估计法拟合直线时,要特别注意处理奇异点的方法。因为,对于最小二乘法而言,每一个离差的损失是该离差的平方,要使总离差平方和最小,必然会给奇点以相对较高的权重,过多地强调了拟合直线和这些奇异点的关系,在图形上表现为拟和的直线明显地偏向了奇异点。据此做出的决策,可能会和实际情况有相当大的差距,正是由于这样的原因,所以我们面对奇异点的时,如何正确地应对就显得至关重要。在实际工作中,情况层出不穷,变化繁杂,笔者以为,要想正确地处理奇异点,首先要分析其产生的原因,然后再根据具体情况深入地进行分析,灵活应对。
简介:缺失数据在公共突发事件的应急统计数据分析中是一个非常普遍的问题,针对公共突发事件应急统计数据的纵向数据集,提出用一种得分匹配法来进行缺失值的借补处理,并将其与另外三种缺失值处理方法进行比较,即构造各种不同缺失率的随机缺失数据集,分别运用得分匹配法、LVCF借补法、无条件均值抽取法和多重借补法四种不同的缺失值处理方法对每一种缺失率的数据集缺失值进行处理。统计分析结果表明,少数缺失值发生时,LVCF法简单而有效;随着缺失率的增加,均值抽取法和多重借补法处理效果更稳定;得分匹配法借补缺失值考虑了变量之间的相关性,最大程度地利用了数据集包含的信息,同时考虑了含缺失值变量的实际变异程度,因此取得了最好的借补效果。