简介:数据流的概念会随着时间的变化而变化,例如天气预报和网络监控。这种随时改变概念的现象叫做概念漂移。如果不处理好概念漂移不仅降低聚类的质量,并且还会导致错误的聚类结果。现有的概念漂移算法大多都依据分类算法,根据分类算法中的错误率来判断概念漂移。然而,在随时变化的数据流中很难发现类标签。在聚类检测概念漂移中,很多聚类算法都是再概念漂移检测之前,所以当发生概念漂移的时候还要重新聚类。我们提出了一种基于密度网格的数据流聚类和概念漂移检测算法,这个框架采用了一种策略动态地改变滑动窗口。由于用到了密度网格技术,它提升了DCDA检测算法的效率,并且利用可变滑动窗口替换了固定滑动窗口以适应数据流的变化。实验结果证明我们的框架在准确率和时间效率上好于DCDA。