简介:摘要:当今互联网中的数据样本的数量、种类、规模和复杂性的呈现爆炸式增长,同时每个端口以及服务器上需要进行检测的的网络流量的规模也大大提高。虽然目前的网络流量跨多个维度并具有很多属性,但可以提取用作异常流量检测的属性不多,因此,需要把数据集中蕴含的信息价值较大的属性筛选出来进行异常流量检测。基于以上特点,本文提出了改进的 K-Means算法,对原始 K-Means算法初始质心的选择方法进行优化,使得算法可以进行更方便迅速的初始簇的选择,来大大降低迭代时间。由于一般离群点检测模型的准确率较低,本文还使用了关联规则挖掘算法,来从无异常数据的网络流量样本中筛选出纯净网络流量的特征属性,再根据这些特征对网络流量进行离群点检测。