摘要
为提高基于随机森林算法重复拨打投诉预警模型的效果,文章从数据、指标、参数3个方面对模型进行优化。在数据处理方面,利用SMOTE算法平衡投诉与非投诉比例,一方面防止了模型出现过拟合;另一方面消除了非平衡数据对模型效果的影响。在特征选择方面,使用基尼系数进行特征选择,从而减少数据的噪声,提高模型预测的准确度。在参数调整方面,使用R语言软件对模型决策树数量参数和最大特征参数进行调整,模型最终的OOB误差率为5.03%,准确率和召回率均超过70%。目前投诉预警模型已经进行试点应用,实现了投诉业务的提前识别,通过采用相应服务策略,减少了服务升级事件,降低了客户投诉率,有效提升了客户感知。
出版日期
2018年08月18日(中国期刊网平台首次上网日期,不代表论文的发表时间)