简介:以厦门市公交IC卡数据为依托,提出一种基于问卷调查数据的机器学习分类方法-决策树模型,用于分类辨识公交刷卡数据中的通勤人群.研究中利用公交刷卡数据与调查问卷中同时包含的公交出行信息作为非类别属性变量,以公交通勤人群/非公交通勤人群作为分类变量,分别构建决策树模型中的树节点与叶节点.之后,利用随机抽取的2/3调查样本数据构成决策树算法的训练集,余下数据作为决策树算法的测试集,对模型进行构建、训练与测试,结果显示模型预测效果良好,其覆盖率约为98.1%,命中率也达到81%,最终将该模型用于公交刷卡数据中通勤人群的分类辨识.