简介:摘要土地是人类赖以生存的要素资料,各类生产活动和日常生活都要在土地上进行,因此现实中涉及土地的纠纷众多,而随着移动互联网以及微博、微信等各种移动媒体和自媒体的兴起,网络上关于土地的舆情信息也纷繁杂乱,针对土地的纠纷、投诉以及信访内容更是国土管理部门关注的重点。本文提出一种基于分布式网络爬虫的国土舆情自动分词方法,利用网络爬虫技术自动获取跟国土相关的网络舆情,然后对舆情信息进行分词,为后续的国土舆情自动分类提供基础,提高国土管理部门信息的获取和处理效率。实验表明,该方法的分词效率高,分词精度高达94.7%。