简介:旅游目的地是各种旅游产品的载体,研究旅游者对目的地感知形象的偏好是挖掘旅游产品特征及偏好的有效方法。本文首先通过web主题爬虫技术,获取旅游者对于目的地的评论——网络游记文本数据。在文本挖掘方法上,将LDA主题模型引入到旅游者形象感知偏好的挖掘中,通过模拟旅游者真实文本的写作过程,克服了通过简单词频、关键词提取挖掘的缺点。最后,本文选取海南省作为实验对象,从马蜂窝抓取739篇赴琼旅游者的游记,经数据清洗,最终得到697篇有效游记,共计60余万字,并利用本文所提出的方法对其进行了旅游者形象感知偏好挖掘。