一种基于情感分析和CB算法的留守儿童看护系统设计与研究

/ 2

一种基于情感分析和CB算法的留守儿童看护系统设计与研究

李响*1,,毕玉鑫2,李洋3,孙永康4,孙德龙5,张世奇6

(天津工业大学,天津 300000)

摘要

本研究基于情感分析和CB算法,设计和研究了一种留守儿童看护系统。该系统旨在为留守儿童家庭提供一套完善的交互式看护系统实现对儿童身心健康的全方位监测和保护,帮助监护人以及社会更好地关爱这一弱势群体

关键词留守儿童;情感分析;CB算法;推荐系统;看护系统

第一章绪论

1.1研究背景

我国工业化、城市化、现代化进程的大力发展进程中,包括贫困山区在内的许多西部农村,外出务工逐渐成了许多贫困地区家庭增加收入、改善经济面貌的主要手段[1]随之而来的,就是“留守儿童”这一新型弱势群体的产生。

表1 国内现状

贵州省:共青团贵州省委启动建立留守儿童自立自强中心,这一系统为留守儿童打造了弥补亲情的爱心平台,倾诉烦恼的幸福乐园,学习生活的知识宝库。[2]

R

四川省:宜宾在全省率先建成留守儿童信息管理系统,建立留守儿童专门档案,收集留守儿童父母基本信息,了解留守儿童父母返乡创业、就业意愿,以便于日后精准关爱留守儿童。

c85954d8a132793ce55c82da08450c89

湖南省:湖南省妇联和湖南省妇女儿童发展基金会发起了湖南省农村留守儿童心理健康辅导中心“知心屋”项目。“知心屋”项目通过阵地建设,专业培训,聘请社会心理工作者,培养当地开展心理健康服务专业队伍等系列举措,为孩子们打造缓解心理压力的温暖之家。

山东省:济南市幸福人生心理健康服务中心开展了“幸福人生与留守儿童相伴同行”农村留守儿童关爱保护项目,旨在对留守儿童展开心理抚慰。[3]

1.2国内外研究现状

表2 现有产品功能以及缺陷

产品

功能

缺陷

留守儿童关爱app

提供了咨询服务和社区服务等功能

功能单一,父母不能监护到孩子的情况,无法准确关注到孩子

守未联盟app

提供了教育课程服务和心理咨询等服务

简单地提供了课程视频,不能精准推送,心理咨询模块也只是提供了心理咨询师的联系方式

校讯通

能让家长了解孩子在校情况 能得知具体放学时间和放假时间等情况

功能有限,只是学习单方面给家长提供信息,无法了解到留守儿童准确情况

微信/QQ/电话

提供了常用的音视频通讯功能

只有简单的通讯功能,家长不能直接监护到孩子

除此之外,国内外研究者还在研究看护系统的实施模式,如基于居家养老服务的看护体系,联合社会工作等;另外,还要求社会学、心理学等学科共同参与留守儿童看护体系的建设。

第二章 产品架构

2.1系统架构

本系统的架构采集模块、预处理模块、情感分析模块、CB算法模块和推荐系统模块组成。

数据采集和预处理:收集留守儿童的基本信息,如年龄、性别、父母工作情况等,以及他们的看护需求和偏好信息。对这些信息数据进行清洗和处理,以便于后续的数据分析和模型建立

情感分析模型的建立:利用深度学习算法,建立情感分析模型,对留守儿童的情感状态进行分析。[4]可以使用自然语言处理技术,对留守儿童的文字、语音或视频等信息进行情感分析,以获得留守儿童的情感状态信息。

用户画像的构建:利用收集到的留守儿童的基本信息和情感分析结果,建立留守儿童的用户画像,包括留守儿童的年龄、性别、情感状态等信息。

物品特征的提取:根据留守儿童的看护需求和偏好信息,对看护物品进行特征提取,如物品的类型、功能、品牌等。

物品相似度计算:利用基于内容的推荐算法(Content-Based RecommendationCB算法),计算看护物品之间的相似度,以确定哪些物品最符合留守儿童的需求和偏好。

推荐列表生成留守儿童的用户画像和物品相似度计算结果的基础上,生成推荐列表。推荐列表可以按照物品的相似度排序,或者根据留守儿童的情感状态和需求进行个性化排序。

推荐效果评估:采用精确度、召回率、覆盖率等指标来衡量系统的推荐效果对推荐系统的效果进行评估,以便优化系统的性能。

2.2技术架构

2.2.1利用机器学习技术训练文本情绪分类模型,根据日记内容进行情绪判断

使用基于机器学习自然语言处理技术对数据集的文本内容进行处理并训练出情绪分类模型,通过模型分析出入的文本所表达的情绪。利用问卷、数据挖掘等方式获取数据集,按照一定比例被分为训练集和测试集。[5]将训练集进行预处理,再被转化为结构化的数据以便能够被计算机识别,此过程中,结合文本语义信息对包含的情感特征进行选择。

利用SVM 等分类器对经过特征选择的数据进行训练,并使用测试集进行性能评估,对分类器进行不断优化,在多次迭代中使得参数更加接近最优。当模型达到收敛阈值时得到最终模型,即可应用文本情感分类。通过分类结果,得到留守儿童的情绪状况。分析结果包括每种情绪以及对应的发生概率,这些结果会一并发送到家长端,以作出相应的处理。

基于机器学习的情感分类

2.2.2.利用基于深度学习的卷积神经网络模型对不良信息进行过滤

通过爬虫等技术从网页中获取一定数量的新闻资讯等信息,并得到主要文本内容,通过TensorFlow

框架利用词向量技术对内容进行one-hot编码,使用TexTCNN模型从网页文本内容中提取出关键信息,通过关键信息表现为不健康内容的信息会被删去。对获取的网页内容进行筛选,对识别到的留守儿童不宜接触的信息进行过滤。

TextCNN模型结构

2.2.3通过CB算法分析留守儿童浏览内容,并通过相关性分析得到留守儿童的兴趣爱好,并推荐相关课程视频

CB算法使用TF-IDF方法,找出被浏览的内容中出现次数最多的词,通过反复的验证得到该内容的特征向量,利用文本的特征词发现相关性最高的兴趣项目列表,也对获取到的课程做相同的处理得到属性索引。分析多次浏览记录,刻画出最终的用户画像,将每个用户的画像资料存储到数据库中。通过分析数据库中存储的内容对留守儿童提供需要的推送服务,并接收反馈情况,当不符合已得到的模型时,就重新利用新增的数据集训练推荐模型,以此不断进行迭代。在此过程中,留守儿童的兴趣相关的数据会使用MySQL技术来进行存储。

个性化推荐算法


第三章产品功能

3.1对留守儿童的情绪进行分析,及时将孩子的情绪特别是消极情绪告知家长,以便及时沟通处理

通过基于机器学习的自然语言处理技术,通过大数据挖掘得到训练数据集,以训练出文本情绪分类模型。App内设置心情日记模块,留守儿童在App内的日记模块提交日记后,通过模型对日记的文本内容进行分析,得出当前情绪状态。留守儿童的情绪状态会实时同步到APP家长端上。一旦留守儿童处于不良情绪时,系统将自动使用短信的方式告知家长。当识别到留守儿童有极端情绪时,则自动通过AI语音直接给家长拨打电话告知情况,以便及时沟通处理为了激励留守儿童坚持写心情日记,当提交一次有效的日记之后,系统会奖励用户一定数量的积分,可以使用积分兑换玩具和文具等物品。

绘图9

图2 通过日记内容分析情绪,及时告知家长处理

3.2过滤不良信息,推送健康的资讯信息,引导留守儿童健康成长

App内置资讯信息推送入口,信息来源于互联网,通过爬虫技术定期从互联网中搜集一定数量的信息内容。通过深度学习算法对信息内容进行分析过滤,排除掉不健康的内容(包括但不限于邪典、欺诈、成人、虚假等类别的信息),通过以上在云端的处理再在app内进行推送。避免留守儿童因为没有父母的监管,长时间接触网上的各种不良信息,对身心健康造成消极的影响。在通过筛选之后将内容推送给留守儿童,同时建立反馈机制,平台使用者(包括留守儿童和家长)可通过在线反馈或举报,对遗漏出的不良信息进行反映,算法通过反馈内容进行迭代,不断优化相关参数通过对信息的筛选给留守儿童提供优质信息,促进健康成长。

项目研究目标_过滤不良信息

图3 信息过滤,推送健康信息

3.3分析留守儿童浏览信息的爱好,推送相关的免费教育课程,促进爱好培养

分析app用户的资讯浏览记录,从记录的内容中获取关键信息,分析被浏览的信息和相关兴趣爱好的关联度,并给用户进行人物画像,加上相关的个性标签,建立兴趣培养机制。记录留守儿童的兴趣爱好,并通过推送的免费课程(若考虑盈利需求,可考虑推出付费课程等有利于促进爱好培养的内容,对儿童的爱好进行培养,同时也有利于培养良好的学习习惯。

4%CSD(Y)UAKN4~PJB[HCBCR

图4 兴趣爱好培养机制

第四章 结论

守护星为了保证未成年人的身心健康以及能够茁壮成长,提供了智能情绪分析、健康资讯内容、兴趣爱好培养等服务,通过机器学习与互联网技术的有机结合,为未成年人提供了一个强大的成长监护平台。

4.2软件技术

本系统使用java进行后端功能实现,使用python技术进行数据爬虫,CB算法使用TF-IDF方法进行机器学习,前端页面通过uni-appVue进行实现,数据库试用MySQL

4.3运行环境

4.3.1硬件环境

Inter Pentium4 2.0GHz以上,内存12GB,硬盘160GB

4.3.2软件环境

Windowsxpwin7win8win10包括32位系统和64位系统。

主要参考文献

[1]安俊,贾宏伟.西部贫困山区基于"互联网+"留守儿童关爱与思想教育三维体系构建[J].新课程(下),2019(06):21.

[2]李芳.贵州省Q县X中学“留守儿童自立自强中心”存在的问题与对策研究[D].贵州师范大学,2019.DOI:10.27048/d.cnki.ggzsu.2019.000032.

[3]辛辉.济南市公益创投运行模式优化研究[D].山东大学,2018.

[4]李维康.基于Stacking框架弱监督深度学习情感分析研究[D].西南财经大学,2019.DOI:10.27412/d.cnki.gxncu.2019.001074.

[5]彭明.朴素贝叶斯分类算法在降雨预测中的研究与应用[D].南京信息工程大学,2018.

基金项目:本研究为天津市大学生创新创业训练计划项目成果(202210058080)

通讯作者简介:陈香凝,女,汉,天津工业大学,副教授,大数据分析及可视、自然语言处理

作者简介:李响,男,满,天津市,天津工业大学,本科,研究方向:机器学习