1华北理工大学 化学工程学院,河北 唐山 06 321 0; 2. 华北理工大学 电气 工程学院,河北 唐山 06 321 0; 3. 华北理工大学 电气 工程学院,河北 唐山 06 321 0
[摘 要]目前未成年人的心理健康问题逐渐浮现,社会对未成年人的心理健康日益关注,建立一个未成年人的心理健康评价体系的重要性日益。首先采用归一化的方法对中学生心理问卷数据进行预处理,对整个数据做中心化,采用协方差矩阵,然后投射样本到一个低维空间上进行分析。建立主成分分析模型对预处理之后的数据进行分析。用KMO检验和巴特利球体检验未成年人心理健康评价体系模型。得出此评价体系的建立切合实际,正确率高。
[关键词]:归一化;主成分分析法;心理;未成年人;协方差矩阵;
0引言
科技飞速发展,国家大步向前发展,进一步发展未成年人心理健康教育也逐渐提上日程。未成年人心理问题发生率和精神障碍患病率逐渐上升,已成为关系国家和民族未来的重要公共卫生问题,所以构建未成年人心理健康评价体系意义重大。
1未成年人心理健康数据分析
建立一个未成年心理健康评价体系数学模型。使用主成分分析法,对主要特征性情绪进行分析然后再去评价一个人的心理状况。之后再对主成分分析的数据进行分析,从而进行评价未成年人的心理状况。
1.2模型的建立
主成分分析是利用降维的思想,将多个指标转化为少数几个综合指标的多元统计方法。在实际问题研究中,为了全面、系统地分析问题,必须考虑众多影响因素。
第一步我们对数据进行归一化预处理,观看数据的结构,我们将所有数据按照他对应的域,放大到0~100的区间。对于所有的测评算上性别,删掉级别(都是A级而且评级数据太分散,等级列来源是根据其他参数,所以我们直接去掉级别列),一共是14个可选因素。我们对于性别因素进行分析,如果一个设置为0一个设置为100的话,会让性别因素的权增大;如果一个49一个51的话,又可能使权减小,为了降低这种影响,我设置了性别为25和75,这样影响会降低一些。我们建立主成分分析模型:
在开始寻找主成分之前(principle components)之前,我们需要对整个数据做中心化(均值化),中心化之后,数据集中每一个维度的均值应该0.根据数据创建一个协方差矩阵。这里的xi是原始样本,上述式子表达的是在低维的坐标系下,第 j 维的坐标上的数据。因为投射前每一个维度的均值是0,投射之后也应该是0,所以投射之后的每一个维度的均值表示成:
将目标函数拉格朗日化,针对求U的偏导,得到投射之后的方差可以表示为:
UTSU = λ
这里的方差的大小等于S的特征值λ,最大的特征值λ应该对应着最大特征向量U。这个最大的特征向量U就是第一个主成分(first principle component),它可以反映较多的原始数据的信息。
在用主成分分析时要求主成分的贡献率累计达到85才合格,经过测试,最后确定为9个主成分,每一个主成分的贡献率就是第三部分下面的保留主成分方差贡献率列表。
首先将男女进行分别处理数据如下:
对男性8个主成分:
男返回具有最大方差的成分:
[[-0.13504916 -0.00878473 0.00142535 -0.16455637 -0.15999365 -0.13047478 -0.25541412 -0.21266136 -0.31497002 -0.68095479 -0.23600908 -0.40377185 -0.14100825]
[-0.00819494 0.28624077 0.94717047 0.01712297 -0.09319882 -0.03496552 -0.03858338 -0.01715313 0.02293843 0.06691012 -0.05876495 -0.01977601 -0.00590893]
…………]
保留主成分的方差贡献率: [0.20419059 0.16335938 0.13112605 0.10567334 0.0783573 0.06553966 0.05882419 0.04789582]保留主成分的方差贡献率累积: 0.8549663318326662所有样本的log似然平均值: -55.16771226497529奇异值: [784.54766418 701.73558349 628.70361605 564.39633794 486.0055235 444.48137455 421.09438156 379.9708276 ]噪声协方差: 137.05064479053962
对女生8个主成分:
女生返回具有最大方差的成分:
[[-0.14251493 -0.0059407 -0.00652486 -0.25620752 -0.19205322 -0.17309347 -0.29486313 -0.30600331 -0.41820328 -0.54936289 -0.20324004 -0.37622309 -0.08365025]
…………]
保留主成分的方差贡献率: [0.25285346 0.14324289 0.11558767 0.10708192 0.08496622 0.07206207 0.05820678 0.04599379]保留主成分的方差贡献率累积: 0.879994803969559所有样本的log似然平均值: -52.89784022172786奇异值: [799.7278782 601.92769181 540.70892054 520.43422489 463.5866629 426.93441019 383.70244322 341.08088481]噪声协方差: 85.38390438235402
对总体又进行了分析:
汇总9个主成分返回具有最大方差的成分:
[[ 0.12885175 -0.13725817 -0.0509435 -0.06467649 -0.20325705 -0.16650164 -0.14970387 -0.27709485 -0.27444159 -0.38328717 -0.60820917 -0.20681409 -0.3816427 -0.09476947]
[-0.75270653 -0.03031814 0.32972178 0.48029785 -0.09034876 -0.12930361 -0.04681461 -0.03863038 0.08440913 0.06688798 -0.07975658 -0.11512953 -0.12245007 -0.13541096]
…………]
保留主成分的方差贡献率: [0.19418396 0.16237783 0.11635659 0.09826905 0.08834731 0.06812532 0.0598286 0.04956246 0.04050453]
保留主成分的方差贡献率累积: 0.8775556449713239所有样本的log似然平均值: -58.86011780877822奇异值: [1119.19921451 1023.44399434 866.355637 796.17603906 754.9138533 662.91064585 621.23390004 565.42776619 511.15486874]噪声协方差: 117.10036605432978
最后的总体分析和将性别分开进行分析的结果几乎相似,我们主要对总体运算出来的结果进行分析。保留主成分的累计贡献率为>85%,刚好九个主成分定义每一个主成分为Fi从F1到F9,设置总的评价指标为F.(F等于每一个主成分乘以他的相对权值,相对权值就是前面的贡献率除以贡献率累计)
1.3模型的检验
对原始数据进行分析前,首先进行KMO检验和巴特利球体检验。我们看出a2对大多数因素具有较强关联性,a3a4这两内部具有很强的相关性,a9和a10相关性也很强。(a1到a14是原始的14列数据,分别是问卷成绩,等级,线下成绩,总成绩,强迫症状,偏执,敌对,人际关系紧张与敏感,抑郁,焦虑,学习压力,适应不良,情绪不平衡,心理不平衡)
2结论
经过对数据的分析和处理后,这几大成分利害由一个共同指标贡献率来决定。在用主成分分析时要求主成分的贡献率累计达到85才合格,贡献率达到85则说明了这项指标对健康状况影响较大。用归一化处理,首先定义一个总评价指标F,定义每一个主成分为Fi从F1 到F9。通过大数据计算权值和方差,进而判断出这些指标的作用与影响。运用F值评价不仅具有说服力,而且数据更加真实可信。
参考文献
[1]360U2807133945,主成分分析,https://baike.so.com/doc/5016401-5241875.html,2021年6月5日;
[2]吴锦莲.我国上市商业银行经营绩效的实证研究——基于主成分分析法[J].时代经贸,2021,18(07):69-71.
[3]李丹.探究高职院校思政教育与心理健康教育的融合[J].现代农村科技,2021(08):107-108.
[4]徐雪平.人际型心理资本对大学生就业的价值分析及培养策略研究[J].中国医学教育技术,2021,35(04):422-425.
[5]严宇珺,严运楼.上海人口老龄化发展趋势及其影响因素——基于GM(1,1)和主成分分析[J].中国老年学杂志,2021,41(14):3093-3098.