简介:将Lasso算法和logistic回归模型相结合并且引入P2P个人网络信贷评估体系,通过模拟实验的结果发现,在全变量logistic模型、Lasso-logistic模型、Ridge-logistic模型中,Lasso-logistic模型对于变量的压缩效果要更好,有助于简化模型;虽然三个模型在进行预测的结果上并没有显著的差异,但是Lasso-logistic模型在计算效率上更胜一筹,在处理大量数据的情况下更有效率。
简介:摘要:随着我国煤炭价格市场化改革的不断深入,煤炭市场的价格走势一直成为各方关注的重点问题。本文考虑了煤炭价格的多种影响因素,采用套索(Lasso)模型作为煤炭价格模型的线性建模方法对煤炭价格进行预测,借助秦皇岛港5000千卡/千克动力煤平仓价数据进行模型检验,结果证明此模型预测结果精度较好,能在一定程度上预测出煤炭价格的变化趋势。
简介:如何在对参数进行估计的同时自动选择重要解释变量,一直是面板数据分位回归模型中讨论的热点问题之一。通过构造一种含多重随机效应的贝叶斯分层分位回归模型,在假定固定效应系数先验服从一种新的条件Laplace分布的基础上,给出了模型参数估计的Gibbs抽样算法。考虑到不同重要程度的解释变量权重系数压缩程度应该不同,所构造的先验信息具有自适应性的特点,能够准确地对模型中重要解释变量进行自动选取,且设计的切片Gibbs抽样算法能够快速有效地解决模型中各个参数的后验均值估计问题。模拟结果显示,新方法在参数估计精确度和变量选择准确度上均优于现有文献的常用方法。通过对中国各地区多个宏观经济指标的面板数据进行建模分析,演示了新方法估计参数与挑选变量的能力。
简介:摘要目的利用LASSO回归分析筛选出与冠心病密切相关的血脂指标。方法选取2013年5月至2015年11月在济宁医学院附属医院心内科住院并诊断为冠心病的患者3 062例的临床资料进行回顾性分析。按照冠状动脉造影结果分为冠心病组(n=2 427)和对照组(n=635)。统计分析用R语言。建立冠心病相关血脂指标的多元逻辑回归模型,评估模型多重共线性的严重程度。利用LASSO回归筛选出冠心病预测模型中具有代表性的血脂指标。结果研究对象共入选患者3 062例,其中冠心病组2 427例,对照组635例。将血脂指标同时纳入多元逻辑回归模型后导致了模型较严重的共线性,逐步回归(stepwise)只能够在部分地减少共线性的严重程度,而LASSO回归模型显著减少了共线性的严重程度。经过LASSO回归分析,发现低密度脂蛋白胆固醇(low density lipoprotein-cholesterol,LDL-C)、高密度脂蛋白胆固醇(high density lipoprotein-cholesterol,HDL-C)和非高密度脂蛋白胆固醇(non-high density lipoprotein-cholesterol,non-HDL-C)是预测冠心病的代表性的血脂指标。结论LASSO回归在处理多重共线性的样本数据时有优势。LASSO回归发现LDL-C、HDL-C和non-HDL-C是预测冠心病的代表性的血脂指标。
简介:摘要:本研究旨在构建一个基于Lasso回归的某住宅工程造价风险评价模型。通过进行Lasso回归分析,发现投融资风险控制方案和工程质量验收风险控制方案在降低工程造价风险方面起到了正向影响,而合同风险控制方案、施工方案选择风险控制方案、施工质量风险控制方案和施工进度风险控制方案中的各项举措则起到了负向影响。这表明,在实际操作中,这些控制措施的执行力度和效果存在差异,导致了风险控制效果的不一致。结果不仅证明了风险评价体系的合理性,还验证了Lasso回归方法在处理高维数据和强相关变量方面的适用性。研究结果为项目管理者提供了有力的决策支持,有助于工程项目识别和控制关键风险因素,从而降低工程造价风险。
简介:为研究飞机燃油消耗与飞行因素的关系,以某家航空公司数据为例,建立2014-04-08至2015-04-09飞机飞行阶段耗油量与飞行速度、高度、气温、风速、重量、经度等相关因素的回归模型。首先对相关因素进行主成分分析,并采用逐步回归方法建立飞机耗油量与主成分之间的回归模型;其次,采用Adaptive-Lasso方法建立飞机耗油量与相关因素间的Adaptive-Lasso回归模型;最后,对以上模型进行比较分析。研究结果表明,通过Adaptive-Lasso方法建立的回归模型能更好地拟合飞机耗油量。
简介:摘要:数据结构作为计算机科学的核心,已经成为人们必须掌握的一切信息知识。作为经典的最短路径算法,Dijkstra算法数据结构被在生活中的各方面都有所体现。本文从数据结构和最短路径算法的定义入手,介绍了Dijkstra算法的算法优缺点和算法实例,最后阐述了最短路径算法在现实生活中的作用,说明该算法的重要意义。
简介:在HITS算法的基础上应用蚁群算法的主要思想,对网页按关键字搜索后被点击的次数进行统计,结合相关内容提出了一种新的搜索算法—基于蚁群算法的改进HITS算法.实验表明,该算法在使得返回结果中相关度较高的网页通过人们的自主选择获得了不同程度的加权,使得其在查准率及解决HITS算法的主题漂移方面都优于传统HITS算法.
简介:摘要目的基于矢状位影像学参数和临床特征构建颅底凹陷患者复位术后生命质量的LASSO-logistic回归预测模型并对其进行验证。方法回顾性分析2015年8月至2020年8月空军军医大学唐都医院神经外科采用经颈后路复位减压植骨融合内固定术治疗的94例颅底凹陷患者的临床资料。基于患者的年龄、体重、手术前后疼痛数值评价量表(NRS)评分、颈椎功能障碍指数(NDI)及矢状位影像学相关参数,采用LASSO-logistic回归法筛选出鲁棒性最好的变量并构建颅底凹陷患者复位术后生命质量的预测模型。绘制受试者工作特征(ROC)曲线,并根据曲线下面积(AUC)判断该预测模型的效能。采用Bootstrap法进行500次重复抽样进行内部验证。结果LASSO-logistic回归的分析结果显示,共9个因素纳入预测模型,分别为:年龄、体重、术前NRS评分、术前NDI、术前头颈屈曲角(HNFA)、术后斜坡枢椎角(pCXA)、术后斜坡斜坡角(pCS)、术后延髓脊髓角(pCMA)及术后Boogaard角(pBoA)。通过绘制ROC曲线,发现该预测模型的AUC为0.893,灵敏度为79.4%,特异度为84.6%,阳性似然比为5.162,阴性似然比为0.243。内部验证的结果显示,AUC为0.885,灵敏度为81.3%,特异度为82.6%,阳性似然比为5.153,阴性似然比为0.237。结论基于年龄、体重、术前NRS评分、术前NDI、术前HNFA、pCXA、pCS、pCMA及pBoA构建的颅底凹陷患者复位术后生命质量LASSO-logistic预测模型拟合性较好。
简介:摘要目的基于矢状位影像学参数和临床特征构建颅底凹陷患者复位术后生命质量的LASSO-logistic回归预测模型并对其进行验证。方法回顾性分析2015年8月至2020年8月空军军医大学唐都医院神经外科采用经颈后路复位减压植骨融合内固定术治疗的94例颅底凹陷患者的临床资料。基于患者的年龄、体重、手术前后疼痛数值评价量表(NRS)评分、颈椎功能障碍指数(NDI)及矢状位影像学相关参数,采用LASSO-logistic回归法筛选出鲁棒性最好的变量并构建颅底凹陷患者复位术后生命质量的预测模型。绘制受试者工作特征(ROC)曲线,并根据曲线下面积(AUC)判断该预测模型的效能。采用Bootstrap法进行500次重复抽样进行内部验证。结果LASSO-logistic回归的分析结果显示,共9个因素纳入预测模型,分别为:年龄、体重、术前NRS评分、术前NDI、术前头颈屈曲角(HNFA)、术后斜坡枢椎角(pCXA)、术后斜坡斜坡角(pCS)、术后延髓脊髓角(pCMA)及术后Boogaard角(pBoA)。通过绘制ROC曲线,发现该预测模型的AUC为0.893,灵敏度为79.4%,特异度为84.6%,阳性似然比为5.162,阴性似然比为0.243。内部验证的结果显示,AUC为0.885,灵敏度为81.3%,特异度为82.6%,阳性似然比为5.153,阴性似然比为0.237。结论基于年龄、体重、术前NRS评分、术前NDI、术前HNFA、pCXA、pCS、pCMA及pBoA构建的颅底凹陷患者复位术后生命质量LASSO-logistic预测模型拟合性较好。