简介:摘要目的分析自动机器学习(autoML)模型预测孕早期子痫前期风险的效果。方法选取2017年1月—2020年10月2 180例在济南市第二妇幼保健院建档并于孕12周进行孕检的单胎孕妇,根据整个孕期是否发生子痫前期分为子痫前期组(103例)和对照组(2 077例),比较两组孕妇临床资料和血液学指标差异,分析各指标与子痫前期发生风险的相关性。将纳入研究的孕妇按7∶3的比例随机分为训练集和测试集,应用autogluon autoML算法构建多种机器学习模型,并在训练集中进行训练和交叉验证,比较不同模型的训练和验证准确率。分析各指标在autoML模型中的重要性,以autoML模型和logistic回归模型分别对测试集孕妇孕早期子痫前期的发生风险进行预测,应用受试者工作特征(ROC)曲线对autoML模型和logistic回归模型的预测效能进行评价。结果子痫前期组年龄、孕前体质指数、孕12周体质指数、孕12周腰围、饮酒史比例、超敏C-反应蛋白(hs-CRP)、三酰甘油、低密度脂蛋白胆固醇(LDL-C)、天冬氨酸氨基转移酶(AST)、血小板分布宽度(PDW)、平均血小板体积、促甲状腺激素(TSH)、β-人绒毛膜促性腺激素水平均显著高于对照组(均P<0.05),游离三碘甲状腺原氨酸(游离T3)、游离甲状腺素(游离T4)、胎盘生长因子(PIGF)、可溶性fms样酪氨酸激酶-1(sFlt-1)、妊娠相关血浆蛋白-A(PAPP-A)均显著低于对照组(均P<0.05)。相关性分析显示,孕前体质指数、孕12周体质指数、孕12周腰围、hs-CRP、三酰甘油、AST、TSH、游离T3、游离T4、β-HCG、PIGF、sFlt-1和PAPP-A等与孕早期子痫前期风险的相关性较高;但各指标间的相关性均较低。通过autoML模型算法共构建8类18个模型,基于FastAI的神经网络_L2在训练集(0.963)和验证集(0.971)中的准确率最高;TSH、LDL-C、PDW、孕12周腰围、sFlt-1、AST等指标重要性较高,游离T4、总胆固醇、孕次、饮酒史、产次和高血压家族史重要性较低。孕早期autoML模型预测子痫前期发生风险的ROC曲线下面积显著高于logistic回归模型(0.984比0.765,P=0.002);两种预测模型在训练集的预测准确率差异无统计学意义(P>0.05);autoML模型在测试集的预测准确率和灵敏度均显著高于logistic回归模型(99.54%比98.32%,93.75%比75.00%,均P<0.05)。结论孕早期TSH、LDL-C、PDW、孕12周腰围、sFlt-1、AST等因素与子痫前期发生风险具有一定相关性,基于孕早期指标的autoML模型对子痫前期发生风险具有较高的预测价值。