简介:LDA主题模型是文本挖掘领域的重要算法,同时在推荐系统当中也有不错的表现.通过LDA主题模型挖掘用户感兴趣的主题,是目前最常用的用户兴趣主题挖掘方法之一.为了提高LDA主题模型应用在推荐系统时的推荐质量,我们提出了一种基于负样本进行学习的方法negLDA.通过创造出负样本来学习用户对物品的负面预测评分,同时结合正样本学习得到的正面预测评分,从正反两个方面进行综合评测,从而更加精确地衡量出用户对物品的预测评分.通过在MoviesLens-100k、MovieLens-1M、FilmTrust这三个数据集上的实验,表明所提出的算法在精确率、召回率、AUC三个指标上相比传统算法均有一定改进.
简介:摘要:持向量数据描述算法(SVDD)是一种近年来运用得越来越多的单分类算法,具有很好的泛化能力,且运用核函数能有效解决“维数灾难”问题,可以较好的划分交通流数据分布特征。虽然在传统的SVDD只关注正类样本,能很好的通过单类数据进行机器学习,但我们又可以使用负类样本点来更好的完善SVDD所构造的超球面的分类性能。这就提出了带负类样本的支持向量数据描述算法(SVDD-NE)。之后通过对比不同分类算法的性能来验证SVDD-NE方法的有效性。最后将SVDD-NE运用于实际道路交通流数据的拥堵判别,用来增加道路拥堵的判别方法,实验证明该方法可以较好的支持道路车流拥堵情况识别,为诊断道路运作情况提供了技术基础。
简介:摘要对北京医院生物样本库在特定时间段保存的样本进行回顾性横断面研究,检测2019新型冠状病毒(SARS-Cov-2),以防止发生实验室污染和次生危害,成为潜在的传染源,同时建立生物样本库回顾性安全筛查体系。选取2019年11月1日至2020年1月22日期间北京医院生物样本库接收的呼吸与危重症科及发热门诊的样本,包括血清(n=79)、尿液(n=20)、粪便(n=42)和肺泡灌洗液(n=21),共162例样本,分别进行SARS-Cov-2核酸检测和血清学抗体检测,以结果的阴阳性界定保存样本安全性。SARS-Cov-2核酸检测和血清学抗体检测结果均显示为阴性,提示该生物样本库所储存样本的安全性较佳。本研究通过建立生物样本库回顾性安全筛查体系,对新型冠状病毒肺炎疫情爆发初期采集保存的高风险样本进行重点排查,以确保生物样本库的安全性。