简介:传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。
简介:随着个人电脑的普及以及WINDOWS技术的发展,尤其是GUI(图形用户界面)技术的主流化,Windows成为最受欢迎的操作系统标准平台,作为计算机I/O设备的鼠标使用越来越频繁。与键盘相比,鼠标具有无可比拟的优势,其中最主要的一点是使用灵活,定位准确、迅速。经过二十多年技术改进与更新,鼠标由机械式鼠标发展到目前大多数PC用户广泛应用的光学式机械鼠标,再到最新式的无线光电鼠标,由两键发展到三键外加翻页滚轮。但除轨迹鼠外,所有的鼠标那是靠在桌面上移动来定位。对多数长期操作电脑人来说(无论他是左撇还是右撇),大都有过肩膀酸痛,手指僵硬或身体的其他部分感觉到持续性肌肉酸疼的体验。久而久之形成一种新流行的电脑职业病:颈肩腕综合症。造成这些不适的原因部分是由于桌椅高度不合适、身体姿势不正确而产生,但关键还在于现有大多数鼠标的设计使手腕刻意弯曲,长期持续使用少数几个手指用力,从而对腕关节造成压力,如此日积月累有可能导致腕关节综合症。再加上离电脑屏幕太近,由于用眼过度从而使视力急剧下降,而罪魁祸首就是每日在你眼前溜来溜去的鼠标。