辉瑞投资有限公司,上海,200041
摘要:目的 比较中美肺癌筛查的现状及趋势,以期为我国肺癌筛查领域的研究发展提供科学依据与参考。方法 对中国知网(CNKI)和 Web of Science核心合集数据库的文献进行主题词检索,并采用文献计量软件 Citespace 5.8.R3对 1979-2022年发表的中美相关文献进行可视化分析,以掌握中美两国关于该领域的研究现状、热点及前沿。结果 研究发现,中美关于肺癌筛查的相关研究总体发文量较低(1093篇)且正式起步较晚约为21世纪初。中美按照发文量变化经历了萌芽探索期(分别为1979-2012和2000-2002年)和快速上涨期(分别为2013-2022和2003-2022年)。国内相关领域作者与机构合作相对分散;中美肺癌筛查领域研究重点有所相同但各有侧重,两国研究都关注肺结节、高危人群和风险预测等,但国内集中于筛查效果评价与筛查方法的研究,而美国更关注筛查的成本效益和实现规范化的筛查诊治流程。未来一段时期国内肺癌筛查的发展前沿将集中于人工智能、危险因素、减少假阳性等方面的研究,而美国相关研究则可能围绕肺癌筛查实施及阻碍、影响等方面展开。结论 目前关于肺癌筛查领域的研究仍然存在巨大发展空间与潜力,尤其国内该领域研究需要针对相关不足进一步发展完善。
关键词:肺癌;筛查;中美研究差异;热点分析
1引言
肺癌是全球癌症相关死亡率的主要原因,也是我国最常见的主要恶性肿瘤之一。癌症筛查和早诊早治是控制癌症发病率和死亡率的有效方式。早期肺癌患者的5年生存率可>75%。国内外的长期实践证明,肺癌筛查能够有效提高阳性检出率和早诊早治率,降低肺癌发病率及死亡率。目前我国的相关研究大多以定性方法评价筛查项目实施效果,且缺乏与其他国家的对比研究。因此,本研究通过文献计量 软 件 Citespace 5.8.R3对 中 美 有 关 肺 癌 筛 查的相关文献进行可视化分析,采用定量的方法对比挖掘该领域主要的研究热点、前沿和发展趋势,以期为我国肺癌筛查领域的研究发展提供科学依据与参考。
2资料与方法
2.1数据来源
文献来源于中国知网;以“lung cancer screening OR lung nodule screening”为检索词从WOS中检索英文文献,文献类型选为 Article。在国家/地区分类中,分别筛选CHINA(中国)和 USA(美国)来源文献。检索的时间跨度不限,检 索截止时间为2022-07-10。 文献排除标准: (1)动物实验;(2)文献类型为消息、资讯、新闻、信件等;(3)无摘要内容;(4)已确诊肺癌患者的诊断及筛查等相关研究。
2.2参数设置
将CNKI检索的文献数据导出为Refworks格式,将WOS检索出的文献数据导出为纯文本格式。使用Citespace5.8.R3分析软件将时间切片设置为“1”,主题词来源(term source)默认全选;节点类型(node types)分别设置为“key word(关键词)”“auther(作者)”“institution(机构)”;选择标准(selection criteria)中的阈值设置为Top30,即在每个time slice(时间切片)中提取前30个被引次数最高的文献;对关键词采用path finder和 pruning sliced networks图谱修剪算法进行修剪;在作者和机构合作分析中,选择g-index(g指数)分析,默认参数k=25;在关键词突现中,将γ值设为0.4,选取中美肺癌筛查领域前16位的突现关键词;最终得到文献的共现、聚类与突现等分析图谱。
2.3统计学方法
采用Excel 2010和 Citespace 5.8.R3进行数据整理与科学知识图谱分析。通过 CiteSpace对文献进行关键词共现、聚类、突变等分析,以知识图谱的形式直观展现中美有关肺癌筛查领域的现状及热点主题。运用Excel软件对文献的年发文量进行统计分析。
3结果
3.1 文献发表趋势
分别检索到 CNKI文献1348篇,WOS中国来源文献3712篇,wos美国来源文献5073篇,经剔除不相关及重复的文献后,合并得到中国文献681篇和美国文献412篇,合计1093篇纳入分析。中美关于肺癌筛查领域的研究正式起步时间大致相当。中国自1979年便开始了相关领域的研究,总体上中文文献发文量多于美国。国内发文趋势大致可分为萌芽探索 期(1979-2012年)、快 速 上 涨 期(2013-2020年)和缓慢回落期(2021-2022年)。中国发文的萌芽探索期发文145篇,而快速上涨期发文量(424篇)是前期的2.92倍,2021年后发文量有下降的趋势。美国的萌芽探索期(2000-2002年)和快速上涨期(2003-2022年)发文量虽有波动但总体上呈增长趋势,2022年已发表的文章数是2021年的66.67%,未见相关回落趋势。中美两国筛查方法的研究也呈现出比较性差异,美国相关研究自2023年以来一直集中于CT方法等;中国的筛查方法在2003年以前以痰细胞学为主,后期则转向CT以及其他方法的比较研究中,这主要表现为不同类型、不同剂量的CT比较及CT与胸部X射线等方法比较的相关研究。
3.2 研究热点与前沿
3.2.1关键词共现
中国相关文献生成413个节点、887条连线和中心度为0.0104的关键词共现图谱,美国文献生成436个节点、2374条连线和中心度为0.0250的图谱。中国高频关键词主要包括肺癌、肺癌筛查、肺结节等;而美国最大的关键词节点则是胸部CT,出现频率为174次,lung cancer(肺癌)、lung cancer screening(肺癌筛查)等出现的频次也较高。对比两国肺癌筛查研究领域出现频率和中心度前10位的关键词,中介中心性最高的关键词分别是肺癌、cost effectiveness(成本效益),中心度分别为0.6800、0.1700。中国其他中介中心性较高的关键词还有肺癌筛查、肺结节、低剂量等,美国则包括lung cancer screening(肺癌筛查)、follow up(随访)、lung nodule(肺结节)等。这些关键词在合作网络中具有较好的中介性,体现了中美关于肺癌筛查研究领域的热点。
3.2.2作者与机构合作图谱分析
国内作者聚类生成672个节点,1581条连线,中心度为0.0070;机构聚类生成370个节点,0条连线,中心度为0的图谱。美国作者生成了491个节点,1254条连线,中心度为0.0104;机构聚类生成302个节点,852条连线,中心度为0.0187的聚类图谱。中美作者都聚类出各自代表的作者合作网络,但中国的作者合作网络没有美国集中,最大的作者合作模块也是与外国研究人员合作发文占据较大比重;发文较多的作者主要有吴宁(7篇)、叶兆祥(7篇)等。美国肺癌筛查领域研究形成了1个具有较强中心性的作者合作类团,发表文献
较多的作者有Claudia I Henschke(16篇)、Chung Yin Kong(14篇)。在机构合作分析中,中国研究各机构较为分散,并未形成机构合作网络连接图谱。有关肺癌筛查的发文机构以北京、上海、四川等医院所属的肿瘤研究所、放射科等为主,其中也包括一些国外合作机构。美国机构合作分析生成了较为集中的合作图谱,发文较多的机构有NCI(美国国家癌症研究所,48篇)、Massachusetts Gen Hosp(麻省总医院,33篇)、Univ Michigan(密歇根大学,23篇)。
3.2.3关键词聚类
聚类后网络的模块值Q>0.3,表示可视化结果显著;平均轮廓值S>0.5代表聚类合理,S>0.7则表示聚类结构显著,聚类结果令人信服。中国文献得到了413个节点和887条连线的关键词聚类图谱,Q=0.6591,S=0.9024;美国文献生成了436个节 点 和2374条连线,Q=0.5307,S=0.836。表明生成的聚类结构较为稳定,内部一致性较好。
2个国家的数据文献均生成了12个关键词聚类的类别,中国文献中聚类#0~#11的关键词主题是肺癌、肺癌筛查、早期肺癌、肺结节、早期筛查、低剂量、人工智能、诊断、检出率、死亡率、应用价值和影响因素,主要包括了肺癌筛查的目的、方法、应用范围及相关评价等。美国的关键词聚类中,聚类#0、#2、#4、#6、#7、#10主要是美国肺癌筛查的策略与方法研究;聚类#1、#5、#9则代表美国肺癌筛查的主要影响因素,包括smoking prevalence(吸烟率)、current perspective(当前视角)、pulmonary provider perspective(肺部医生观点);聚类#3、#11 为retrospective study(回顾性研究)、result(结果),表示美国肺癌筛查的产出与结果,而聚类#8则表明美国肺癌筛查的主要范围,即Ameracan Adult(美国成人)。
3.2.4关键词突现
中国关键词突现时间集中在1980-2020年,“吸烟”在1980-2003年持续突现,突现时间长达23年。观察突现图谱可将其归纳为两个阶段:第1阶段为1980-2015年,这一时期的关键词主要是吸烟、痰细胞学、评价研究等;第2阶段为2016-2022年,关键词以应用价值、体检、人工智能等为主,其中人工智能、肺结节、危险因素这3个关键词自2019年突现并一直持续。美国该领域关键词突现时间在2004-2022年,总体上也可划分为两个阶段:第一阶段大致为2004-2016年,关键词主要体现为helical ct(螺旋CT)、base line(基线)等,其 中 helical ct(螺旋CT)、base line(基线)、project(筛查项目)这3个关键词持续突现的时间最长,分别为9、10和10年;第2阶段主要指2017-2022年,前期主要是美国肺癌筛查的相关影响因素,表现为attitude(态度)、implementation(实施)、barrier(阻碍)等,而后期则更关注筛查项目的实施效果与成本产出,主要关键词有mortality(死亡率)、primary care(初级保健)等。图中许多研究热点自2018年持续至今,如implementation(实施)、risk(风险)、barrier(阻碍)等。
4讨论
根据文献的发文量变化可以清楚地了解该研究领域的发展状况与趋势。从中美两国的文献发文量来看,1979-2022年两国关于肺癌筛查研究领域的相关文献共发表1093篇,总体发文量较低且正式起步较晚,这可能是因为早期世界范围内对于肺癌筛查的必要性与迫切性缺少相关认识。中国自1978年便开始了肺癌普查方面的研究,但萌芽期发文量较少且持续时间长,这表明此阶段国内学者对于肺癌筛查已经有了一定的认识,但重视程度不够,且研究实践与成果较少。这可能是因为早期筛查主要集中于有长期职业暴露人群的普查而忽视了一般高危人群。另一方面可能是因为缺乏必要的资金支持。我国在2012年以前的肺癌筛查大多以人群筛查和有组织的筛查为主。
筛查费用承担主体主要是医疗机构或患者本人,开展大规模的人群筛查有一定的现实难度。美国发文量的萌芽探索期自2003年开始,这可能与其2003年启动的国家肺癌筛查试验有关。中国在2012年将肺癌高危人群的筛查纳入国家重大公共卫生项目之中,这期间有关中国肺癌筛查发表的外文文献量也在不断上涨,2021年国内该领域发文缓慢回落,这可能与2020年新型冠状病毒肺炎的流行有关,许多省市的机会性肺癌筛查难以开展实施,这在一定程度上影响筛查进展。与此同时美国的发文量未见下降,这说明肺癌筛查的相关研究仍然具有重要的现实意义与发展潜力,也可能与美国国家对于新型冠状病毒肺炎的态度有关。
在作者与机构合作分析中,美国筛查领域作者合作的中心性最强,而中国相关联系则没那么紧密,但也形成了几个核心作者群及国外作者机构,这说明国内该领域作者的协同合作在不断加强,也积极向国际领域寻求合作与经验交流。同时,中国的筛查研究机构大多依托于教学医院实施为主,机构合作较为分散,多机构、多作者群的合作模式仍然需要较长时间的发展与探索。
在肺癌筛查方法方面,痰细胞学是中国最早开始用于肺癌筛查的工具,具有特异度高且简单易行的特点,但该检查方法总体检出率较低且对于早期肺癌的诊断有限,因此限制了其作为肺癌筛查工具的广泛使用。胸部X射线是最早用于肺癌筛查的影像学技术,但由于分辨率低,不可避免的造成病变部位与其他组织器官互相重叠,漏诊率较高。癌胚抗原(carcino embryonicantigen,CEA)等血清检测由于个体差异化导致有效筛查肺癌的 特 异 性 较 低。而对于各种胸部CT检查方法的探讨也进一步证实了低剂量螺旋CT是目前国际上普遍认同进行肺癌筛查较为合适的筛查工具。美国自2003年关于筛查方法的研究大都集中于CT研究,这可能是因为其开展的国家肺癌试验为肺癌筛查方法提供了数据支撑。中美两国对于CT的研究主要集中于CT检查的类型和剂量,胸部CT的分辨率相对较高,能够发现较为隐蔽的肺部病灶以帮助医生精准诊断,但常规CT具有放射剂量大和扫描时间长等缺点,所以类型和剂量的相关研究有利于最大程度的降低筛查过程中可能产生的不利风险,进一步提高筛查对象的依从性。
通过关键词共现、聚类可以看出,中美两国肺癌筛查领域都关注肺结节、高危人群、风险预测。肺癌的早期症状主要表现为肺孤立性结节,对其进行及时的检测诊断和跟踪随访对于肺癌患者早诊早治具有重要意义。中国城市癌症早诊早治项目中的肺癌筛查对于高危人群的阳性肺结节检出率可达4.87%,疑似肺癌检出率为0.72%,而美国NLST试验对于肺部病变的阳性检出率也高达27.30%。对于肺癌高危人群的筛查被证实最符合项目实施的成本效益。
另外,关于肺癌“高危人群”的定义也在原有基础上不断发生变化。越来越多的研究证实,其他人群也有罹患肺癌的高风险。因此对于高危人群的研究以及本土化的风险管理和预测显得尤为重要。
通过对关键词聚类的进一步归纳总结,发现中美对于肺癌筛查的研究重点也有所不同:国内肺癌筛查研究集中于项目实现早诊早治的效果评价与筛查方法的研究,而美国更关注肺癌筛查项目的成本效益和实现规范化的肺癌筛查诊治流程。这可能有以下方面的原因:(1)中国的大规模肺癌筛查主要指2007和2012年开始的农村癌症筛查及城市癌症早诊早治筛查项目,这两个项目均由国家财政拨款支持,为符合条件的高危居民提供免费筛查。但总体上肺癌筛查的全民覆盖较低,且存在假阳性率高、过度诊疗以及依从性较差等缺陷。因此,我国研究重点更倾向于提高项目实施的效果以及研究制定符合中国国情的肺癌筛查方法。(2)与西方不同的一点是,无论是自费或者机会性筛查,在中国进行低剂量CT检查的成本都相对较低。美国直到2014年才将低剂量CT筛查的费用纳入政府医疗保险,而且目前仅仅覆盖>65岁人群,<65岁人群只能通过私人保险覆盖。因此,这可能是美国肺癌筛查研究更侧重于成本效益研究的原因之一。(3)美国早期开展的一系列肺癌筛查试验研究,为制定规范化的国家肺癌筛查指南奠定了坚实的基础,而我国缺乏此类前瞻性、大规模的人群肺癌筛查试验。
2021年发表的中国肺癌筛查与早诊早治指南也在一定程度上借鉴了美国等发达国家指南的成功经验,因此开展我国人群特异性的个体化风险预测模型研究及肺癌筛查随机对照试验项目,探索更符合中国国情的肺癌筛查策略研究势在必行。另外,美国出现较多的关键词还有随访、管理等,中国的城市癌症早诊早治项目方案中也有涉及关于肺癌高危人群的随访,但目前相关研究成果产出较少,表明未来该方面的研究具有较大的上升潜力与发展空间。关键词突现分析结果也呈现出中美研究主题变化的趋势。从关键词突现时间段的划分可以看出,“吸烟”持续突现的时间最长,表明前期国内学者重点将吸烟作为肺癌的最大危险因素开展相关研究。后期研究重点则在于肺癌筛查的应用效果评价、人工智能应用等。人工智能、危险因素、减少假阳性等关键词持续突现至今,表明这些问题受到国内学者关注,并在未来一段时间仍可能是该领域的研究热点。美国关键词突现第一阶段重点在于对前期筛查项目的总结评价,以及对新开展项目的设计与基线调查。第二阶段重点关注筛查实施的相关影响因素以提高肺癌筛查的依从性,比较筛查差距并进行效果评价以期促进初级卫生保健的发展。其中关键词implementation(实施)、barrier(阻碍)、primary care(初级保健)等研究热点自2018年持续至今,今后可能仍是美国该领域研究的热点方向。
综合上述分析,中美肺癌筛查有异有同且各有侧重,都是根据本国实际开展相关筛查项目。我国的肺癌筛查研究起步较早但进展较慢,很多方面还具有较大的发展与上升空间,这值得在未来癌症筛查领域给予足够的关注。
本研究也存在一定的局限性:本研究仅基CNKI和WOS两个数据库文献数据,且检索字段限制在主题词检索,这可能造成部分相关文献未被纳入。其次,文献计量分析仅研究数量指标,对文献质量无法评价,因此,从文献计量学视角分析研究领域发展动态的专业深度有待加强。
作者简介:李雪琴,1979年9月2日出生,女,汉,出生于湖南,硕士研究生,临床医学