拉沙病毒密码子偏性分析

(整期优先)网络出版时间:2022-12-13
/ 1
摘要目的研究拉沙病毒(Lassa virus,LASV)密码子使用偏性及其偏性形成的影响因素,比较LASV和几种表达系统密码子使用频率,为LASV重组亚单位疫苗、mRNA疫苗、DNA疫苗等基因工程疫苗的制备筛选出最优外源表达系统。方法使用Excel 2007、EMBOSS、CondonW1.4.2、SigmaPlot 14.0、SPSS 22.0等软件分析LASV核心蛋白(nucleoprotein,N)、包膜糖蛋白(envelope glycoproteins,G)、锌结合蛋白(zinc-binding protein,Z)、RNA聚合酶(RNA polymerase,L)蛋白共446条基因序列的密码子偏性及其影响因素,并将LASV密码子使用模式与几种不同表达系统进行比较。结果LASV的各蛋白编码序列的各位置GC含量存在较大差异,各蛋白平均GC3含量为42.29%~59.47%,ENC均值41.73~52.81,除Z蛋白密码子偏性较强外,N、G、L三种蛋白密码子偏性较弱。4种蛋白RSCU>1的密码子共108个,约占45.76%,其中以A/U结尾占63.9%,GUU、GUG、UCU、UCA、CCU、ACA、GCU、GCA、AGA、AGG为LASV多数蛋白的高频密码子,GCA、AGA为4种蛋白共有的高频密码子。ENC-Plot、中性分析、PR2绘图分析显示,LASV的各蛋白密码子使用偏性受到不同因素影响,其主要因素是自然选择,突变是次要原因。对比分析提示人和酵母菌是LASV较合适的外源表达系统。结论LASV 4种蛋白偏向使用A/U结尾的密码子,目前自然选择是其偏性的主要影响因素,与常用表达系统密码子偏性比较分析提示人和酵母菌是LASV疫苗制备的最优外源表达。