简介:为探索白刺花(Sophoraviciifolia)硬实形成的相关机制,采用IlluminaHiSeqTM2000高通量测序技术对白刺花种子转录组进行测序,利用Trinity软件将数据组装形成转录本,对所有转录本进行Nr(NCBInonredundantproteinsequences)、Nt(NCBInucleotidesequences)、Pfam(proteinfamily)、KOG/COG(euKaryoticorthologgroups/clustersoforthologousgroups)、Swiss-Prot(Amanuallyannotatedandreviewedproteinsequencedatabase)、KEGG(kyotoencyclopediaofgenesandgenomes)和GO(geneontology)分类和功能注释、Pathway注释,并对种子形成的代谢通路中的相关基因进行了分析。转录组共获得了333339724条初始序列,总长为335557bp,初始序列组装获得序列片段的平均长度与N50值分别为282bp和537bp;与KOG功能注释、GO分类及KEGG代谢通路分析后,获得了44840个GO功能注释、46126个KOG功能注释以及89494个PFAM注释:并从KEGG通路中找到有色氨酸代谢、半胱氨酸和甲硫氨酸的代谢途径的编码基因片段分别有66和37个。