药用食用菌模型灵芝的基因组序列研究外文翻译资料

 2023-01-04 03:01

药用食用菌模型灵芝的基因组序列研究

Shilin Chen , Jiang Xu , Chang Liu, etal.

中国医学科学院暨北京协和医学院药用植物发展研究所

摘要:灵芝是一种在中药中被广泛应用的药用大型真菌,具有多种生物活性物质。在这里我们利用了新一代测序技术和光学映射的方法,报道了灵芝的43.3mb基因组,编码了16113个预测基因。序列分析揭示了一系列编码细胞色素P450s (CYPs)的基因,转运体和调节蛋白在次级代谢中协同作用。在所有测序的担子菌中基因组还编码了一组最丰富的木质素降解酶,共鉴定出24个具有生物活性的CYP基因簇。此外,78个CYP基因与羊甾醇合成酶共表达,其中16个基因与特异性羟基睾酮的真菌CYPs有很高的相似性,这表明它们可能在三萜类生物合成中发挥作用。灵芝基因组的阐明使其成为研究药用真菌次生代谢途径及其调控的潜在模型系统。

灵芝又称“不朽蘑菇”,是世界上最著名的药用大型真菌之一。其药理活性得到了广泛的认可,如美国草药药典和治疗简编所示。现代药理研究表明,灵芝具有多种治疗作用,包括抗肿瘤、抗高血压、抗病毒和免疫调节等。灵芝产生了大量的生物活性化合物;到目前为止,已鉴定出400多种不同的化合物,使这种真菌成为一个生产有用生物化合物的虚拟细胞“工厂”。三萜类和多糖类是灵芝中的两大类药理活性化合物。除产生这些生物活性化合物外,灵芝也像其他白腐担子菌一样,分泌能有效分解纤维素和木质素的酶。这种酶活性对生物质利用、纤维漂白和有机污染物降解都有一定的应用价值。

尽管灵芝在传统的中医传统有着重要地位和拥有令人惊叹的生物活性物质库,但是我们对灵芝生物学的理解是有限的。本文报道了60125-1株单核灵芝的全基因组序列,并鉴定了其大量参与次生代谢及其调控的基因和潜在的基因簇。这些基因组信息有助于阐明药用真菌中多种次生代谢产物合成的分子机制。基因组序列将使灵芝作为具有药理活性的化合物和工业酶的来源并且充分发挥其潜力成为可能。

结果

基因组序列组装和注释。 我们用全基因组猎枪对灵芝单倍体菌株260125-1(补充注1和补充图S1)的基因组进行了测序。通过组装大约二亿一千八百万个罗氏454和Illumina reads(440times;覆盖范围)(表1和补充表S1),获得了43.3 Mb基因组序列。

该基因组序列由82个支架组成(补充表2),这些支架排列在13个染色体宽的光学图谱上(图1、补充表S3和补充图S2)。序列支架与光学图谱的比较说明序列的一致性大于86%,这表明基因组序列的组装质量较高。本研究共预测了16113个基因模型,与其他丝状真菌的基因组相比,其平均序列长度为1556 bp(补充表S4)。平均而言,每个预测的基因包含4.7个外显子,其中85.4%的基因含有内含子。总GC含量约为55.9%(外显子为59.0%,内含子为52.2%,基因间区域为53.7%)。重复序列约占基因组的8.15%。大部分重复序列为LTR/Gypsy(基因组的3.92%;补充注释2和补充表S5),其中约70%个基因通过对同源序列和蛋白质结构域的相似搜索(补充表S6)进行标注的。

与其他真菌基因组的比较。 将灵芝的蛋白质组预测值与其它14种序列真菌的蛋白质组进行了比较。正交MCL分析表明,灵芝中有4.5%的预测蛋白在所有其他物种中都有同源蛋白,而43.8%种蛋白是灵芝特有的;大约有35.3%种独特的蛋白质,此类蛋白质至少有一个旁系(补充数据1)。为了阐明灵芝的进化历史,我们利用这15种真菌中保存的296个单拷贝同源基因(附图S3)构建了一棵系统发育树,其拓扑结构与这15种真菌的分类一致。

灵芝的蛋白质组也由蛋白质家族(PFAM)表示描述(补充数据2和3)。利用CAFE对单蛋白家族的进化和扩张进行了研究。研究发现有几个蛋白质家族经历了扩展,包括与合成代谢、木质素降解和发育有关的家族(补充表S7)。值得注意的例子包括细胞色素P450(CYP)家族和主要促进者超家族(MFS)转运蛋白家族的扩展。由于这两个家族在代谢物的生物合成和运输中具有重要作用,它们的扩展很可能有助于了解灵芝代谢物的多样性。

根据灵芝和黄孢平革菌的保守基因顺序,共鉴定出250个同位区,分别对应于3008个基因和2986个基因。平均而言,灵芝基因组中的每一个片段包含12个基因。总共有92个区块包含了10个以上的基因。我们还检测到了与灵芝和裂褶菌共有的201个共线区。平均而言,每个区块包含9.92个基因;只有52个区块有10个以上的基因。这些真菌物种之间存在几个大规模基因组重排,如倒置和易位,表明自从这些物种与其共同祖先的差异之后,已经发生了广泛的基因组重排(补充图S4和补充说明3)。

全基因组表达分析。 对3个不同发育阶段(菌丝体、原基和子实体)(如图2A)采集的灵芝样品进行了RNA-Seq分析,将重组的转录本定位于85%个预测的灵芝基因。如图2B所示,12646个基因在所有三个阶段都有表达。将来自RNA-SEQ数据的重构的转录物映射到85%的预测的灵芝基因。如图2B所示,在所有三个阶段中表达了12,646个基因。在从菌丝体到原基(T1;左侧板,图2C)和从原基到子实体(T2;右侧板,图2C)的过渡期间,基因表达水平的范围相当宽。大量的基因(4668)在至少某个一个阶段的转变中会被上调或下调。在T1期间,属于特定围棋周期组的大多数基因表现出类似的差异表达谱。具体而言,这些基因中大约有20%被上调,其中20%被下调。而与染色质组装(GO:0006333,Go:000785和GO:0005694)和过氧化物酶体活性(GO:0005777)有关的90%多个基因在T1时被下调。在T2期间,超过90%的基因参与了胞内蛋白质转运(GO:0006886)、染色质组装或拆卸(GO:0006333)、dna整合(GO:0015074)和蛋白质运输(GO:0015031),在这一过渡过程中,核结构发生了显著变化(补充数据4)。

三萜生物合成。 三萜类化合物是灵芝中主要的治疗类化合物之一,已从灵芝中分离出150多个三萜类化合物。我们观察到不同发育阶段三萜类化合物的分布存在差异。培养的菌丝体中三萜类物质含量极低,而原生质体中三萜类含量显著增加。结果表明,在结实期(图2D),三萜类化合物的合成是通过甲戊酸途径合成的,环合步骤上游有11个酶,由灵芝中的13个基因编码。乙酰辅酶C-乙酰转移酶和法尼酰二磷酸合成酶分别由灵芝基因组中的两个基因编码,其余9种酶由单拷贝基因编码(补充表S8). 羊甾醇合成酶(LSS)是由羊甾醇合成酶(LSS)合成的,它是灵芝中三萜类化合物和麦角甾醇的常见环中间体,不同的代谢途径有14条。环化后的步骤大多还不清楚,但很可能包括一系列的氧化、还原和酰化反应。在这些反应中,细胞色素P 450超家族(CYPS)蛋白催化的氧化在羊甾醇骨架的修饰中起着重要的作用(补充图5)。

在灵芝基因组中共鉴定出219个CYP序列(197个功能基因和22个假基因),按照标准的CYP命名法将其划分为42个家族。当不考虑假基因和等位基因变异时,灵芝的CYP基因在所有测序真菌中的数量最多。采用实时PCR技术检测了197个CYP基因的表达.,共有78个基因在菌丝体向原生质体的转变过程中被上调,而在由原生质体向子实体的转变过程中表达下调。

这些基因的表达谱与LSS(相关系数(R)gt;0.9)高度相关(图3A和补充数据5),而且它们的表达谱与发育过程中三萜含量分布呈显著正相关(图2D)。提示这78个CYP基因中的一些可能与三萜类生物合成有关。其中28个基因被分类为灵芝特有的新家族,38个基因被分类为已知家族的新亚家族。其余的基因属于子家族,也见于白腐真菌和褐腐菌。根据前几份关于白腐真菌和褐腐菌的报道,我们知道CYP512和CYP5144家族中的一些酶只能有效地修饰动物类固醇激素,睾酮,从10个以上的潜在底物中检测。考虑到睾酮对由灵芝产生的三萜类化合物的结构相似性,用LSS表达的15个CYP512基因和一个CYP5144基因可能参与三萜生物合成(图3B和补充图S6),将进一步研究这些CYPJ的确切作用。

在丝状真菌中,进化有利于特定次生代谢产物的生物合成相关基因的聚类。根据所提出的生物合成途径,至少有3种CYPS参与了灵芝中羊脂甾醇的修饰,因此,为了进一步研究三萜类生物合成中可能存在的基因簇,我们对灵芝基因组中CYP基因的物理聚类进行了研究,发现有24个簇包含3个或3个以上的CYP基因(图4和补充数据6),其中2个具有与LSS共同表达的CYPS(平均相关系数gt;0.9)。然而,与6号染色体LSS关系密切的10个基因与LSS(平均相关系数=0.64)没有明显的共表达(补充图S7),表明灵芝中三萜类生物合成相关基因的结构有待进一步研究。

灵芝中其他生物活性化合物的生物合成。 多糖是灵芝中的另一类主要生物活性物质。在多糖中,水溶性1,3-beta;-和1,6-beta;-葡聚糖作为免疫调节化合物(附图S8)最活跃。灵芝编码两个1,3-beta;-葡聚糖合成酶和7个beta;-葡聚糖生物合成相关蛋白,其含有SKN1结构域(pFET35);已知这些基因在酿酒酵母中的1,6-beta;-葡聚糖的生物合成中具有关键的作用(补充表S9)。这些蛋白在灵芝、酿酒酵母、黄孢霉和褐腐菌中均是很保守的,表明它们在真菌多糖生物合成中的重要性(补充说明4)。

LZ-8是真菌免疫调节蛋白家族的第一个成员,1989年从灵芝中分离出来。 药理实验表明,LZ-8具有抗肿瘤和免疫调节活性。所有的真菌免疫调节蛋白都含有Fve结构域(PF09259.5)。 在灵芝基因组中发现编码具有fve结构域(PF09259.5)的蛋白质的两个基因(GL18769和GL18770)。GL18770编码一个已知的LZ-8蛋白,GL 18769编码一个与LZ-8同源性为73%的蛋白质。GL 18769的功能有待进一步研究。相反,在黄孢霉和褐腐霉基因组中没有发现编码fve结构域蛋白的基因,表明LZ-8可能是灵芝特有的。

灵芝基因组编码一种非核糖体肽合酶(NRPS)和五种聚酮化合物合酶(PKS)基因,包括四种还原型PKS和一种非还原型PKS。 结构域分析表明这些可能是功能性酶(补充图S9)。 与其他真菌相比,灵芝有更少的NRPSs和PKSs,表明灵芝可能不会像其他真菌一样产生非核糖体肽(NRP)和聚酮化合物(PK)。 事实上,迄今为止还没有从灵芝中分离出NRPs或PKs;因此,可能需要特殊条件来触发NRPSPKS基因表达。

萜烯合酶家族是负责单萜,倍半萜和二萜骨架生物合成的中等大小家族。 灵芝基因组共鉴定了12个萜烯合酶基因,但是三萜类化合物是迄今为止从灵芝中分离出的唯一类型。 系统发育分析表明至少有五个萜烯合酶与灰盖鬼伞菌特有的萜烯合成酶具有很高的相似性; 这些合酶分别命名为Cop1(germacrene A合酶)(GL22353,54.5%),Cop2(germacrene A合酶)(GL25909,50.3%),Cop3(gamma;-muurolene合酶)(GL24515,65.3%)和Cop4(gamma;-甲基丙烯酸合酶 )(GL20244,55.6%; GL25830,50.6%)(补充图S10)。 除了GL22395之外,所有这些基因编码长度小于400个氨基酸的蛋白质,在系统发育树上有密切的联系,说明它们都可能编码倍半萜合成酶。

在PKS,NRPS和萜烯合酶基因附近发现了一些编码(拖尾酶/末端酶)和转运蛋白的基因,这表明生物合成基因簇可能与在子囊菌中一样适用于灵芝。 近年来,越来越多的担子菌真菌被测序,这有助于理解担子菌次生代谢产物的生物合成相关基因的组织结构。

转运蛋白 转运蛋白具有多种功能,如合成代谢产物在机体中的摄取和再分布,可分为三种类型:ATP依赖转运体、离子通道和次级转运体。在灵芝中共鉴定出1063种转运蛋白,分属于134个家族。(补充资料7)。在这些转运蛋白中,248个是ATP依赖性转运蛋白,29个是离子通道,321个是次要转运蛋白;其余的是不完整的运输商。一般来说,MFS转运蛋白参与次生代谢,ATP结合盒(ABC)参与多糖和脂质的转运。在灵芝基因组中,次生转运蛋白(321)含量最高,大多数属于MFS家族(170),而49种ATP结合盒转运蛋白已被鉴定出来。一些MFS转运蛋白存在于CYP簇或其他用抗antiSMASH软件鉴定的簇中,这表明它们在次级代谢产物的生物合成中可能起着重要作用。

次生代谢的调节 次生代谢物的产生和真菌的发育受环境条件的影响。其中最著名的调节蛋白家族是天鹅绒家族,这些天鹅绒结构域蛋白也在灵芝基因组中被发现。其中两个蛋白,Vea和VelB,位于相同的序列上。这两种蛋白质与含甲基转移酶结构域蛋白LaeA相互作用,调控曲霉的二次代谢和发育。 考虑到它们在先前研究中的调节作用,我们提出了灵芝次生代谢和发育的协调途径(补充图S11)。

在灵芝中已鉴定出600多个调控蛋白(补充数据8),在与黄孢霉或公社的同源区共发现249种预测调控蛋白,表明灵芝基因调控网络的一部分可能是保守的。据报道,锌指蛋白家族蛋白参与真菌次级代谢产物的途径的特异性调节。在预测的调控因子中,117个含CCHC的蛋白,81个含C2H2的蛋白质和73个含Zn2的Cys 6蛋白已经被鉴定出来。在使用抗SMASH33或SMURF37(补充数据9和10)预测的簇中发现了6个这些锌相关蛋白。表观遗传修饰物在次级代谢的调节中也有重要作用。在灵芝基因组中共鉴定了33个GCN5相关蛋白,

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[281310],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。