英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
附录 A 译文
关于结直肠癌6-基因特征预后预测性的鉴定
摘 要
背景:准确和可靠的基因特征对于帮助肿瘤学家在临床实践中做出更准确的评估至关重要。在本研究中,我们提取了与结直肠癌(CRC)预后显著相关的关键mRNA,并构建了基于表达的基因特征来预测结直肠癌患者的存活情况。
方法:从癌症基因组图谱数据库中收集结肠癌病例(COAD)和直肠癌病例(READ)的mRNA表达谱和临床病理资料,研究与结直肠癌预后相关的基因表达变化。在结直肠癌/直肠癌组织和正常组织样本之间检测到差异表达的mRNA(DEMs)。通过单因素和多因素Cox回归分析,构建了mRNA基因组合特征并用于预测结直肠癌患者的总体生存时间(OS)。我们采用受试者工作特征曲线,通过计算3年和5年生存期对应的曲线下面积值来评估我们构建的模型的预后性能。为了评估基因特征在给定的癌症亚组(结直肠癌整个队列、结肠癌队列和直肠癌队列)中的表现,我们依据临床因素进行了分层分析。
结果:从结肠癌组织与正常组织样本之间和直肠癌组织与正常组织样本之间分别收集了5341个和5594个差异表达的mRNA。对结肠癌和直肠癌队列之间的共同差异表达的mRNA进行单因素回归分析,得到了14个与总体生存时间相关的共同mRNA。多因素Cox回归分析显示,其中6种mRNA(EPHA6、TIMP1、IRX6、ART5、HIST3H2BB和FOXD1)具有显著的预后价值,可以区分高风险和低风险患者,分别意味着预后不良和预后良好。分层分析将6-基因特征鉴定为预测结直肠癌患者生存状况的独立预后特征。
结论:6-基因特征可作为结直肠癌患者生存预测的独立生物标志物。
关键词:结直肠癌,差异表达的mRNA,预后,总体生存时间,基因特征,高风险和低风险
背景
结直肠癌(CRC)是全球第三大癌症相关死亡原因,约占全球癌症病例的10%[1],是中国的第四大常见癌症[2]。直肠癌(READ)和结肠癌(COAD)是基于解剖位置的结直肠癌分类。此外,直肠癌与结肠癌具有相似的分子机制[3,4]。虽然过去几十年在治疗和早期诊断方面取得了进展,但结直肠癌患者的5年生存率仍不令人满意[5]。根据年龄、性别和肿瘤淋巴结转移(TNM)分期等临床预测因子构建的预后模型代表了目前临床实践中结直肠癌的常规预后模型。然而,由于该病的高度异质性,依赖于常规临床预测因子的预后分析并不精确,导致对结直肠癌患者生存情况的预测不准确。因此,建立新的预测特征对于更有效的治疗具有重要意义。
最近,来自信使RNA(mRNA)水平的基因表达分析的基因-预后特征表明,与传统的预后因素相比,它在癌症预后方面能提供更高的准确性,从而实现了更好的个性化和更有效的治疗[6,7]。mRNA作为重要的调控分子,具有多种功能,介导包括结直肠癌在内的多种癌症[8]。许多研究检测了mRNA特征以期实现对结直肠癌预后的精准预测[9–11]。白细胞介素-6mRNA的过表达被用作结肠癌复发的预测因子[12]。激肽释放相关肽酶11(KLK11)的mRNA表达预示结直肠癌患者较差的无病生存时间(DFS)和总生存时间(OS)[13]。基质金属肽酶9(MMP-9)是结直肠癌患者术后预后和转移风险的重要特征[14]。另一项研究表明,胃泌素释放肽(GRP)具有良好的特异性和敏感性,可以更好地预测结直肠癌患者的预后和远处转移[15]。Li等人[16]认为,胃泌素释放肽和跨膜蛋白37(TMEM37)可能是结肠癌中独立的无病生存时间的预后基因。此外,我们还进行了一项荟萃分析,以评估几种已报道的结直肠癌预后基因特征的临床实用性[17]。因此,迫切需要构建新的结直肠癌相关基因预后特征来指导患者的预后分层和个性化治疗。值得注意的是,研究人员更关注识别单一的癌症相关mRNA作为候选特征,但这不能有效预测预后和选择个性化治疗。因此,识别出可以进行结直肠癌预后预测的更准确和更可靠的mRNA基因组合特征非常重要。
在先前的一项研究中,Sun等人[18]使用基因表达谱提取了与结肠癌患者预后相关的12-基因表达特征。然而,他们只分析了结肠癌患者,而没有分析直肠癌患者。因此,在这项工作中,我们分析了结肠癌和直肠癌样本,以识别出结直肠癌的预后基因。通过比较癌症基因组图谱(TCGA)数据集中癌症组织和正常组织之间的基因表达,我们发现并研究了差异表达的mRNA(DEMs)。此外,基于三个数据集(结肠癌队列、直肠癌队列和结直肠癌整个队列)的全部数据进行总体生存时间的预后分析。最后,通过充分利用癌症基因组图谱中所有与结直肠癌患者相关的基因表达,构建了与患者生存状况相关的6-基因表达特征。我们的结果表明这个6-基因特征可以作为一种很有前景的预后生物标志物来有效地预测结直肠癌患者的生存情况。
材料和方法
数据来源
来自结肠癌和直肠癌队列的RNA测序数据包括从癌症基因组图谱数据网站(https://tcga-data.nci.nih.gov/docs/publications/tcga/)获得的的647个结直肠癌样本和51个正常样本。癌症基因组图谱-结肠癌(TCGA-COAD)队列由480个结肠癌组织样本和41个相邻的正常结肠组织样本组成。癌症基因组图谱-直肠癌(TCGA-READ)队列由167个结肠癌组织样本和10个相邻的正常直肠组织样本组成。
此外,从癌症基因组图谱数据库中收集了562名有临床随访数据的患者的公开结直肠癌信息。其中,419例与结肠癌患者相关,143例与直肠癌患者相关。数据是从癌症基因组图谱数据库下载的,因而不需要得到伦理委员会的额外批准。
结直肠癌中差异表达的mRNA的鉴定
使用M值的加权截尾均值方法对原始数据进行标准化[19],并用单独的R包EdgeR(版本3.20.9)识别相邻的正常样本和结直肠癌样本之间以及相邻的正常样本和直肠癌样本之间的差异表达的mRNA[20,21]。以|log2(FC)|>1且P值<0.05 为标准筛选差异表达的mRNA。使用R包ggplot2画出火山图[22],并使用pheatmap包(版本:1.0.8,https://cran.r-project.org/web/packages/pheatmap/index.html)根据这些差异表达的mRNA的表达值进行层次聚类分析[23]。
预测基因特征的建立与风险分层研究
我们的研究方案如图1所示。选择上调和下调mRNA的交集进行进一步分析。之后,我们采用单因素Cox比例风险回归分析来研究结肠癌/直肠癌患者中差异表达的mRNA表达与总体生存时间之间的关系,以评估哪些mRNA可能是潜在的结肠癌/直肠癌的预后指标。随后,仅将结肠癌和直肠癌中符合P值<0.05和风险比(HR)>1的共同差异表达的mRNA作为候选,并采用分步多因素Cox回归模型分析,以提取具有最佳解释性和信息性的基于mRNA的预测模型。接下来,我们使用基于mRNA的预后模型来预测每个患者的风险评分,如下:风险评分=expmRNA1lowast;beta;mRNA1 expmRNA2lowast;beta;mRNA2 ··· expmRNAnlowast;beta;mRNAn 。其中“exp”代表mRNA的表达量,“beta;”代表多因素Cox回归分析得出的mRNA系数。
图1 流程图显示了我们对结直肠癌mRNA预后特征的研究方案
根据mRNA的风险评分方程,计算每个患者的风险评分,并以风险评分中位数为阈值将每个队列中的结直肠癌患者分为高风险组和低风险组[24]。采用R包“survivalROC”作出受试者工作特征(ROC)曲线,通过分析曲线下面积(AUC),根据基于mRNA表达的生物标记物,来评估生存预测的敏感性和特异性[25]。采用3年和5年时间相关的ROC曲线分析建立的定义点来评估风险评分对时间相关结果的预测价值[25]。采用Kaplan-Meier生存曲线结合对数秩检验以及R包“survival”进行单因素分析,评估高低风险组患者生存时间的差异。
其他临床参数的预后基因特征对生存预测的独立性
单变量Cox回归模型分析用于评估结直肠癌整个队列、结肠癌队列和直肠癌队列中基因特征和临床变量(包括年龄,性别,初始治疗后新发肿瘤,结肠息肉病史,残留肿瘤,病理分期转移(M)/淋巴结(N)/肿瘤(T)、肿瘤部位和风险评分)与患者的总体生存时间之间的关系的预后价值。然后进行多因素Cox回归分析,以总体生存时间为因变量、mRNA风险评分和其他临床特征等为解释变量,来探讨该基因特征的预测能力是否独立于其他临床参数。
分层分析:根据临床参数分层的基因特征的预后性能
为了评估该基因特征在所选的癌症亚组(结直肠癌整个队列、结肠癌队列和直肠癌队列)中的预后表现,我们依据临床因素进行了分层分析。将每个队列的患者分为两个亚组(如根据年龄将患者分为le;67亚组和>67亚组),然后采用基于基因特征的风险评分将每个亚组进一步分为高风险组和低风险组。采用单因素Cox回归模型和对数秩检验进行分层分析。
结果
差异表达的mRNA的鉴定
为了评估结直肠癌中的基因表达模式,我们对结肠癌样本与相邻正常样本、直肠癌样本与相邻正常样本进行了差异表达分析。当筛选标准设置为P<0.05且|log2(FC)|>1时,结肠癌样本中有2861个上调mRNA,直肠癌样本中有2944个上调mRNA,还有2456个两队列共同的上调差异表达的mRNA。此外,在结肠癌样本中共发现2480个下调mRNA,直肠癌样本中发现2650个下调mRNA,其中有2271个两队列共同的下调差异表达mRNA。火山图表示了结肠癌和直肠癌的差异表达mRNA(附加文件1:图S1)。分层聚类结果显示,依据差异表达的mRNA,结肠癌组织(附加文件2:图S2)和直肠癌组织(附加文件3:图S3)与相邻的正常组织有明显区别。
附加文件:
附加文件1:图S1 使用R包ggplot2画出火山图,显示了结肠癌和直肠癌中的mRNA表达情况。X轴是两组间平均mRNA表达量的差异。Y轴是对数转换后的错误发现率(FDR)值。上调基因用红色表示,下调基因用蓝色表示。
附加文件2:图S2 在结肠癌中的5341个差异表达mRNA。绘制了一个热图来显示差异表达mRNA的表达模式。
附加文件3:图S3 在直肠癌中的5594个差异表达的mRNA。
6-基因特征预测性检测
基于单因素Cox回归模型分析4727个差异表达mRNA(2456个共同的上调差异表达mRNA加上2271个共同的下调差异表达mRNA)和结肠癌或直肠癌患者生存情况之间的关系。在结肠癌和直肠癌队列中,分别发现了421个和76个与患者的总体生存时间显著相关的候选基因(P<0.05和风险比>1)。在这些候选基因中,有14个基因在结肠癌和直肠癌两个队列中共同存在。
随后,为了提取具有最佳解释性和信息性的预测特征,对14个候选mRNA进行分步多因素Cox模型分析,结果共有6个mRNA被确定为生存预测因子,例如EPH受体A6(EPHA6)、金属肽酶抑制剂1的组织抑制剂(TIMP1)、易洛魁同源盒6(IRX6)、ADP-核糖基转移酶5(ART5)、组蛋白簇3H2B家族成员B(HIST3H2BB)和叉头盒D1(FOXD1)。这6个基因的相关信息见表1。
表1 用于构建预后特征的6个mRNA的全部信息
EPHA6:EPH受体A6,TIMP1:金属肽酶抑制剂1的组织抑制剂,IRX6:易洛魁同源盒6,ART5:ADP-核糖基转移酶5,HIST3H2BB:组蛋白簇3H2B家族成员B,FOXD1:叉头盒D1。
对于患结直肠癌、结肠癌和直肠癌的各位患者,我们计算了他们基于6-基因表达量的生存评分,并根据截断点的风险评分中位数将这些评分分配到高风险组和低风险组。在结直肠癌队列中,以风险评分中位数作为阈值,将562例病例分为高风险组和低风险组(图2a)。图2b显示了6个选定的mRNA(EPHA6、TI
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[591025],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 通过同源建模和分子对接鉴定新型麻痹性贝类毒素结合蛋白外文翻译资料
- 葡萄糖苷酶的化学修饰对离子液体中多糖的非水均相生物催化转化外文翻译资料
- 用于预测食管鳞状细胞癌预后的铁死亡相关基因模型和列线图的开发和验证外文翻译资料
- 原发结肠癌与同期独立性肝转移的蛋白组学分析外文翻译资料
- 关于结直肠癌6-基因特征预后预测性的鉴定外文翻译资料
- 通过定点诱变增强枯草芽孢杆菌BS-5的GH5连续性内切葡聚糖酶的催化活性外文翻译资料
- 慢生长条件下大肠杆菌中FtsZ的细胞周期依赖性调控外文翻译资料
- 粉煤灰增强Fe304作为非均相催化剂用于芬顿法降解稳定化 垃圾渗滤液外文翻译资料
- 解脂耶氏酵母合成a -法尼烯途径工程及培养基优化外文翻译资料
- CRISPR/Cas9技术敲除酿酒酵母Ste5基因外文翻译资料