结合基因-基因交互作用的表观遗传和转录生物标志物的识别及对早期NSCLC预后评分的独立验证
摘要
背景:DNA甲基化和基因表达有望成为包括非小细胞肺癌(NSCLC)在内的多种癌症的生物标志物。除了生物标志物的主效应外,复杂疾病的进展还受到基因交互作用的影响。使用多组学数据基于主效应或交互作用筛选生物标志物可提高癌症预后的准确性。
方法:生物标志物筛选和模型验证用于构建和验证预后预测模型。根据NSCLC预后相关的生物标志物的主效应或与两种组学数据的交互作用来鉴定其相关性。并验证了结合表观遗传和转录生物标志物以及临床信息的预后评分。
结果:具有基因交互作用的26对生物标志物和2个具有主效应的生物标志物与NSCLC生存率显著相关。在TCGA数据集中,与仅利用临床信息的模型相比,以表观遗传和转录生物标记为基础的3年和5年生存预后模型的准确性分别提高了35.38%和34.85%,对NSCLC的生存具有更好的预测能力。基因交互作用分别为3年和5年生存率的预测准确度贡献了65.2%和91.3%的增长。结论:整合主效应和基因交互作用的表观遗传和转录生物标志物的整合显著改善了早期NSCLC生存的预后预测。
方法和结果概述
文章整体方法流程图如下图所示:
通过质量控制,分析选取了个样本(个训练集和个检验集),包括个CpG位点和个基因。对于DNA甲基化和基因表达的主效应分析,通过ISISLASSO分别选择了23个CpG位点和13个基因。但是,只有cg显著。同样,在验证阶段和敏感性分析中,仅位于NDRG1基因中的一个基因探针很显著。
对于基因交互作用分析,作者分别从表观遗传和转录分析中观察到和40个基因交互作用。最后,在验证阶段和2个基因交互作用在敏感性分析中是显著的。
通过进行逐步回归分析,作者在多生物标志物模型中发现了一个具有主效应的CpG探针和25对具有基因交互作用的CpG探针,用于计算表观遗传分数。一个具有主效应的基因探针和一对具有基因交互作用的基因探针用于计算转录分数。调整协变量后,在验证阶段会确认生存率与表观遗传得分,转录得分,预后得分,整合得分之间的关联。
为了评估这些得分的区分能力,分别根据表观遗传得分,转录得分,整合得分和预后得分的三分位数,将验证阶段的样本分为低,中和高得分组。与表观遗传低得分组相比,中得分和高得分组分别具有4.39和21.24倍的死亡风险,如下图A所示。转录评分高的患者的生存率显著降低,如下图B所示。具有不同整合评分的患者之间具有显著的生存差异,如下图C所示。此外,如果结合年龄,性别,研究中心,临床阶段和吸烟状况等临床信息,则预后评分可明显地区分NSCLC生存率,如下图D所示。通过得分的五分位数对患者进行分类,进一步说明了预后得分的区分能力。下图E、F表现出一种有序关系:高五分位数组的患者3年和5年生存率较低,中位生存时间较短。这表明可以使用此评分系统来检测死亡率较高的患者。经协变量分层的分析进一步证实了预后评分的表现,如下图所示:
然后,作者独立验证了这些生物标志物的预测能力。发现仅具有临床信息的模型的预测能力非常有限。但是,通过添加具有主效应或基因交互作用的生物标志物,3年和5年生存预测能力分别增加了35.38%和34.85%,并且对NSCLC生存期显示出较强的预测能力。基因交互作用对3年预测的准确率提高了65.2%,对5年预测的准确率提高了91.3%,如下图所示:
作为敏感性分析,我们使用两个不同的阈值(P=0.10和0.15)重新分析了逐步回归,发现大多数选择的生物标志物与原始回归模型中的相同。另外,作者发现预后模型在LUAD(AUC3-year=0.91,AUC5-year=0.89和Cindex=0.82,95%CI:0.76-0.87)和LUSC(AUC3-year=0.85,AUC5-year=0.87和Cindex=0.82,95%CI:0.76-0.88)人群,表明所选生物标志物及其交互作用在预测LUAD和LUSC患者预后方面的有效性。在独立的TCGA数据中,评价指标Cindex也揭示了预后模型较好地预测能力。
在蛋白质分析中,TCGA中四个基因中的三个具有基因表达和蛋白质表达之间的显著相关性。此外,一个具有主效应的基因和四对具有基因交互作用的基因对LUAD存活率有显著影响。在表观遗传学分析中识别出的49个基因中,有5个基因(FOXP1,AFF3,BCL6,MAPK1和STAT3)被确定为连接度最高(连通度大于25)的枢纽基因。这49个基因富集在与癌症相关的通路,包括非小细胞肺癌通路中。如下图所示:本文整合主要作用和基因交互作用的表观遗传数据和转录组数据,使用较新颖的方法识别了生物标志物并验证其对非小细胞肺癌预后的预测作用,值得我们学习。参考文献:ZhangR,ChenC,DongX,ShenS,LaiL,HeJ,etal.Independentvalidationofearly-stageNSCLCprognosticscoresincorporatingepigeneticandtranscriptionalbiomarkerswithgene-geneinteractionsandmaineffects.Chest.;2(27).
生信分析定制服务请扫描下方