脑胶质瘤铁死亡相关基因标记预测预后和免疫治疗

Abstract

脑胶质瘤是一种具有高侵袭性的脑肿瘤,高侵袭性使得患者的预后和治疗效果不佳。细胞死亡在癌症的治疗中具有好的前景。铁死亡,一种最近发现的调控细胞死亡类型,可以被诱导杀死脑胶质瘤细胞。然而,在脑胶质瘤中预测铁死亡相关基因的预后仍然难以捉摸。

Introduction

脑胶质瘤仍然是最流行的原发性恶性中枢神经系统肿瘤。根据世界卫生组织分级,可以分为四个等级。其中Ⅱ,Ⅲ级为低级别胶质瘤(LGG),Ⅳ级为胶质母细胞瘤(GBM)。GBM患者常伴随着不良的预后。GBM具有很高的倾袭性,其中位生存期只有16个月,而LGG患者的生存期在1~15年不等。在现有的治疗方案下,胶质瘤仍具有很高的治疗抗性和复发率。先前的研究已经发现了一些分子标志物,如IDH(异柠檬酸脱氢酶)状态,1p/19q共缺失等等可以运用在分子病理的诊断,治疗以及预后的评估。然而,目前为止许多脑胶质瘤的分子标志物在临床实践上收效甚微。因此,我们需要探索新兴的分子标志物用于预测脑胶质瘤的预后。

细胞死亡是一个关键的事件,参与恶性转变和肿瘤转移的过程。铁死亡是一种新发现的细胞程序性死亡的模式。通常,铁死亡细胞表现出线粒体的异常(大小和凝聚膜),铁-依赖致死脂质过氧化物的积累和一组基因表达比如GPX4,ASCL4,AIFM2等。也有一些已经被证实的铁死亡抑制剂(如铁抑素-1,利普司他-1)和诱导铁死亡复合物(如RSL3)。其中需要注意的是,对于一些癌细胞,一些靶向传统细胞死亡过程的化合物可以有效治疗。这表明铁死亡在脑胶质瘤的治疗上,具有很大的前景。

除了上述之外,铁死亡细胞也伴随着促炎性细胞激素的释放。事实上,不同于凋亡,由于损伤相关分子模式,铁死亡似乎更具有免疫原性,这反而又会加剧炎症反应。特别的,T细胞介导的铁死亡能够发挥强效的抗肿瘤作用,这可以直接证明铁死亡与免疫之间的关系。然而,在脑胶质瘤中对于铁死亡和免疫之间一个全面综合的分析还没有被很好地描绘。

这里,我们旨在利用铁死亡相关基因(FRGs)标志,预测脑胶质瘤的预后和免疫治疗。

Result

图一总结了数据分析的管道流程图。数据集和分析方法见Method。

图1

一.REMBERANDT 和TCGA队列中FRGs的分布情况。

我们从REMBERANDT 队列和TCGA队列(验证集)中分别描述FRGs分布情况。

一方面,在REMBERANDT队列中,除了ALOX12,ALOX15外,FRGs在GBM,LGG和NON-GROUP中具有显著的表达差异(图2A)。同时,PCA分析显示,基于FRGs的差异表达可以很好地区分以上三个组(图2B)。另一方面,利用TCGA队列也可以很好地验证FGRs的区分效果。我们发现,在大约45.15的脑胶质瘤患者中展示FRGs的top20突变,TP53突变具有最高的比例(42%),而其他的19个突变比率在0~2%之间。同时,CNV(拷贝数变异)分析显示,HSPB1拥有最显著的拷贝数扩增,9个FGRs:AKR1C2, AKR1C1, AKR1C3, ZEB1, ALOX5, CISD1, NCOA4, AIFM2, and GOT1拥有最广泛的拷贝数缺失(图2D)。59个FGRs在CNV的位置和突变频率如图2E所示。这些结果表明,FGRs在不同级别的脑胶质瘤中发生了显著的差异表达和突变。

图2

二.在REMBERANDT队列中构建FGRs相关的风险分数

下一步,我们探索FGRs是否与脑胶质瘤患者的预后相关。如图3A所示,我们将FGRs分为五个类别,包括:铁离子代谢,油脂代谢,氧化剂代谢,能量代谢和其他类。值得注意的是,除了GCLC外,大多数关联氧化剂代谢的基因都是患者生存期的风险因子。此外,我们基于FGRs进行了无监督聚类。我们尝试构建聚类分析范围从2~5,发现聚类数为2可以很好地区分脑胶质瘤患者(图S2)。其中,簇1较簇2而言,展示了更好的预后(图3B)。

为了更好地将FRGs运用于个体化的评估,我们使用风险分数构建了RSF模型。如图3D所示,簇1的风险分数小于簇2。使用COX回归分析表明,风险分数是一个和胶质瘤分级相似的独立的预测因子(图S3A)。如图3E所示,低风险分数的组中位生存期位41.9月,是一个很好的临床结果。根据风险分数的中位数,分为高低组。此外,在不同等级的脑胶质瘤患者中,高风险分数的组显示更差的OS,分别在Ⅱ,Ⅲ,Ⅳ级胶质瘤中为75.3,15.3,12.5个月(图3F)。模型的ROC曲线展示了很好的预测效果,其1,2,5年的AUC曲线值分别为0.74,0.86和0.89(图3G)。

图S2
图3

三.在CGGA和TCGA队列中验证FGRs相关风险分数

我们接下来在CGGA和TCGA队列中验证风险分数的预测效果。与REMBERANDT结果一致,风险分数在CGGA和TCGA队列中是独立的预后因子。除此之外,高风险分数的患者在两个队列中显示了差的中位生存期(图4A,G)。在不同等级的胶质瘤中,高风险组表现更短的OS(图4B,H)(除了CGGA-352 的Ⅱ和Ⅳ以及TCGA的Ⅳ级,具有较不显著的P值)。

除此之外,我们还在CGGA队列中分析风险分数在病理等级,IDH状态和1p/19q共缺失状态情况。有趣的是,我们的结果表明,Ⅳ级,IDH野生型和不伴随1p/19q共缺失的患者具有高的风险分数(图4D-F,J-I)。在CGGA-693队列中,通过整合风险指数,病理等级,IDH状态和1p/19q共缺失状态建立了诺谟图模型(图S5A)。我们发现这个模型在CGGA队列中可以很好地预测患者1,3,5年的OS。在CGGA-693队列中,对比分析基于WHO分级(AUC1,3,5年:0.77,0.78,0.78),加入风险分数的诺谟图模型拥有更好地预测值(AUC1,3,5年:0.81,0.84,0.83)(图S6A-C)。在CGGA-325中也可以观察到相同的结果(除1年生存期没有统计学意义)(图S6D-F)。

总之,这些数据证实了风险分数在脑胶质瘤中具有重要的预测作用。

图4
图S5
图S6

四.利用REMBERANDT队列的风险分数评估脑胶质瘤的免疫治疗

先前已有报导表明铁死亡进程涉及肿瘤的免疫治疗,所以我们接下来想要探索是否可以通过生物信息学来研究铁死亡和脑胶质瘤免疫的关联。在高风险分数组中的免疫分析中,发现了大量先天免疫浸润细胞包括:天然杀手细胞,巨噬细胞,肥大细胞,MDSC,浆样树突细胞(图5A)。我们使用ssGSEA算法将免疫分数定义为23种类型免疫细胞,斯皮尔曼相关分析表明定义的类别与高分数风险组具有很强的相关性(图5B)。

癌症的免疫循环是一个关键的评价趋化因子系统和免疫调节器生物学功能指标。在高风险组中,免疫循环被激活上调的步骤有:释放癌细胞抗原(step1),癌症抗原的呈递(step2),免疫细胞的招募(step4)(CD4 T,TH1,Th22,巨噬细胞,单核细胞,嗜中性粒细胞,嗜碱细胞,NK和B细胞的招募)和T细胞识别癌细胞(step6)(图5C)。令我们震惊的一个结果是,杀死癌细胞(step7)在高风险组中弱于低风险组,这可能是由于PD-L1的高表达导致的(图5D)。除此之外,我们分析了高风险组与ICB(免疫检查点阻断)相关通路的关系。我们发现,除系统性红斑狼疮外,高风险组患者与ICB相关的阳性特征具有强的正相关性(图5E)。总之,这些数据表明,与FGRs相关的风险分数可以很好的预测脑胶质瘤中的免疫治疗。

图5

五.在TCGA和CGGA队列中通过风险分数验证脑胶质瘤的免疫治疗

接下来,我们通过TCGA和CGGA队列验证脑胶质瘤中的免疫治疗。我们证实,免疫分数和风险分数具有正相关性(图6A,D,G)。在免疫循环方面,在高风险组中,我们证实了释放癌细胞抗原(step1)和免疫细胞的招募(step4)(CD4 T,TH1,Th22,巨噬细胞,单核细胞,嗜中性粒细胞,嗜碱细胞,NK和B细胞的招募)(图6B,H,E)。除此之外,在TCGA和CGGA队列中,高风险组患者表现出高表达PD-L1(图6C,F,I)。有趣的是,在高风险组中,我们也找到了与脑胶质瘤预后相关的免疫学指标(PD-1,CTLA4,IDO-1)(图6C,F,I)。与训练集一致,验证集中的高风险分数组与ICB相关特征呈正相关。除此之外,我们还在TCGA队列中分析了与ICB治疗相关的肿瘤突变负荷(TMB),免疫原性突变,DNA甲基化干性指数(mDNAsi)和RNA甲基化干性指数(mRNAsi)其中。除mRNAsi在低风险分数组表达高外,其他都在高风险分数组表达更高(图S8A-D)。总之,这些结果再次证实了风险分数在胶质瘤免疫治疗方面的关键作用。

图6
图S8

Conclusion

我们探究了一种新的FRGs相关的风险分数用于预测脑胶质瘤患者的预后和免疫治疗。

Method

Data

  1. GEO数据:GSE108474-REMBRANDT
  2. TCGA数据:TCGA-LGG,TCGA-GBM
  3. CGGA 数据:CGGA-693,CGGA-325

其中,GEO-REMBRANDT数据为训练集,TCGA数据和CGGA数据为验证集。REMBRANDT从CEL文件转换为表达谱文件,TCGA/CGGA数据集从FPKM转换为TPM。

Unsupervised clustering

铁死亡进程涉及中断氧化剂代谢的功能障碍,铁代谢,脂质代谢,能力代谢和其他未分类因子。根据先前已有的文章,我们选择了60个FRGs,但是由于NOX1在REMBRANDT数据集样本中表达很低,所以选择了59个用于聚类。

选用R包Consensu Cluster Plus,通过k-means进行无监督聚类。

DEGs

用R包limma进行差异基因的分析,挑选差异基因阈值为调整后P值<0.05和log2FC>2。

Immune checkpoint blockage

用于预测免疫检查点阻断反应的基因集来自Mariathasan and his colleagues。Hallmark,KEGG,GO基因集从Molecular Signatures数据库下载,其中分析使用R包GSVA。

Tumor immune microenvironment (TIME)

免疫微环境的特征包括免疫细胞浸润,抗肿瘤免疫循环的激活和免疫检查点的表达。我们从Charoentong研究中获取667个免疫调节器相关细胞。抗癌免疫周期的激活包括七个步骤,包括癌细胞抗原的释放(步骤1)、癌抗原呈递(步骤2)、启动和激活(步骤3)、免疫细胞向肿瘤的运输(步骤4)、免疫细胞向肿瘤的浸润(步骤5),T细胞识别癌细胞(步骤6)和杀死癌细胞(步骤7)。我们从Xu的研究中获取免疫检查点L1, PD‐1, CTLA‐4, 和IDO‐1。

The risk score based on FRGs by random survival forest (RSF)

RSF模型是一种树状集成模型,可以适用于随机森林用于右删失的数据和生存分析。使用上述提到的59个FRGs在REMBRANDT构建RSF。在R包randomForestSRC中使用rfsrc函数生成基于FRGs的RSF。

Reference:Ferroptosis‐related gene signature predicts prognosis and immunotherapy in glioma