基于WGCNA和SVM-RFE算法挖掘肺腺癌诊断和预后基因标志物

Wang Mei, Wang Ke-Xin,Tan Jian-Jun,Wang Jing-Jing

PROGRESS IN BIOCHEMISTRY AND BIOPHYSICS(2022)

引用 2|浏览2
暂无评分
摘要
目的 肺癌是世界上最常见的癌症之一,在众多肺癌患者中,肺腺癌(lung adenocarcinoma,LUAD)的死亡率最高.基因表达谱的变化与肿瘤的发生和发展过程有关,通过识别与LUAD患者相关的诊断和预后基因标志物,可以为肺腺癌的预防和治疗提供理论依据.方法 本研究以肿瘤基因组图谱(The Cancer Gene Atlas,TCGA)数据库为基础,采用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)、差异基因分析、coX回归分析、蛋白质互作网络(protein-protein interaction,PPI)分析等方法筛选与LUAD形成过程高度相关的hub基因.将TCGA和基因型组织表达(GTEx genotype tissue expression,GTEx)数据库中的RNA数据合并划分为训练集和内部验证集,利用基于支持向量机的递归特征消除算法(support vector machine recursive feature elimination feature,SVM-RFE)构建诊断模型并进行验证.GSE32863和GSE31210数据集分别用于验证诊断模型的准确性和基因标志物的预后价值.结果 SVM-RFE算法得到的5个基因标志物(anln、cenpa、plk1、tpx2、cdca3)模型在LUAD患者分类中具有显著的诊断能力.功能富集分析表明,这5个基因与肿瘤发生发展的生物学过程密切相关.此外,这5个基因高表达的LUAD患者的预后表现不良,死亡率显著高于低表达的患者.结论 我们的研究为LUAD的诊断和预后提供了具有5个基因特征的模型,这对于开发用于精确治疗的新靶点具有重要意义.
更多
查看译文
关键词
lung adenocarcinoma, gene signature, WGCNA, SVM-REE
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要