基于R语言caret包构建模型在原发性肺癌诊断中的应用

Chinese journal of experimental surgery(2019)

引用 0|浏览6
暂无评分
摘要
目的 构建原发性肺癌诊断模型并挖掘相关血液学标志物的诊断价值.方法 通过随机森林对数据进行特征选取,基于选取出的变量构建C5.0分类预测模型.利用受试者工作特征(ROC)曲线分析各个变量的诊断效能.结果 采用随机森林,获取对模型贡献度排列前10的变量:癌胚抗原(CEA)、细胞角质蛋白19片段(CYFRA21-1)、碱性磷酸酶(ALP)、神经元特异性烯醇化酶(NSE)、白蛋白(ALB)、糖类抗原125(CA125)、红细胞分布宽度(RDW)、甲胎蛋白(AFP)、红细胞压积(HCT)、嗜中性粒细胞百分比(NEU%).基于训练集数据构建GBM模型,模型预测的ROC曲线下面积为0.899,准确度为81.25%;重复1 000次C5.0模型获取的平均预测准确度为80.58%.根据C5.0分类预测,贡献度排列前10的变量在良性对照与肺癌比较时,差异均有统计学意义(P<0.01).结论 原发性肺癌诊断模型的诊断效能优于单个指标,为临床提高肺癌的诊断效率提供了新的手段.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要