决策树模型与logistic回归模型在生活饮用水水质影响因素分析中的应用

Chinese Journal of Health Statistics(2020)

引用 3|浏览20
暂无评分
摘要
目的 使用决策树中的分类方法CHAID模型和logistic回归模型分析影响生活饮用水水质的相关因素,并比较两种模型分析结果的异同.方法 采用分层随机抽样的方法对渭南市2015-2017年452座集中式供水水厂的相关因素进行分析,并用受试者工作曲线(ROC)评价两种预测模型的效果.结果 logistic回归分析结果显示,消毒方式、正式运营时间、总投资和供水覆盖人口是水质不合格的影响因素,工程不消毒、工程运营时间越长,水厂规模(总投资和供水覆盖人口)越小,水质不合格率越高.决策树CHAID模型分析结果显示,消毒方式、总投资、供水覆盖人口、正式运营时间、监测点类型是水质不合格的影响因素,工程不消毒是水质不合格的主要影响因素.决策树模型ROC曲线下面积稍大于logistic回归模型(0.725 vs0.701,Z = 3.623,P<0.001).结论 CHAID决策树模型在水质影响因素风险评估方面有一定的应用价值,与logistic回归模型结合应用可从不同方面对水质影响因素进行分析预测,为后期饮用水的监管工作提供一定的科学依据.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要