基于密度峰值算法的三支聚类

JIANG Dongqin,WANG Pingxin, YANG Xibei

Journal of Jiangsu University of Science and Technology(Natural Science Edition)(2023)

引用 0|浏览0
暂无评分
摘要
传统的硬聚类要求聚类结果之间必须边界清晰,但在实际划分中常常会遇到信息不充分的情况,如果将对象强行划分到某一类簇,会带来较高的决策风险.为了解决这个问题,三支聚类采用核心域、边界域、琐碎域来表示每一个类簇,把不确定的对象放入边界域中延迟决策,以此降低决策风险,同时针对传统密度峰值算法需要手动选取参数且样本分配策略存在缺陷,提出了基于密度峰值算法的三支聚类,引入自然最近邻算法,自适应地获取每个点的邻居个数以此来定义样本的局部密度,然后基于三支阈值得到核心域和边界域,对于边界域中的数据,通过比较其与聚类中心的距离和密度做进一步划分.在UCI、Synthetic和Shape数据集上的实验结果证明:所提算法能有效提高ACC,ARI,AMI,FMI值,可以显著提升聚类效果.
更多
关键词
three-way clustering,density peak algorithm,natural nearest neighbor
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要