挖掘微阵列数据集中的最大局部保守基因聚类

ADMA'06 Proceedings of the Second international conference on Advanced Data Mining and Applications(2006)

引用 1|浏览0
暂无评分
摘要
提出了一种新的基因聚类模型LC-cluster(局部保守基因聚类).其思想来源于当前的bicluster模型和emerging模式,但有着本质的不同.一个基因的表达水平被称为局部保守,如果它只在所有给定条件中的一部分(而非全部)上保持相似的"丰度".一个LC-cluster中的样本可能对应着某种显型,其中的基因是与这种显型密切相关的候选基因.设计了两种有效的基于树的聚类算法FALCONER和E-FALCONER,来挖掘提出的LC-cluster.从多方面分析了该算法的性能,并将其用于真实表达数据集及人造数据集聚类.理论分析和实验结果表明:①算法能有效且高效地发现大量具有生物意义的局部保守基因聚类;②算法性能优于同类的基于穷举树的聚类算法.
更多
查看译文
关键词
test result,similar abundance,complete set,novel type,local conserved gene cluster,expression level,maximal local conserved gene,synthetic datasets,efficient algorithm,microarray data,maximal lc-clusters,gene cluster
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要