利用半监督降维算法预测蛋白质亚细胞位置

Journal of Shanghai Second Polytechnic University(2015)

引用 0|浏览2
暂无评分
摘要
首先采用伪氨基酸组成(PseAA)和特定位点记分矩阵(PSSM)2种方法组合的特征提取方法来表达蛋白质序列.通过该方法将蛋白质序列转化成特征向量,虽然该向量在很大程度上保留了蛋白质序列的原始信息,但是它产生的相应的维数会很高,这使得蛋白质亚细胞位置的预测过程变得很复杂.同时,就目前的情况来看,想要获取大量已标记的蛋白质亚细胞位置样本也很困难.为了解决这些问题,提出采用半监督降维算法(SS-MVP)对特征向量进行降维的同时能从标记和未标记的样本点中提取对分类有用的信息.基于降维后的样本利用支持向量机(SVM)的算法来预测蛋白质亚细胞位置类型.实验结果表明,采用上述方法既能简化蛋白质亚细胞位置的预测系统,又能提高其分类性能.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要