基于深度学习和字符嵌入的细胞穿透肽预测

Computer Simulation(2019)

引用 1|浏览2
暂无评分
摘要
针对传统细胞穿透肽的预测方法严重依赖于繁琐的特征抽取和特征重建步骤、算法复杂且准确度不高等问题,提出了一种利用自然语言处理中的字符嵌入方法结合CNN-LSTM组合机器学习框架来预测细胞穿透肽的方法.方法 采用字符嵌入将氨基酸的代表字符通过网络学习映射到紧凑表示的向量空间中,每种氨基酸字符对应一个紧凑表示的向量,然后将肽序列通过由训练得到的嵌入向量转化为数值矩阵作为CNN-LSTM模型的输入,模型自行抽取特征后自动对输入序列的细胞穿透性进行预测.实验结果显示,在相同数据集进行实验时,研究的方法在测试集上的AUC (the area under ROC curve)值达到0.97,正确指数达到0.846,优于其它方法,说明上述方法能够简单、高效地进行细胞穿透肽的预测.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要