Selección de características en entornos big data. aplicación en gene signatures

Investigación Joven(2020)

引用 0|浏览0
暂无评分
摘要
La medicina genomica es aquella que utiliza el conocimiento del genoma humano y de ciencias afines para identificar el riesgo de padecer una enfermedad, diagnosticarla precozmente y tratarla de forma personalizada. La medicina genomica ayuda a entender de forma mas precisa por que enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genomicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ambito de la genomica funcional, se destaca el analisis de perfiles de expresion genica; estos tienen como objetivo principal la identificacion de un grupo de genes, cuyo patron de expresion se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Estos son un conjunto de genes que se sospecha, podrian ser marcadores de una patologia en particular. Para evaluar la eficacia del mismo, se procesa un dataset que consta de pacientes que sufren la patologia y la expresion de los genes que estan especificados en el gene signature para cada una de estas personas, el tiempo transcurrido desde el ultimo chequeo realizado y el estado vital del paciente. Un objetivo particular de los signatures es su utilidad como biomarcador diagnostico, pronostico o predictivo de una patologia en estudio. Los biomarcadores con valor pronostico permiten una mejor estratificacion de pacientes segun su pronostico de progresion de enfermedad independientemente de una terapia, abriendo el paso a investigaciones de tratamientos adecuados para cada categoria de paciente definida. Por otro lado, los biomarcadores con valor predictivo permiten predecir si un tratamiento tendra o no efecto en un paciente, logrando evitar tratamientos en pacientes para los cuales se supone no tendran efecto positivo. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatizacion que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rapida acumulacion de datos de expresion genica de diversas tecnologias, es posible aplicar algoritmos automaticos de reduccion de dimensiones, con el objetivo de seleccionar aquellas que resulten mas representativas del conjunto de caracteristicas. Los resultados de esta seleccion podria ser interpretada como un posible gene signature. Numerosos metodos han sido desarrollados para la seleccion de caracteristicas en bioinformatica. Todavia es un desafio elegir un metodo apropiado para un problema especifico y buscar las caracteristicas de clasificacion mas razonable. No obstante, la implementacion con algoritmos paralelos no ha sido aun estudiado en profundidad. El objetivo general de este plan de doctorado es el de contribuir con el desarrollo de nuevos algoritmos de extraccion de caracteristicas en entornos Big Data que permitan la identificacion y la evaluacion de gene signatures de manera eficaz y eficiente.
更多
查看译文
关键词
gene,data,signatures
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要