Estirpex
Los avances en investigación en el ámbito sanitario han sido siempre uno de los principales retos de la humanidad. Uno de los hallazgos más importantes ha sido determinar que el estudio de la secuencia de ADN permite conocer los procesos biológicos fundamentales del organismo y su funcionamiento. Hasta hace escasos años, secuenciar el ADN tenía un elevado coste económico y temporal. Ante estos problemas, surgen las tecnologías NGS, y con ellas un nuevo paradigma de secuenciación genética que permite la secuenciación del genoma o de secciones de éste a gran escala, con una importante disminución del tiempo y del coste del proceso.
La Fundación COMPUTAEX ha emprendido varios proyectos con los Hospitales Infanta Cristina de Badajoz y San Pedro de Alcántara de Cáceres, centrados en el estudio de la secuencia genética de determinados pacientes extremeños, procesadas en el centro CénitS con el supercomputador LUSITANIA. Con este proyecto se persigue ampliar las investigaciones y el trabajo ya realizado en el ámbito de la ultra-secuenciación genética y servir de repositorio piloto de información histórica que permita a los ciudadanos obtener sus árboles genealógicos, así como disponer del historial vital de sus antecesores.
- Creación de un repositorio de datos históricos y clínicos a partir de la digitalización de archivos de interés genealógico, con el fin de garantizar su conservación y para ponerlo a disposición de ciudadanos y especialistas en genética para su consulta.
- Investigación y desarrollo de soluciones que permitan a especialistas en genética profundizar en el estudio de enfermedades hereditarias, a través de filtrado, extracción y visualización de datos genómicos de alto nivel procedentes del árbol genealógico de sus pacientes.
La primera fase del proyecto ha consistido en identificar las fuentes de datos útiles para la construcción del repositorio y las implicaciones legales asociadas al tratamiento y almacenamiento de la información generada.
Para el estudio de las enfermedades hereditarias, ha sido necesario abordar con la infraestructura de CénitS las dos últimas fases del proceso de ultra-secuenciación genética:
- Análisis primario: generación de una biblioteca de clones de secciones de interés del ADN, para obtener millones de secuencias de longitud finita denominadas lecturas.
- Análisis secundario: alineamiento de las lecturas obtenidas en el análisis primario respecto a una secuencia de referencia de consenso.
- Análisis terciario: detección y anotación de variaciones de la secuencia.
Además, durante la ejecución del proyecto ha sido necesario el desarrollo e implementación de varias soluciones software que apoyasen el despliegue de la plataforma de acceso a datos históricos y clínicos:
- Base de datos de variaciones: almacena toda la información generada en el procesamiento de las lecturas de un exoma, variaciones y anotaciones.
- Software de inserción de variaciones anotadas: traslada el contenido de los ficheros resultantes del procesado de las secuencias de exomas a la base de datos de variaciones creada para tal efecto.
- Visor de variaciones: permite la consulta de variaciones y la aplicación de filtros para acotar la búsqueda de los resultados.
Estirpex forma parte de CENITAL, un proyecto de innovación e investigación desarrollado bajo el Programa Operativo FEDER Extremadura 2007-2013, dentro del Eje 1 "Desarrollo de la Economía del Conocimiento".