Prácticas bases de datos genómicas¶
Se han desarrollado numerosas bases de datos para los diferentes genomas secuenciados, pero la mayoría de ellas utilizan los mismos programas, visores y estructuras para manejar la información. En esta práctica vamos a profundizar en el manejo de bases de datos utilizando visores de genoma. Como modelo vamos a utilizar el visor del Ensembl y de la NCBI.
El objetivo es familiarizarse con este tipo de bases de datos y visores gráficos que nos permiten responden en cuestión de minutos a problemas de este tipo:
Acabas de ser contratado por una empresa de diagnostico clínico. Te solicitan
desarrollar un kit para el diagnóstico del síndrome Cinca. Tienes que
identificar el gen responsable de la enfermedad y:
1-. Un SNP intragénico y dos flanqueantes para poder hacer diagnóstico
prenatal en familias con antecedentes.
2- Listar las mutaciones más frecuentes causantes de esta enfermedad.
3- Identificar los genes parálogos y ortólogos en mamíferos
4- Identificar los genes flanqueantes (3 a cada lado).
5- Describir la estructura exón/intrón del gen e identificar todos
los transcritos.
6- Identificar los BACs que cubran ese gen
Nota: Te interesa que cuando hagas el screening en las familias la mayoría
de los SNPs tengan distintos alelos en los padres.
Manejo del Ensembl¶
Vamos a practicar con el visor de genomas del Ensembl y los datos del genoma humano. Hay una seeria de tutoriales disponibles.
Buscar la región correspondiente al gen humano SLC9A3R2. Identificar:
Región cromosómica y número de exones/intrones.
Número de transcritos codificantes y sus proteinas.
Identificar los cambios presentes en el primer exón del gen y su frecuencia en la población europea.
Catenin beta 1¶
Ahora identificar esos datos para el gen catenin beta 1.
Búsqueda de parálogos y ortólogos¶
Puedes seguir el tutorial del Ensembl para manejar la información sobre genómica comparativa.
Localiza el gen CASP5 humano y contesta a las siguientes cuestiones:
Región cromosómica y número de exones/intrones.
Número de transcritos codificantes y sus proteinas.
Parálogos de este gen. ¿Están situados en el mismo cromosoma?
Recupera el alineamiento de las proteinas de esos parálogos.
¿Se ha descrito el gen ortólogo en gorila?. Recupera la secuencia de la proteina en formato fasta.
Observa el árbol y descubre que parálogos de CAPS5 se originaron en la más reciente duplicación. Recupera el alinamiento utilizando Jalview.
Visualiza la sintenia entre humano y conejo, ¿En qué cromosoma esta localizado el ortólogo de conejo? ¿La sintenia se mantiene en esa región? ¿Y la microsintenia (considera 4 genes arriba y abajo de CASP5).
Manejo del Map Viewer¶
MapViewer es un visor de mapas de la NCBI. En el encontramos mapas genéticos, citogenéticos, físicos, etc lincados entre si y a la secuencia del genoma humano. Es una herramienta muy útil para pasar de unas coordenadas a otras y recopilar disintos tipos de datos.
Por ejemplo podemos identificar todos los clones, genes y enfermedades descritas cercanas al marcador SNP rs11934801.
Búsqueda de SNPs¶
Hemos obtenido esta secuencia
de un paciente. Utilizando el Blast y la información de la dbSNPs y el MapVier.
Identifica si hay algun SNP conocido en al región que cubre esa secuencia.
Comprueba si hay mutaciones relacionadas con al anemia falciforme.
La localización cromosómica del gen al que pertenece la secuencia.
Identifica marcadores flanqueantes situados fuera de este gen.
Identifica los genes flanqueantes.
Identifica el marcador genético del mapa deCODE más cercano.
Ejercicio final¶
Realiza el ejercicio planteado al inicio de la práctica.