Bioinformatics at COMAV

ALINANEAMIENTOS MULTIPLES

Definición y diferencias frente a los alineamientos de 2 secuencias

Hablamos de alineamientos multiples (MSA) cuando tratamos con mas de dos secuencias. Este tipo de alineamientos requiere un abordaje más complejo que el de pares de secuencias ya que el uso directo de los estadísticos de alineamiento global y local requiere una gran capacidad de cálculo y solo es aplicable a problemas con muy pocas secuencias.

El principal problema que nos plantean los alineamientos múltiples es la posición de los gaps en el alineamiento. En el alineamiento, todas las secuencias tienen que tener la misma longitud y eso se consigue introduciendo gaps.

_images/fig4_0.bmp

Algoritmos de construcción progresiva

Los programas más utilizados se basan en este tipo de estrategias. No nos garantizan que el alineamiento obtenido sea el mejor posible, pero son capaces de encontrar una solución óptima de forma muy eficaz. Ejemplos de programas basados en estos métodos heurísticos: ClustalW y T-coffe.

El método consiste en primero realizar alineamientos de dos en dos. A partir de estos alineamientos se construye una matriz de distancias entre las secuencias y un árbol guía basado en estas distancias. Mediante este árbol podemos encontrar las parejas de secuencias más similares.

Al alineamiento del par de secuencias más similar se va añadiendo el resto de secuencias o alineamientos por el orden determinado por el árbol guía.

_images/arbol.png

En nuestro ejemplo anterior :

DISTANCIAS:

IMPRESIONABLE X IMPRESO 7/13

IMPRESIONABLE X INCUESTIONABLE 10/14

INCUESTIONABLE X IMPRESO 4/14

El primer alineamiento seria: Incuestionableximpresionable.

IMPRES-IONABLE
INCUESTIANABLE

Posteriormente uniría Impreso

IMPRES-IONABLE
INCUESTIONABLE
IMPRES--O-----
_images/alin_progresivo.png

Los programas derivados del clustal (ClustalW y ClustalX (versión gráfica)) incorporan un sistema de puntuación del alineamiento. La puntuación esta basada en la distancia genética entre cada secuencia y la raíz del árbol, teniendo en cuenta la puntuación por los cambios de aminoácidos o nucleótidos. Además de esta puntuación, los gaps y la extensión de los gaps están penalizados. La puntuación del alineamiento global será la suma de la puntuación de los alineamientos de parejas de secuencias. El ClustalW tiende a situar los gaps entre las zonas altamente conservadas en vez de separar estas regiones.

_images/fig4_2.bmp

Fig. Alineamiento de tres secuencias altamente conservadas

_images/fig4_3.bmp

Fig. Alineamiento con gaps

Problemas de los alineamientos de construcción progresiva

Los mayores problemas de este tipo de alineamientos derivan del alineamiento de la primera pareja. Si las dos primeras secuencias son cercanas (muy similares) el alineamiento base probablemente contenga pocos errores. En cambio, si estas dos secuencias son muy divergentes el alineamiento obtenido no será muy adecuado y los gaps y errores se propagarán al resto de secuencias añadidas puesto que este primer alineamiento ya no es modificado al unirse el resto de alineamientos. Para paliar este problema es mejor alinear secuencias del mismo tamaño es decir incluir únicamente en el alineamiento aquellas regiones presentes en todas las secuencias ya que el programa intentara alinear toda la longitud de la secuencia introduciendo gaps en el resto.

Este tipo de alineamientos funciona correctamente para secuencias con cierto grado de conservación y que varíen de forma más o menos continua. Pero a pesar de estos inconvenientes, este tipo de algoritmos suelen encontrar una buena solución con pocos recursos, permitiendo el análisis de muchas secuencias.

Utilidades de los alineamientos múltiples

Los alineamientos múltiples son una herramienta fundamental. Estos alineamientos son imprescindibles para realizar estudios posteriores, como por ejemplo:

  • estudios evolutivos,

  • análisis de dominios conservados,

  • estructuras secundarias,

  • reconocimiento de regiones conservadas en promotores, etc.

Edición de alineamientos multiples.

Los alineamientos múltiples generados por estos programas son ficheros de texto que en principio podríamos editar con cualquier editor. Pero algunos formatos no resultan cómodos para ser manejados por un editor de texto o el número de secuencias o su longitud complican la edición.

Existen programas especializados para editar alineamientos, uno de los mas completos es el Bioedit , el cual nos permite además enlazar con diferentes aplicaciones como Blast, primer3, etc. Es un editor gráfico que funciona en windows y, además, es bastante intuitivo en su uso.

Ir a la práctica del tema