Evolución paralela del código genético en genomas mitocondriales de artrópodos

Por Federico Abascal, David Posada, Robin D. Knight, Rafael Zardoya

Traducido por Germán González

El código genético provee la tabla de traducción necesaria para transformar la información contenida en el ADN al lenguaje de proteínas. En esta tabla, la correspondencia entre cada codón y cada aminoácido es establecida: el ARNt es el adaptador principal que une a ambos. Si bien el código genético es casi universal, diversas variantes de este código han sido descriptas en un amplio rango de sistemas nucleares y de organelas, especialmente en la mitocondria de animales pluricelulares.

Estas variantes son generalmente encontradas buscando posiciones conservadas que con frecuencia codifican para un aminoácido alternativo en nuevas especies. Hemos ideado un preciso método computacional para automatizar estas comparaciones, y lo hemos probado con el genoma mitocondrial de 626 animales pluricelulares. Nuestros resultados indican que varios artrópodos tienen un nuevo código genético y traducen el codón AGG como lisina en vez de serina (como en el código genético mitocondrial de los invertebrados) o arginina (como en el código genético estándar). Hemos investigado la evolución del código genético en artrópodos y encontramos varios hechos de evolución paralela en los cuales el codón AGG era reasignado entre serina y lisina. Nuestro análisis también reveló una correlación entre los códigos genéticos de artrópodos y el ARNt-Lis/Ser, lo cual muestra puntos de mutaciones específicos en los anticodones. Estas mutaciones bastante simples, junto con el bajo uso del codón AGG, pueden explicar la repitencia de las reasignaciones AGG.

Introducción

Una de las propiedades más notables del código genético es que es el mismo en la mayoría de los organismos. Esta notable conservación sugiere que fue establecido tempranamente en la evolución de la vida en la Tierra, antes de la división de los tres principales dominios [1] y ha permanecido constante desde entonces. Este código no es aleatorio, varios estudios han relacionado la forma del código genético canónico con propiedades estereoquímicas de aminoácidos y codones, minimización del impacto de mutaciones y relaciones biosintéticas entre diferentes aminoácidos (reseñado en [2]).

A pesar de que el código genético canónico es óptimo, existen diversas variantes. Esto incluye variantes nucleares en ciertos ciliados y levaduras, y especialmente, variantes en mitocondrias de metazoarios, donde ya han sido identificados diez códigos diferentes [3]. En animales, la mitocondria tiene genomas compactos que típicamente codifican solo 13 proteínas involucradas en la respiración oxidativa [4]. La presión para reducir el genoma de la mitocondria, el cual afecta el numero de genes de ARNt, puede explicar la alta frecuencia en reasignaciones de codones (cambios de significado) en estas organelas [5]. El pequeño tamaño de los genomas mitocondriales puede también explicar porque estas reasignaciones son bastante más toleradas que los efectos dañinos.

Sin embargo, la mayoría de las reasignaciones en mitocondrias son conservadas dentro de cada estirpe (phylum o filo). Esta conservación ha sido interpretada para pensar que las reasignaciones son raras y que cada reasignación particular proviene del mismo hecho evolutivo.
Aquí, nosotros demostramos que la disponibilidad de un gran número de genomas mitocondriales completos permiten realizar estudios de alta resolución sobre la evolución del código genético, revelando que la reasignación de codones puede ser mucho más común que lo que se pensaba previamente.
Los códigos no-estándares surgen usualmente de cambios en el ARNt [6], y algunos codones al parecer son reasignados más frecuentemente que otros [5]. Por ejemplo, los codones (AGR) AGA y AGG, que corresponden a Arginina (Arg) en el código estándar son particularmente flexibles y han sido reasignados a serina (Ser), glicina (Gly) y codones de stop en diferentes linajes metazoarios. Trabajos previos sugieren que el cambio de Arg a Ser ocurre solo una vez en la base de la Bilateria, y los posteriores cambios tuvieron lugar dentro de deuteroestomas [3].

Varios mecanismos, además de la pérdida del ARNtArg (tRNAArg [7]) ancestral han mostrado que contribuyen a la reasignación AGR en metazoarios. Reasignaciones de AGA a Ser pueden ser relativamente más fáciles de cambiar, porque uno de los ARNt isoaceptores de serinas normalmente tiene un anticodón GCU. Este anticodón que usualmente hace pareja con AGC/AGU, puede también hacer pareja con el codón AGA a través de apareamientos no canónicos bajo ciertas condiciones [8]. Las reasignaciones de AGG a Ser han sido explicadas en términos de la metilación de la guanosina del anticodón ARNt-Ser GCU, que le permite aparearse con AGG [8,9]. Los codones AGR pueden también ser reasignados a Gly en urocordados a través de la aparición de un nuevo ARNt-Gly con anticodón UCU[10]. El uso de AGR como codones de stop (o de parada) en ADN mitocondrial de vertebrados puede deberse a alteraciones en los factores de traducción [11] o en el ARNr [12]. En Porifera, los codones AGR tienen el significado estándar Arg porque un nuevo ARNt-Arg es reclutado de una familia diferente de isoaceptores [13], sugiriendo que el nuevo ARNt reemplaza al ARNt-Arg original sin cambiar de función o que la reasignación original de AGR a Ser ocurre incluso antes, en la base de los metazoarios.

Los cambios en el ARNt explican como, pero no porqué, la mayoría de las reasignaciones de codones tienen lugar. Varias hipótesis tratan esta última cuestión. El modelo de captura de codón [14] propone que mutaciones pueden eliminar codones específicos del genoma entero y entonces, por evolución neutral, mutaciones en otras moléculas de ARNt puede hacerlas capaces de reconocer tales codones, de tal manera que cuando estos codones reaparecen en el genoma su significado ya ha cambiado. En cambio, la hipótesis del intermedio ambiguo [15] sugiere que las mutaciones en las regiones, con excepción del anticodón ARNt, puedan inducir a que un codón sea ambiguamente traducido por más de un ARNt y que más adelante el reconocimiento de ese codón por el ARNt mutante se puede fijar gradualmente por la selección natural que conduce a la reasignación del codón. Diversos ejemplos se han citado como ayuda para ambas hipótesis [16,17].

Las variantes en el código genético son generalmente encontradas por análisis comparativos de secuencias. Cuando un codón particular aparece en los sitios de la proteína en los cuales un aminoácido específico se encuentra constantemente en otras especies relacionadas (por ejemplo, referencia [18]), la explicación más probable es que se ha reasignado este codón, aunque los fenómenos tales como la corrección del ARN (RNA editing) hacen tales inferencias peligrosas para los genes individuales. Hemos automatizado este proceso comparativo, permitiendo que lo apliquemos a una gran cantidad de genomas.

 

Resultados

Nuestro método computacional para la asignación de codones, descrito con mayores detalles en la sección Materiales y Métodos, detecta automáticamente variantes del código genético en animales. Para cada codón de cada especie, probamos cuales aminoácidos son encontrados más frecuentemente en posiciones homólogas en otras especies. Entonces, predecimos que el aminoácido más frecuente es la traducción de ese codón. Como las regiones pobremente conservadas introducen algo de ruido en la predicción, usamos un umbral basado en la entropía para eliminar columnas variables de los alineamientos (ver la sección de Materiales y Métodos). Aplicamos este método a cada uno de los 626 genomas mitocondriales animales disponibles en el NCBI (www.ncbi.nlm.nih.gov) para asignar automáticamente su código genético.

Precisión de la predicción computacional del código genético

Para probar la validez de nuestro enfoque, comparamos las asignaciones automáticas con los códigos genéticos provistos en GenBank para cada especie. Asumiendo que las predicciones que no son concordantes con GenBank son erróneas (una suposición que es usual, pero no siempre correcta) fuimos capaces de estimar la precisión del método.
En la Figura 1 graficamos la cantidad de predicciones concordantes/no concordantes así como el número de codones no predichos (aquellos que no fueron observados en las posiciones debajo del umbral de entropía) para cuatro umbrales de entropía diferentes (S).

Figura 1. Rendimiento del Método de Asignación de Codón. El número de asignaciones concordantes (diamantes) y no concordantes (cuadrados) con registros de GenBank, asi como el número de codones que fueron dejados sin predecir (porque no había observaciones para ellos; triángulos) son mostrados en diferentes umbrales de entropía. DOI: 10.1371/journal.pbio.0040127.g001

En general, la mayoría de las asignaciones de codones fueron concordantes con los registros en GenBank (por ejemplo, 98,4% para S, 2) indicando que el método es muy preciso. Esta figura también ilustra como bajos umbrales más permisivos (por ejemplo, S, 4.32) el número de codones no predichos decrece. Esta disminución ocurre porque menos columnas de alineamientos son descartadas y más observaciones de codones se encuentran disponibles, por esto entonces el método es capaz de asignar codones menos abundantes. Por otra parte, como las columnas con más variabilidad son usadas para inferir el significado de un codón bajo umbrales más permisivos la tasa de asignaciones erróneas aumenta.
De la misma manera, removiendo columnas ricas en gaps (interrupciones o huecos) obtenemos un incremento en las predicciones concordantes, a pesar de un pequeño decrecimiento en el número total de predicciones (datos no publicados).

Excluyendo columnas con más de un 20% de interrupciones, umbrales entre 1 y 2 representan el balance más apropiado entre especificidad y sensibilidad. Para análisis adicionales, seleccionamos el umbral S = 2 porque provee la cantidad más alta de asignaciones correctas (36.966), y un número aceptable de codones no predichos (173 codones, 0.004%).
Para caracterizar estas asignaciones que no fueron concordantes con los registros de GenBank, graficamos el número de observaciones (número de codones) contra la intensidad de la señal (frecuencia de aminoácidos) manteniendo cada asignación de codones (Figura 2). Las asignaciones concordantes (diamantes azules) fueron usualmente predichas basándose en un gran número de observaciones de codones y/o columnas de alineamientos en los cuales la mayor frecuencia de aminoácidos fue especialmente común aunque la variabilidad fue considerable. En cambio, la mayoría de las asignaciones no concordantes (cruces rosadas) corresponden, por ejemplo, a predicciones basadas en bajos números de observaciones de codones o bajas frecuencias de aminoácidos, son predicciones poco fiables.
Hemos notado que la mayoría de la predicciones no concordantes ocurren en platelmintos y nematodos. (Tabla 1).

El favoritismo taxonómico puede ser explicado por la divergencia extrema entre esta especies y el resto de los metazoarios, lo que tiene el efecto de reducir el número de sitios conservados entre ellos. De hecho, restringiendo el análisis para incluir solo platelmintos y nematodos se reduce considerablemente el número de predicciones no concordantes en estos filos (datos no publicados).

Un nuevo código genético en artrópodos

Extraordinariamente, algunas asignaciones no concordantes ocurrieron con un número intermedio de observaciones de codones y una alta frecuencia de aminoácidos (algunos de los triángulos amarillos en la figura 2), en una región en la cual las asignaciones fueron casi todas correctas. Todas estas observaciones corresponden a cambios en el codón AGG, el cual se traduce a Ser de acuerdo al Código Genético Mitocondrial de los Invertebrados (IMGC), pero fue predicho que se transcribía como Lys en la región de alta confianza de varios artrópodos.
En otros artrópodos se predijo el mismo cambio, pero localizado en una región de la Figura 2 en la cual las asignaciones correctas y las incorrectas son frecuentes (los restantes triángulos amarillos). Esta asignación particular de codones era consistente si usábamos para el análisis a todos los metazoarios (n = 626) o solo artrópodos (n = 92), eliminando la posibilidad de que las asignaciones de artrópodos fueran pobremente predichas debido a la distancia del resto de los metazoarios.

Estas asignaciones de codones fueron también consistentes bajo diferentes umbrales de conservación (datos no publicados). La predicción de que AGG codifica Lys fue también la única asignación no concordante que se repitió en varias especies. Estas observaciones sugieren fuertemente que AGG a Lys, es una nueva reasignación de codón, previamente no observada. De acuerdo a nuestros resultados del conjunto de datos de artrópodos, 24 especies traducen AGG a Lys y 34 especies lo hacen a Ser. Para 18 especies el significado de AGG no puede ser predicho, y 16 especies no utilizan AGG para nada. En las especies donde se predijo que AGG se traduce en Lys, los codones TCN y AGH (AGC, AGT, AGA) están claramente asociados con las columnas alineadas donde Ser está conservada en un porcentaje mayor al 80%, mientras que el codón AGG es claramente asociado con las columnas conservadas de Lys (Figura 3).

Este último efecto es ejemplificado por el crustáceo Speleonectes tulumensis. Esta especie tiene un total de 17 codones AGG, de los cuales nueve aparecen en posiciones por debajo del umbral de entropía. Ocho de estos nueve codones aparecen en posiciones donde la Lys está conservada en más del 80%. La probabilidad de que este suceso sea una causalidad es muy pequeña: hay 37 columnas alineadas de un total de 2443 con más del 80% de Lys, y la probabilidad de que después se coloquen aleatoriamente nueve codones AGG, al menos ocho de ellos ocupando estas columnas de Lys es:

P(X =8) = 1,5 x 10-17


Evolución del código genético en artrópodos

Para entender más profundamente el origen y la distribución del nuevo código genético; examinamos su evolución a través de la filogenia de los artrópodos. Sin embargo, la filogenia de los principales linajes de artrópodos es polémica. Nosotros utilizamos un árbol filogenético de consenso que ensamblamos a partir de diferentes fuentes [19-26] para reflejar mejor el conocimiento actual de las relaciones entre artrópodos (figura 4). Las politomías fueron introducidas en varios casos donde existían incertezas: la posición relativa de los hexápodos con respecto a los miriápodos y crustáceos (las hipótesis Atelocerata y Pancrustacean respectivamente) [22], la mono/parafilia de los hexápodos (dependiendo de la posición relativa de Ellipura con respecto a los insectos) [20,21,27], la monofilia de crustáceos [24], y las relaciones entre diferentes clases de crustáceos. La filogenia de las diferentes ordenes de insectos estuvo basada principalmente en referencias [19].

Figura 3. Uso de los codones TCN y AGN en los genomas mitocondriales de 24 artrópodos que se predijo que traducían AGG como Lys. El uso total de los codones TCN/AGN (A), y su uso particular en los sitios proteicos donde Ser (B) o Lys (C) están conservadas más del 80% de los 626 ADNmt metazoarios analizados son mostrados. N = A, C, G o T; H = A, C o T. DOI: 10.1371/journal.pbio.0040127.g003

La reconstrucción más moderada [28] de la evolución del código genético en este árbol indica claramente que el código genético mitocondrial de los artrópodos cambio en muchas ocasiones (Figura 4). Inesperadamente, los cambios ocurren dentro de los grupos mayoritarios y minoritarios de artrópodos. Por ejemplo, en la orden Hemiptera, Euhemiptera (Philaenus spumarius, Triatoma dimidiata) lee AGG como Lys, pero Sternorrhyncha (Aleurochiton aceris, Bemisia tabaci, Tetraleurodes acaciae, Trialeurodes vaporariorum, Neomaskellia andropogonis, Aleurodicus dugesii, Schizaphis graminum) lee AGG como Ser. Un patrón similar fue observado en la subclase de chelicerate, Acari. Interesantemente, y sin tener en cuenta la inclusión de un grupo de especies con el IMGC, la reconstrucción del estado ancestral indica que el código genético que traduce AGG como Lys es el más antiguo. Confirmamos que la reconstrucción del estado ancestral da el mismo resultado cuando resolvemos las politomías de diferentes maneras (de acuerdo filogenias de artrópodos recientemente publicadas [20–22,24,29]), y cuando enraizamos el árbol con un grupo que tiene el IMGC.

En todas, excepto una, de las combinaciones alternativas que analizamos se predijo que claramente que el estado ancestral traducía AGG como Lys.
En ningún caso se predijo que el IMGC sea el código ancestral de los atrópodos. Por lo tanto decidimos nombrar este novedoso código genético como Ancestral Arthropod Mitochondrial Genetic Code (AAMGC) para diferenciarlo del IMGC en el cual AGG es traducido como Ser. La naturaleza ancestral de este AAMGC está fuertemente sostenida por la observación de que es encontrado en varios linajes de artrópodos, que se consideran divergencias tempranas. Por ejemplo, en el linaje basal más ampliamente aceptado de Chelicerata (cangrejo herradura -Merostomata-) [23], Hexapoda (Ellipura) [19], e Insecta (Thysanura) [19], todos se predijeron utilizando el AAMGC.
Este es también el caso de las clases Remipedia y Branchiopoda, que han sido a menudo propuestos para estar entre los crustáceos más primitivos [30]. Los Miriápodos también usan el AAMGC.

Figura 4. Evolución del Código Genético Mitocondrial en Artrópodos
Esta figura fusiona dos reconstrucciones de estados ancestrales: la presencia (transparente) o ausencia (gris claro) del codón AGG, y la traducción predicha de AGG como Lys (violeta) o Ser (amarillo). Las especies en las cuales AGG no fue predicho y aquellas en las que fue poco fiable (nodos sin rectángulo) fueron tratadas como estados ambiguos. El número de codones AGG, y los anticodones de ARNt-Lys y ARNt-Ser son indicados seguido del nombre de la especie.
DOI: 10.1371/journal.pbio.0040127.g004

 

Bases moleculares de las reasignaciones AGG

Para entender más profundamente las bases moleculares de las reasignaciones múltiples de AGG en artrópodos analizamos las secuencias de ARNt-Lys y ARNt-Ser (AGN) (Figura 4). Usando información mutua (ver Materiales y Métodos), intentamos determinar cuales posiciones evolucionaron de manera concertada con el significado del codón AGG. Encontramos que las mutaciones en los anticodones de cambios ARNt estaban correlacionados con la evolución del código genético. En el caso del ARNt-Ser, las mutaciones en los anticodones fueron altamente diagnosticadas para las reasignaciones del codón AGG (prueba de independencia en la evolución de ambos caracteres: valor-p 0.005, ver Protocolo S1 y Figura S1).

Como resume la figura 5, todas las especies de artrópodos que se predijo que decodifican AGG como Ser, y solo ellas, cambiaron el típico anticodón GCU de la ARNt-Ser (AGN) por UCU (28 especies) o ACU (3 especies), con solo dos excepciones.
Estas excepciones fueron que se predijo que Pollicipes polymerus tenía el IMGC, pero su ARNt-Ser tiene el anticodón GCU (probablemente incapaz de reconocer AGG al menos sin modificaciones postranscripcionales) e Ixodes holocyclus que contiene solo dos codones AGG que aparecen en posiciones variables y no pueden ser asignados por nuestro método, pero su ARNt-Ser tiene el anticodón UCU (que se supone que reconoce AGG). El anticodón de ARNt-Lys con el anticodón CUU, mientras que el resto tienen UUU. Todas las especies que se predijo que decodifican AGG como Lys tienen el anticodón CUU (prueba de probabilidad para el valor-p de independecia, 0.005, ver el Protocolo S1 y la Figura S1), aunque muchas especies que tienen el anticodón CUU no usan AGG o lo decodifican como Ser (Figura 5).

Figura 5. Las moléculas de ARNt-Lys y ARNt-Ser en artrópodos tienen el AAMGC o el IMGC
Los anticodones ARNt-Lys y ARNt-Ser decodifican AGG como Lys o Ser, asi como la traducción predicha de los codones-ARNm AGN y AAR, son mostrados. Note que los anticodones son descriptos en el sentido 3’ a 5’, por ejemplo UUC en ARNt-Lys corresponde al anticodón CUU en la notación estándar
DOI: 10.1371/journal.pbio.0040127.g005


Discusión

Historia evolutiva del código genético en artrópodos

Nuestros resultados son consistentes con la idea de que la reasignación de AGG de Ser a Lys ocurre en la base de los artrópodos, y que luego fue revertida varias veces en diferentes linajes. Si este escenario es verdadero, implica que los linajes basales retienen el estado ancestral consistente en decodificar AGG como Lys, mientras que algunos linajes derivados recobran el original IMGC. La observación de que linajes divergentes cambian repetidamente su código genético de nuevo a IMGC en lugar de mantener el “nuevo” código (AAMGC) sugiere que es posible que exista alguna ventaja evolutiva para traducir AGG como Ser.
Este cambio podría resultar en una traducción de la familia entera de codones AGN de una misma manera, como ocurre con muchas otras familias de codones en el código genético. Sin embargo, si bien Diptera y Lepidoptera son consideradas ordenes derivadas de insectos, ellos traducen AGG como Lys (aunque con baja frecuencia) o lo han eliminado de su genoma.

Es posible que estas ordenes conserven el estado ancestral, pero un escenario moderado es que una reasignación adicional de Ser a Lys haya tenido lugar en el ancestro de Diptera y Lepidoptera. Esta observación hace a la hipótesis de la ventaja en traducir AGG como Ser menos probable, aunque otros factores pueden anular esa ventaja. Por ejemplo, un bajo uso de AGG causado por un favoritismo mutacional hacia el bajo contenido de GC reduciría las ventajas putativas de trasladar AGG como Ser, proporcionado un gran argumento a favor de la evolución neutral antes que de la selección.
Interesantemente, si bien los codones AGG son generalmente raros en las mitocondrias de artrópodos, la reasignación de codones no siempre es notablemente más rara que aquella con el significado original en el taxón hermano, como sería predicho por el modelo de captura de codón [14]. Por ejemplo, la diferencia en el número de codones AGG usados en las especies IMGC y AMMGC en los clados que contienen Ixodes y Limulus no es significante (prueba de dos colas, valor-p = 0.65). Esto sugiere que no es necesario que el codón AGG desaparezca totalmente para ser reasignado a través de un punto de mutación en el anticodón, aunque el bajo uso de este codón hace menos probables los borrados de las reasignaciones.

Un ejemplo ilustrativo de la inestabilidad del codón AGG existe en Penaeus monodon, el cual carece del codón AGG, mientras que la otra especie Malacostraca, que se predijo que decodifica AGG como Ser, lo usa frecuentemente. Interesantemente, P. monodon tiene un ARNt-Ser diferente que el otro Malacostraca y tiene un ARNt-Lys que probablemente es incapaz de decodificar AGG.
Estos cambios en el ARNt complementario sugieren que la selección natural, en mayor medida que la presión de mutación direccional, contribuye a la rareza del codón en esta especie. El recientemente secuenciado genoma-mt de Marsupenaeus japonicus, tambien de la familia Penaeidae, puede ayudar a entender los mecanismos evolutivos.
Estas especies tienen los mismo anticodones que P. monodon en ARNt-Lys/-Ser. Si embargo, tres ejemplos del codón AGG aparecen en su genoma-mt, los cuales se predice que son traducidos como Ser. Estas observaciones sugieren que M. japonicus está en una etapa intermedia antes de la completa eliminación de AGG de su genoma, y que su ARNt-Ser con el anticodón GCU pueden conservar cierta habilidad para reconocer el codón AGG.


Rol de los ARNt en la reasignación de AGG

La base molecular de la reasignación de AGG parece ser la mutación del anticodón, en vez de los mecanismos alternativos de la modificación de bases de anticodones previamente descriptos en Starfish [8] y Squid [9], o las mutaciones de ARNt conducidas por ambigüedades en la traducción como se espera por la hipótesis del intermedio ambiguo [15].

La fuerte asociación entre una mutación en el anticodón ARNt-Ser y la traducción de AGG sugiere que este cambio molecular bastante simple podría explicar la recurrencia de la reasignación de AGG en artrópodos de Lys a Ser. Este mecanismo requiere que el ARNt-Ser (AGN) mutado tenga más afinidad por el AGG que el ARNt-Lys, porque el ARNt-Lys puede todavía ser capaz de reconocer el codón AGG. Efectivamente, la afinidad del ARNt-Lys por AGG debe ser baja, ya que es requerido un apareamiento tambaleante de GU en la posición media del codón. Por lo tanto, el ARNt-Ser debe ser visto como el ARNt dominante.

También encontramos que algunas especies tienen el ARNt-Lys pre-requerido con el anticodón CUU y no pueden traducir AGG como Ser, pero no obstante no utilizan AGG en absoluto. Por ejemplo, hallamos que la ausencia o el bajo uso de AGG en Diptera y Lepidoptera no está exclusivamente relacionado con un bajo contenido de GC (Ver Protocolo S2 y Tabla S1).
De las pocas moscas y mariposas que usan AGG, se predijo que todas lo decodifican como Lys, pero utilizan AGG en muy baja frecuencia. Esta observación puede ser interpretada de dos maneras. Primero, el anticodón CUU puede ser necesario pero no suficiente para permitirle al ARNt-Lys reconocer AGG. Los cambios en otras regiones pueden también influenciar la afinidad del ARNt por estos codones [31], aunque ni el análisis de la estructura primaria ni de la secundaria (Protocolo S3, Figura S2 y S3) reveló correlaciones profundas.
Segundo, la eficiencia del ARNt-Lys en reconocer AGG puede ser siempre pobre, y por lo tanto en algunas especies se prefiere la eliminación de AGG del genoma. De hecho, el apareamiento codón-anticodón entre CUU y AGG es desfavorable, y en la medida de lo que sabemos, el apareamiento tambaleante en la posición media del codón no tendría precedentes.

Es posible que sean requeridos sutiles cambios estructurales a lo largo del resto del cuerpo del ARNt para permitir la flexibilidad requerida por un par GU en la segunda posición, que ocurra un modificación postranscripcional (como una deaminación de C a U), o que el ARNt codificado en la mitocondria no sea funcional y que un ARNt codificado en el núcleo sea importado dentro de la mitocondria y usado para la traducción.

 

Conclusiones

Muchos artrópodos, incluyendo aquellos que usan el nuevo código genético, hacen uso limitado de AGG. Esta baja abundancia hace a esta asignación particularmente extraña desde el punto de vista estadístico, y explica porque las caracterizaciones previas del código genético en estas especies fueron incapaces de descubrir el AAMGC. Solo un enfoque global, como el realizado aquí, que beneficia la comparación de asignaciones a través de múltiples especies, puede determinar la traducción de AGG con alta confianza.

Antes de este estudio, cada cambio del código genético conocido en mitocondrias metazoarias se conservaba dentro de un filo. Mostramos que las variantes del código genético tambien pueden ser encontradas entre linajes dentro de un filo de metazoarios.
La importancia principal de este hallazgo es que los cambios en el código genético pueden ser mucho más frecuentes que lo sospechado previamente, y que el gran numero de secuencias de genomas completos que están ahora disponibles hace posible por primera vez esta clase de mapeo de cambios del código genético de alta resolución.

Quizás no sea inesperado que la mayor parte de los cambios en el nuevo código genético sea encontrado en artrópodos, que son numerosos y diversos. Sin embargo, el número de cambios en el código genético dentro de este clado (incluso incluyendo cambios dentro de una sola clase de insectos) provee un ejemplo sin precedentes de cambios paralelos del código genético mitocondrial dentro de un filo, y sugiere que se podría encontrar un fenómeno similar cuando se encuentren disponibles más secuencias de otros linajes.
Patrones similares de reasignaciones repetidas han sido observados previamente en el núcleo, en ciliados [32,33] y levaduras [17], aunque en ciliados los cambios recurrentes involucran reasignaciones entre codones con sentido y codones de stop, los cuales han sido relacionados con cambios en los factores de liberación [32].

Las conclusiones presentadas aquí representan un caso extraordinario de reasignaciones múltiples en las que ambas asignaciones tienen sentido. Interesantemente, las especies de artrópodos con el AAMGC pueden usar una interacción codón-anticodón nunca antes observada en la cual ocurre un apareamiento tambaleante en la posición media del codón.
Por todas estas razones, el código genético mitocondrial de artrópodos representa un paradigma para la comprensión de la evolución del código genético.

 

Materiales y Métodos

Datos. Un total de 626 genomas mitocondriales metazoarios fueron recuperados del NCBI (www.ncbi.nlm.nih.gov) y analizados con el programa Mitobank (disponible en darwin.uvigo.es) construido usando la biblioteca BioPerl [34]. Los alineamientos múltiples para cada gen que codifica proteínas fue realizada con ClustalW [35]. Construimos cuatro conjuntos diferentes de secuencias comprendiendo metazoarios (n = 626), platelmintos (n = 10), nemátodos (n = 12)y artrópodos (n = 92).

Predicción del código genético mitocondrial. Para especies dadas de código genético desconocido, nuestro método de asignación localizó cada uno de los 64 codones en los alineamiento múltiples de proteínas homólogas. Luego, el método calcula la frecuencia total de cada aminoácido en todas las columnas donde un codón dado aparece. Entonces se asume que el aminoácido que aparece más frecuentemente en especies relacionadas es el significado más probable del codón.
Las columnas con más de un 20% de huecos o con entropía de Shannon (S) mayor a 2 fueron interpretados como altamente variables o pobremente alineados, y excluidos de nuevos análisis (vea Resultados para una justificación). El significado del codón es definido como “no predicho” si el codón es usado en las especies dadas, pero no en posiciones por debajo del umbral de entropía.

Reconstrucción filogenética de estados ancestrales de carácter. El programa Mesquite v1.05 [36] fue usado para construir una filogenia de artrópodos, y para asignar estados de carácter óptimos a los nodos internos del árbol usamos reconstrucciones más moderadas [28] bajo el criterio de parsimonia de Fitch [37].

Análisis molecular del ARNt-Lys/-Ser. La evolución de las secuencias de ARNt-Lys/-Ser fue analizada para encontrar posiciones que evolucionaron concertadamente con el código genético. La traducción predicha de AGG fue incluida como un nuevo carácter en el alineamiento de secuencias múltiples de ARNt-Lys/-Ser y la información mutua de este carácter contra los otros fue calculada con el programa MatrixPlot [38]. Diferentes criterios para el cálculo de la información mutua dieron resultados similares.

Prueba de evolución correlacionada de caráteres. En lugar de contar cada especie como una observación independiente (como en los análisis de MatrixPlot), probamos en un contexto filogenético la evolución correlacionada de estas posiciones identicas con MatrixPlot.
Para ser capaces de usar el programa Discrete [39], construimos una filogenia de artrópodos en la cuales las politomías fueron resueltas y las ambigüedades en los caracteres estudiados (código genético o asignación del anticodón ARNt) eliminadas (Figura S1). Las longitudes de las ramificaciones de este árbol fueron optimizadas por máxima probabilidad con el programa Phyml [40]. El programa Discrete fue aplicado para probar la independencia de la evolución del código genético y los anticodones ARNt-Lys/-Ser en un contexto de máxima probabilidad (ver Protocolo S1).


Información de apoyo

Figura S1. Árbol filogenético usado para probar las Politomias de Evolución Correlacionada del árbol de la Figura 4 fue resuelto como se muestra en esta figura. La longitud de las ramificaciones por la máxima probabilidad. La menor longitud de las ramificaciones internas que unen diferentes grupos de especies resaltó las dificultades en determinar la filogenia de artrópodos.

Encontrado en DOI: 10.1371/journal.pbio.0040127.sg001 (125 KB PDF).

Figura S2. Estructura secundaria de ARNt-Lys
El alineamiento multiple de ARNt-Lys de artrópodos resaltó las elementos principales de la estructura secundaria del ARNt, asi como la traducción predicha del codón AGG.
Encontrado en DOI: 10.1371/journal.pbio.0040127.sg002 (3 MB PDF).

Figura S3. Estructura secundaria de ARNt-Ser
El alineamiento multiple de ARNt-Ser de artrópodos resaltó las elementos principales de la estructura secundaria del ARNt, asi como la traducción predicha del codón AGG.
Encontrado en DOI: 10.1371/journal.pbio.0040127.sg003 (3 MB PDF).

Protocolo S1. Evolución correlacionada del código genético y de los anticodones ARNt-Lys/-Ser
Encontrado en DOI: 10.1371/journal.pbio.0040127.sd001 (49 KB DOC).

Protocolo S2. Contenido de GC y ausencia de AGG en las ordenes Diptera y Lepidoptera
Encontrado en DOI: 10.1371/journal.pbio.0040127.sd002 (28 KB DOC).

Protocolo S3. Estructura secundaria de ARNt-Lys/-Ser
Encontrado en DOI: 10.1371/journal.pbio.0040127.sd003 (26 KB DOC).

Tabla S1. Uso de AGG y TCG en especies con contenido de GC en la tercera posición del codón (menos del 10%)
Encontrado en DOI: 10.1371/journal.pbio.0040127.st001 (47 KB DOC).


Artículo original en inglés

Parallel Evolution of the Genetic Code in Arthropod Mitochondrial Genomes publicado en PLoS Biology

http://www.plosbiology.org/article/info:doi%2F10.1371%2Fjournal.pbio.004…

DOI: 10.1371/journal.pbio.0040127
Copyright: © 2006 Abascal et al. Este es un artículo libre distribuido bajo los términos de la Creative Commons Attribution License, lo cual permite el uso irrestricto, distribución, y reproducción en cualquier medio siempre que se acredite el autor original y la fuente.


Referencias

1. Crick FH (1968) The origin of the genetic code. J Mol Biol 38: 367–379.

2. Di Giulio M (2005) The origin of the genetic code: Theories and their relationships, a review. Biosystems 80: 175–184.
3. Knight RD, Freeland SJ, Landweber LF (2001) Rewiring the keyboard: Evolvability of the genetic code. Nat Rev Genet 2: 49–58.
4. Saraste M (1999) Oxidative phosphorylation at the fin de siecle. Science 283: 1488–1493.
5. Knight RD, Landweber LF, Yarus M (2001) How mitochondria redefine the code. J Mol Evol 53: 299–313.
6. Yokobori S, Suzuki T, Watanabe K (2001) Genetic code variations in mitochondria: tRNA as a major determinant of genetic code plasticity. JMol Evol 53: 314–326.
7. Osawa S, Ohama T, Jukes TH, Watanabe K (1989) Evolution of the mitochondrial genetic code. I. Origin of AGR serine and stop codons in metazoan mitochondria. J Mol Evol 29: 202–207.
8. Matsuyama S, Ueda T, Crain PF, McCloskey JA, Watanabe K (1998) A novel wobble rule found in starfish mitochondria. Presence of 7-methylguanosine at the anticodon wobble position expands decoding capability of tRNA. J Biol Chem 273: 3363–3368.
9. Tomita K, Ueda T, Watanabe K (1998) 7-Methylguanosine at the anticodon wobble position of squid mitochondrial tRNA(Ser)GCU: Molecular basis for assignment of AGA/AGG codons as serine in invertebrate mitochondria. Biochim Biophys Acta 1399: 78–82.
10. Kondow A, Suzuki T, Yokobori S, Ueda T, Watanabe K (1999) An extra tRNAGly(U*CU) found in ascidian mitochondria responsible for decoding non-universal codons AGA/AGG as glycine. Nucleic Acids Res 27: 2554–2559.
11. Osawa S, Jukes TH, Watanabe K, Muto A (1992) Recent evidence for evolution of the genetic code. Microbiol Rev 56: 229–264.
12. Ivanov V, Beniaminov A, Mikheyev A, Minyat E (2001) A mechanism for stop codon recognition by the ribosome: A bioinformatic approach. RNA 7: 1683–1692.
13. Lavrov DV, Lang BF (2005) Transfer RNA gene recruitment in mitochondrial DNA. Trends Genet 21: 129–133.
14. Osawa S, Jukes TH (1989) Codon reassignment (codon capture) in evolution. J Mol Evol 28: 271–278.
15. Schultz DW, Yarus M (1994) Transfer RNA mutation and the malleability of the genetic code. J Mol Biol 235: 1377–1380.
16. Castresana J, Feldmaier-Fuchs G, Paabo S (1998) Codon reassignment and amino acid composition in hemichordate mitochondria. Proc Natl Acad Sci U S A 95: 3703–3707.
17. Santos MA, Cheesman C, Costa V, Moradas-Ferreira P, Tuite MF (1999) Selective advantages created by codon ambiguity allowed for the evolution of an alternative genetic code in Candida spp. Mol Microbiol 31: 937–947.
18. Telford MJ, Herniou EA, Russell RB, Littlewood DT (2000) Changes in mitochondrial genetic codes as phylogenetic characters: Two examples from the flatworms. Proc Natl Acad Sci U S A 97: 11359–11364.
19. Wheeler WC, Whiting M, Wheeler QD, Carpenter JM (2001) The phylogeny of the extant hexapod orders. Cladistics 17: 113–169.
20. Nardi F, Spinsanti G, Boore JL, Carapelli A, Dallai R, et al. (2003) Hexapod origins: Monophyletic or paraphyletic? Science 299: 1887–1889.
21. Delsuc F, Phillips MJ, Penny D (2003) . Delsuc F, Phillips MJ, Penny D (2003) Comment on ‘‘Hexapod origins: Monophyletic or paraphyletic?’’ Science 301: 1482; author reply 1482.
22. Giribet G, Edgecombe GD, Wheeler WC (2001) Arthropod phylogeny based on eight molecular loci and morphology. Nature 413: 157–161.
23. Regier JC, Shultz JW (1997) Molecular phylogeny of the major arthropod groups indicates polyphyly of crustaceans and a new hypothesis for the origin of hexapods. Mol Biol Evol 14: 902–913.
24. Regier JC, Shultz JW, Kambic RE (2005) Pancrustacean phylogeny: Hexapods are terrestrial crustaceans and maxillopods are not monophyletic. Proc Biol Sci 272: 395–401.
25. Hwang UW, Friedrich M, Tautz D, Park CJ, Kim W (2001) Mitochondrial protein phylogeny joins myriapods with chelicerates. Nature 413: 154–157.
26. Giribet G, Ribera C (2000) A review of arthropod phylogeny: New data based on ribosomal DNA sequences and direct character optimization. Cladistics 16: 204–231.
27. Luan YX, Mallatt JM, Xie RD, Yang YM, Yin WY (2005) The phylogenetic positions of three basal-hexapod groups (protura, diplura, and collembola) based on ribosomal RNA gene sequences. Mol Biol Evol 22: 1579–1592.
28. Maddison WP (1989) Reconstructing character evolution on polytomous cladograms. Cladistics 5: 365–377.
29. Regier JC, Shultz JW (2001) Elongation factor-2: A useful gene for arthropod phylogenetics. Mol Phylogenet Evol 20: 136–148.
30. Martin JW, Davis GE (2001) An updated classification of the recent crustacea. Natural History Museum of Los Angeles County, Science Series
39. Los Angeles: Natural History Museum of Los Angeles County. 124 p.
31. Cochella L, Green R (2005) An active role for tRNA in decoding beyond codon:anticodon pairing. Science 308: 1178–1180.
32. Lozupone CA, Knight RD, Landweber LF (2001) The molecular basis of nuclear genetic code change in ciliates. Curr Biol 11: 65–74.
33. Inagaki Y, Doolittle WF (2001) Class I release factors in ciliates with variant genetic codes. Nucleic Acids Res 29: 921–927.
34. Stajich JE, Block D, Boulez K, Brenner SE, Chervitz SA, et al. (2002) The Bioperl toolkit: Perl modules for the life sciences. Genome Res 12: 1611–1618.
35. Thompson JD, Higgins DG, Gibson TJ (1994) CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties, and weight matrix choice. Nucleic Acids Res 22: 4673–4680.
36. Maddison WP, Maddison DR (2004) Mesquite: A modular system for evolutionary analysis, version 1.05 [computer program]. available: http://mesquiteproject.org. Accessed 16 March 2006.
37. Fitch WM (1971) Toward defining the course of evolution: Minimum change for a specific tree topology. Syst Zool 20: 406–416.
38. Gorodkin J, Staerfeldt HH, Lund O, Brunak S (1999) MatrixPlot: Visualizing sequence constraints. Bioinformatics 15: 769–770.
39. Pagel M (1994) Detecting correlated evolution on phylogenies: A general method for the comparative analysis of discrete characters. Proc Biol Sci 255: 37–45.
40. Guindon S, Gascuel O (2003) A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Syst Biol 52: 696–704.

Comentarios