Primer borrador del proteoma humano

El consorcio UniProt ha anunciado en su sitio web el pasado 2 de septiembre que la última versión de su base de datos incluye todos los genes que actualmente se sabe que codifican proteínas en el ser humano. Esto representa 20.325 entradas. Más de un tercio de estas contienen secuencias adicionales que representan isoformas generadas por corte y empalme alternativo, uso de promotores alternativos y/o inicio alternativo de la traducción, resultando en cerca de 34.000 secuencias de proteínas humanas. También se describen aproximadamente 46.000 polimorfismos de un único aminoácido (SAPs), principalmente relacionados con enfermedades, así como 60.000 modificaciones post-traduccionales (PTMs).

No es la primera vez que UniProtKB/Swiss-Prot provee un proteoma completamente anotado para un organismo modelo (ya existen, por ejemplo, los de E.coli y S.cerevisiae) y hay planes para realizar otros un futuro cercano o más distante (A.thaliana, B.subtilis, D.discoideum, ratón, arroz, S.aureus, S.pombe, etc.).

Pero este trabajo dista de ser definitivo y todavía quedan muchas cosas por hacer. Es necesario revisar y actualizar el conjunto de datos actual, crear entradas cuando se descubran nuevas proteínas, aumentar el número de variables de corte y empalme y explorar toda la gama de PTMs. La caracterización a nivel molecular tendrá que ser colocada en su contexto fisiológico: localización subcelular, expresión en los tejidos, interacciones proteína/proteína, etc.

Aunque lo verdaderamente importante serán los conclusiones que se puedan extraer del análisis de estos datos y la manera en que nos ayudarán a comprender como actúan las proteínas en nuestros procesos vitales.

Fuente: http://www.uniprot.org/

 

 

Comentarios