Secuenciado el genoma de la bacteria responsable de la peste bubónica que arrasó Europa en el siglo XIV

La peste bubónica arrasó Europa en el siglo XIV causando la muerte entre el 30% y el 50% de la población europea entre 1347 y 1351. La peste es causada por la bacteria Yersinia pestis que se contagia vía pulgas con la ayuda de la rata de campo (Rattus rattus). Bos et al. publican en Nature la secuencia completa del genoma de muestras de esta bacteria extraídas de dientes de víctimas de la peste bubónica en Londres hacia el año 1348-1349. Obtener el genoma de una bacteria de hace 700 años no es fácil y hay que evitar toda fuente de contaminación del ADN. Los autores han seguido un protocolo muy estricto y afirman que el genoma que han obtenido es una representante genuino de la bacteria que provocó la pandemia. El análisis del genoma indica que esta pandemia fue un evento evolutivo clave en la filogenia posterior de esta bacteria, incluyendo la cepa responsable de la peste moderna (que se expandió desde Asia en el s. XIX). La mayor diversidad del genoma de Y. pestis se observa en China, lo que sugiere que la mayoría de las epidemias de esta plaga se originaron allí. El análisis genético de Bos et al. sugiere que la peste bubónica se parece mucho más de lo esperado a la peste moderna, por lo que la gran mortandad que provocó hace siete siglos no depende solo de la cepa de la bacteria. En resumen, un trabajo genético muy interesante del que se hace eco Edward C. Holmes, “Genomics: Plague’s progress,” Nature 478: 465–466, 27 October 2011; el artículo técnico es Kirsten I. Bos et al., “A draft genome of Yersinia pestis from victims of the Black Death,” Nature 478: 506–510, 27 October 2011 (published online 12 October 2011).

La estructura tridimensional del genoma de la levadura de la cerveza

Dos vistas 3D de la reconstrucción tridimensional del genoma de la levadura. (C) Nature

El genoma de una célula eucariota está almacenado en su núcleo dividido en cromosomas, que no están distribuidos al azar, sino que presentan una estructura tridimensional jerárquica que facilita la transcripción de ciertos genes y la replicación del genoma en su conjunto. Las relaciones espaciales y la topología de estas conformaciones cromosómicas son una de las grandes incógnitas de la biología moderna. Por primera vez se ha logrado reconstruir la conformación tridimensional completa de los cromosomas en el núcleo de una célula, en concreto, de la levadura de la cerveza (Saccharomyces cerevisiae). Como muestra la figura en 3D, la estructura es realmente sorprendente. Destaca el cromosoma XII, que adopta una topología casi inimaginable (en verde, indicada por la flecha blanca). Esta conformación parece impedir la interacción entre las secuencias de ADN de sus dos extremos. Otros cromosomas también presentan un plegamiento que podría ser responsable de ciertas interacciones intracromosómicas e intercromosómicas. Este trabajo, que se publica en Nature, nos indica que la relación entre forma y función, ampliamente documentada en proteínas, es capital también en los genomas eucariotas. Ahora sólo falta entender para qué sirve cada pliegue descubierto en este compleja estructura. Un gran reto para los próximos lustros. El artículo técnico es Zhijun Duan et al., “A three-dimensional model of the yeast genome,” Nature, Advance online publication, 2 May 2010. Los biólogos no pueden obviar la consulta de las 80 páginas de información suplementaria, donde se indica la conformación tridimensional de cada cromosoma por separado, así como su interacción topológica con sus vecinos. Los que además quieran disfrutar de la figura que abre esta entrada en 3D deberán descargar el fichero en formato PDB (Protein Data Bank) que se puede visualizar con muchos programas, como RasMol.

Publicado en Science: Objetivo domesticar a las avispas parásitas para controlar las plagas de nuestros campos

Los que no somos biólogos ni ingenieros agrícolas ignoramos muchas cosas que cuando nos las cuentan por primera vez nos hacen abrir la boca y exclamar. Yo no sabía que (se estima que) hay más de 600.000 especies de avispas parásitas, muchas más especies que de escarabajos. La mayoría de estas avispas son minúsculas pero tienen un importantísimo papel en el control natural de las plagas de insectos que azotan los ecosistemas naturales y los campos agrícolas. El Departamento de Agricultura de los EEUU estima que las avispas parásitas reducen los costes agrícolas de EEUU en al menos 20 mil millones de dólares anuales gracias a su control de especies invasoras. Los ingenieros agrícolas desearían poder domesticar a las avispas parásitas. Para lograrlo es necesario conocer en detalle su genoma. Pero el genoma de qué avispa si hay cientos de miles diferentes. Un consorcio de 157 investigadores decidió estudiar el genoma de tres especies de avispas parásitas del género Nasonia (Nasonia vitripennis, N. giraulti, y N. longicornis) y han publicado sus resultados en la prestigiosa revista Science. Nos lo cuenta de forma magistral Elizabeth Pennisi, “Entomology: The Little Wasp That Could. The sequencing of the genome of a parasitoid wasp promises to bring wider recognition to these tiny, underappreciated insects that play a crucial role in natural ecosystems and in agriculture,” Science 327: 260-262, 15 January 2010, que se hace eco del artículo técnico The Nasonia Genome Working Group, “Functional and Evolutionary Insights from the Genomes of Three Parasitoid Nasonia Species,” Science 327: 343-348, 15 January 2010. En español podéis leer la noticia en muchas fuentes, por ejemplo, en Miguel G. Corral, “El genoma de la avispa ‘cobaya’ de laboratorio,” El Mundo, Ciencia, 14 ene. 2010, y en ”La avispa Nasonia, nuevo modelo de organismo para controlar plagas agrícolas y enfermedades,” SINC, 14 ene. 2010 [visto en Menéame].

Poco más puedo yo decir de lo ya dicho en los dos artículos que cito en español. Aún así no me resisto a indicar que en el año 2008 (publicado en PNAS) se estudió el código de barras de ADN de 2597 avispas parásitas de 171 especies diferentes y se encontró, para sorpresa de los investigadores, que en realidad había 313 especies diferentes. Por ejemplo, entre todos los ejemplares de la especie Apanteles leucostigmus, se descubrieron 36 especies diferentes. Y hay muchos otros ejemplos. La biodiversidad de las avispas parásitas es mucho mayor de lo que nunca se pensó. Actualmente se han descrito entre 50 y 60 mil especies (se estima que debe haber al menos 10 veces más). Además, el nuevo estudio genético ha descubierto varias cosas realmente curiosas. A mí me ha sorprendido que las avispas del género Nasonia presentan 450 genes que se encuentran en el genoma humano y que no se encuentran en el genoma de las moscas (del vinagre). Salvando las distancias es como si las avispas se parecieran más a los humanos que las moscas. Por eso os incluyo una figura con los resultados filogenéticos publicados en Science. Este árbol filogenético muestra las relaciones evolutivas entre todas las especies cuyo genoma ha sido secuenciado hasta el momento (parte A) y las relaciones entre las 3 especies de avispas parásitas secuenciadas (parte B). Lo dicho, poco más puedo y voy a decir.

Publicado en Nature: Avances en la base genética del cáncer de riñón y la importancia de la epigenética

 

El carcinoma de células renales es el tipo de cáncer de riñón más frecuente en adultos (209 mil nuevos casos al año en el mundo entero y hasta 102 mil muertes). El tumor (las células cancerosas) se encuentran en la capa que recubre unos tubos muy pequeños (túbulos) en el riñón. La genética de este tipo de cáncer es curiosa ya que presenta mutaciones en el gen VHL que no se observan en otros cánceres y muy pocas mutaciones en genes típicos en ellos. Se publicará en Nature el estudio más extenso de mutaciones en un solo tumor realizado hasta la fecha. Los investigadores británicos y norteamericanos han estudiado 101 células, elegidas entre 96 tumores, y han estudiado las mutaciones en 3544 de sus genes que codifican proteínas. Sólo han identificando dos nuevas mutaciones, en los genes SETD2 y JARID1C (KDM5C), y una que se conocía, en el gen UTX, que inactivan genes relacionados con la modificación de las histonas (proteínas en la cromatina nuclear, el entorno proteico de las moléculas de ADN en el núcleo de la célula). El estudio es una nueva muestra de la gran complejidad genética de las células de los tumores y la gran importancia que tiene la epigenética, los factores no genéticos que intervienen en la herencia, en el desarrollo de los cánceres. Los investigadores han encontrado dos fenotipos claramente diferenciados, un 82% de las céulas presentan la expresión de genes asociados a la hipoxia celular (falta de oxígeno) y el resto no las presenta (como muestra la figura). Los investigadores creen que esto indica la presencia de defectos en la maquinaria de reparación del ADN que no han sido capaces de identificar, luego asumen que son epigenéticos. Hay que recordar que la epigenética estudia la trasmisión de información hereditaria que no está codificada en el ADN sino que corresponde al gran número de proteínas que se transfieren a través de la meiosis o mitosis. La información epigenética modula la expresión de los genes sin alterar la secuencia de ADN. En resumen, este estudio nos recuerda que para combatir el cáncer no sólo habrá que caracterizar el genoma de los diferentes cánceres sino también su epigenoma. Cuanto más sabemos del cáncer, más nos damos cuenta de lo poco que sabemos. Se han hecho eco de esta noticia varios medios, entre ellos Don Powell, del Wellcome Trust Sanger Institute, al que pertenecen parte de los autores, en “Unraveling kidney cancer. Mutations in the genome regulation machinery identified in clear cell renal cell carcinoma,” EurekAlert, 6 Jan. 2010. El artículo técnico es Dalgliesh GL et al., “Systematic sequencing of renal carcinoma reveals inactivation of histone modifying genes,” Nature, Published online before print, 6 Jan. 2010.

Secuenciado en China el (borrador del) genoma del (oso) panda gigante

En China están de enhorabuena. Investigadores chinos han logrado secuenciar el genoma de una de las especies animales más carismáticas y más en peligro de extinción del mundo: el (oso) panda gigante. Se estima que quedan sólo 1.600 pandas en libertad. Aunque secuenciar el genoma de un animal todavía no tiene consecuencias directas en las políticas de conservación de especies en peligro, este logro muestra que China domina las tecnologías de secuenciación de última generación. Nos lo cuenta brevemente Brendan Borrell, “China celebrates panda genome. Next-generation sequencing technologies tackle iconic bear,” Nature 762: 833, 17 December 2009. Ruiqiang Li et al., “The sequence and de novo assembly of the giant panda genome,” Nature, Advance online publication 13 December 2009.

Se ha secuenciado el 94% del genoma del panda gigante (Ailuropoda melanoleura), unos 2,25 Gb (gigabases); los autores estiman que los huecos que faltan (0,05 Gb) contienen secuencias repetitivas específicas de los carnívoros. Dicho genoma ha sido comparado con el del hombre y con el del perro (el único carnívoro cuyo genoma había sido secuenciado). La mayoría de los genes se conservan bien entre todos los mamíferos secuenciados hasta ahora. Lo más interesante para mí es que se ha descubierto que el genoma del panda carece de genes específicos para el procesado del bambú, elemento exclusivo de su dieta. La única explicación de esta ausencia es que dichos genes deben estar en la flora microbiana de su intestino (que habrá que estudiar en el futuro para confirmarlo). Poco más podemos decir de la secuenciación del primer genoma de un animal de la familia de los Úrsidos (Ursidae).

La moda de secuenciar el genoma del animal más representativo de un país parece estar extendida por todo el mundo. Por ejemplo, en Australia están secuenciando el genoma del canguro (sería el primer genoma de un marsupial secuenciado) y también el del ornitorrinco. Cualquiera de ellos será noticia el año próximo.

La explicación del “hat-trick” científico de Luis Serrano y la bacteria Mycoplasma pneumoniae

Para los que jugamos a los dardos, un “hat-trick” es cuando un jugador logra tres dianas. Supongo que J. Corbella utiliza su significado futbolístico, un jugador que marca tres goles en un solo partido. En cualquier caso Luis Serrano ha logrado un “´Hat-trick´ científico,” como muy bien nos relata J. Corbella en La Vanguardia, tres, sí, tres artículos en un mismo número de Science [visto en Menéame], que presentan el transcriptoma, metaboloma y proteoma de la bacteria Mycoplasma pneumoniae. Un hecho insólito por partida triple al que yo quise dedicarle una entrada, ayer, pero 24 horas sin Internet, gracias a la “amabilidad” de Orange, no me lo permitieron. Mi idea era contar este gran logro científico desde mi punto de vista, obviamente sesgado por mi formación e inquietudes. Aunque algunos me comparen con Sokal, el que quiera que me lea y el que no, que acuda a otras fuentes.

Por supuesto, en La Vanguardia también lo explican, copiando la noticia de la agencia Europa Press, “Desvelan la complejidad de la vida en la bacteria más pequeña analizada. La ‘Mycoplasma pneumoniae’ podría ayudar a los científicos a determinar la mínima maquinaria celular necesaria para la vida,” 26/11/2009 [también meneada]. A mí me gusta más la versión de El País, algo más europeista, ”La vida es más compleja de lo que se esperaba. Investigadores europeos definen los requisitos de funcionamiento de una célula autosuficiente,” 26/11/2009. Faltaría más, mi mujer prefiere la versión de El Mundo, Rosa M. Tristán, “Estudio Español. En busca de una ‘píldora’ con vida. Revelan la complejidad de una célula mínima que podría servir de medicamento,” 26/11/2009. ¿Cuál prefieres tú? Todos los medios se han hecho eco de esta gran noticia… seguro que tú prefieres no seguir leyendo lo que yo pueda contar, en mi ignorancia, al respecto.

Lo que sigue es una traducción libre resumen de la Perspective de Howard Ochman y Rahul Raghavan, “Excavating the Functional Landscape of Bacterial Cells,” Science 326: 1200-1201, 27 November 2009. Obviamente se hacen eco de los tres artículos técnicos de los que uno de los investigadores principales es Luis Serrano: Marc Güell et al., Anne-Claude Gavin, Peer Bork, Luis Serrano, “Transcriptome Complexity in a Genome-Reduced Bacterium,” Science 326: 1268-1271, 27 November 2009; Eva Yus et al., Anne-Claude Gavin, Peer Bork, Luis Serrano, “Impact of Genome Reduction on Bacterial Metabolism and Its Regulation,” Science 326: 1263-1268, 27 November 2009; y Sebastian Kühner et al., Luis Serrano, Peer Bork, Anne-Claude Gavin, “Proteome Organization in a Genome-Reduced Bacterium,” Science 326: 1235-1240, 27 November 2009.

Mycoplasma pneumoniae es una bacteria procariota (sin núcleo) responsable de un 40% de las neumonías, infecciones respiratorias agudas, en niños. Se estima que en el mundo mueren 2 millones de niños al año por esta causa. Para los investigadores en genómica esta bacteria es una de las células más estudiadas ya que su genoma es el más pequeño conocido de una bacteria capaz de autorreplicarse sin ayuda y vivir fuera de un huésped. Ello permite que pueda ser cultivada en laboratorio (in vitro) y que se pueda estudiar la respuesta de su metabolismo ante cambios controlados en su medio de cultivo. Su genoma, de sólo 816.394 nucleóticos (bases), tiene 689 genes codificadores de proteínas (que estén anotados) y sólo 44 moléculas de ARN no codificadoras.

El metabolismo de una bacteria como M. pneumonie se suele comparar con el de la bacteria modelo Escherichia coli. Si un gen particular o una vía metabólica está ausente en el genoma de la bacteria, se suele asumir que esta bacteria no puede desarrollar dicha función metabólica y por tanto que dicha función no es requisito indespensable para la supervivencia de un organismo. Esta asociación uno a uno entre gen y función es más fe que ciencia, como han demostrado los tres artículos de Luis Serrano y colaboradores en Science. La organización de su red de proteínas (proteoma) y de su red de control de la transcripción (transcriptoma) es mucho más sutil y compleja de lo que se pensaba. Pocos podían pensar que se pareciera tanto a los mecanismos propios de las células eucariotas (con núcleo). Un genoma tan simple y a la vez tan capaz de desarrollar un metabolismo tan complejo. Esta es la gran sorpresa que se ha descubierto con el gran trabajo desarrollado por Serrano y sus colaboradores europeos.

El transcriptoma de este Mycoplasma es analizado en el artículo de Marc Güell et al. quienes han descubierto un transcriptoma muy complejo, similar al de las células eucariotas. Han encontrado 117 nuevos genes de ARN no codificantes,  identificado 341 operones, 139 de los cuales son policistrónicos (contienen más de un gen) y, para su sorpresa, observado que estos operones se dividen en 447 unidades de transcripción más pequeñas. El resultado es una maquinaria de control de la transcripción del genoma mucho más complicada de lo que se esperaba, ya que las bacterias con genomas pequeños se pensaba que tenían muy pocos factores de transcripción. 

El nuevo póster que todo biológo querrá tener colgado en su pared.

El metaboloma de M. pneumoniae es analizado en el artículo de Eva Yus et al. quienes han reconstruido la red metabólica de esta bacteria utilizando un “curado” manual basado en toda la información bioquímica, estructural y computacional disponible. Dicha red les ha permitido determinar el medio de cultivo mínimo que permite mantener con vida y cultivar a esta bacteria. La red metabólica descubierta contiene 189 reacciones químicas catalizadas por 129 enzimas que permiten sobrevivir a la bacteria en un medio mínimo que contenga sólo 19 nutrientes esenciales. Comparar las rutas metabólicas de esta bacteria con otras, como las de E. coli, muestra que tiene muchas menos rutas o redundancias, sin embargo, presenta muchas más enzimas que realizan más de una función. Esta multiplicidad funcional está regulada por el complejo transcriptoma encontrado por Marc Güell et al. Sorprende que, aunque siendo mucho más simple, las características generales del metabolismo encontrado son similares a las de otras bacterias, así como su capacidad de adaptarse y responder rápidamente ante cambios en la concentración de metabolitos en su medio.

El proteoma de M. pneumoniae es analizado por Sebastian Kühner et al. y también muestra una complejidad mayor de la esperada. Como ocurre con las células eucariotas, más del 90% de las proteínas solubles de M. pneumoniae son componentes de complejos protéicos, en concreto, 62 homomultiméricos y 116 heteromultiméricos (la mayoría desconocidos hasta ahora). Los investigadores también han estudiado la estructura tridimensional de 484 proteínas, han obtenido imágenes de microscopía electrónica (como la de abajo) y tomogramas celulares que permiten observar la organización y localización de las proteínas dentro de la bacteria. Es sorprendente que la red de interacciones entre proteínas se correlaciona pobremente con la organización del genoma y del transcriptoma. Hay genes adyacentes o que se expresan simultáneamente cuyas proteínas asociadas no interactúan entre sí. Inferir toda esta complejidad sólo a partir del genoma parece completamente imposible, más aún teniendo en cuenta el gran número de proteínas multifuncionales encontradas.

¿Cómo la evolución ha sido capaz de lograr un organismo tan simple regulado de una forma tan compleja? La opinión más obvia es que el genoma de esta bacteria ha evolucionado por reducción del número de genes. La acumulación de mutaciones perjudiciales en el genoma ha llevado a que los genes dañados hayan sido eliminados reduciendo así el tamaño del genoma. Conforme los genes se han ido perdiendo, su papel ha sido tomado por los genes restantes, quizás los que cooperaban con ellos en realizar las mismas funciones. Este proceso de sustitución ha conducido a una complicada red de regulación y al desarrollo de nuevas rutas metabólicas. En este sentido, esta bacteria considerada antes como ejemplo ideal de bacteria “simple” en realidad no lo es. Algo parecido puede ocurrir con las bacterias con los genomas más pequeños que existen, como la bacteria simbiótica Hodgkinia cicadicola, con sólo 144 kb (kilobases o miles de nucleótidos), que codifica sólo 15 ARN de transferencia (ARNt) para lograr especificar los 20 aminoácidos que requiere para sintetizar proteínas. Con toda seguridad muchos de dichos ARNt cumplirán funciones múltiples como las observada en el “hat-trick” de Luis Serrano y colaboradores en Science.

El genoma humano se pliega de forma fractal en cada célula

Todos ya lo sabéis. Lo habéis leído en muchos foros. La semana pasada se publicó en Science un artículo que describía la forma fractal del genoma plegado en forma de glóbulo tridimensional dentro de una célula humana. Fue portada de Science y noticia en Nature News por lo que todo el mundo se hizo eco del mismo. Por ejemplo en Nuño Domínguez, “Cómo meter dos metros de ADN en 0,01 milímetros. Un estudio descubre la forma del genoma humano en tres dimensiones,” Público, 09/10/2009 [visto en Menéame]. Yo quería escribir una entrada e ilustraros la misma con la siguiente figura. Poco más de lo dicho ya puedo decir. Luego os dejo sólo con la figura extraída (con retoques) del artículo técnico de Erez Lieberman-Aiden et al. “Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome,” Science 326: 289-293, 9 October 2009. No sé, a veces la pereza me vence. Pero quería dejar constancia de que este artículo me ha parecido muy pero muy interesante. Os recuerdo que la estructura fractal permite poner en contacto cercano genes que han de expresarse de forma conjunta y muestra que el ADN “basura” tiene un papel importantísimo a la hora de posibilitar este plegamiento tan extraordinario (al menos así lo opinaría el mismísimo Mandelbrot).

Dibujo20091015_science_cover_3d_fractal_globule_dna_in_cell_fractal_dimension_general_view 

Hasta cuándo cada nuevo genoma humano secuenciado se publicará en Nature

Dibujo20090709_Geographic_map_ancestry_five_sequenced_genomes_and_SNP_overlapping_between_five_genomes

Próximamente se publicará en Nature el análisis del genoma completo de un coreano, llamado AK1, que se une a los genomas publicados de un africano (un Yoruba), dos individuos de origen europeo (James Watson y Craig Venter) y al de un chino (aparte del genoma de referencia NCBI obtenido por el Proyecto Genoma Humano). Entiendo que cada uno se ha obtenido con técnicas de secuenciación genómica diferentes y que comparar dichos genomas puede tener repercusiones clínicas y antropológicas, pero se me antoja que, como secuenciar un genoma completo cada día es más barato, llegará pronto el día en que este tipo de artículos ya no se puedan publicar en revistas del prestigio e impacto de Nature. Tiempo al tiempo. Para los interesados el artículo técnico es Jong-Il Kim et al. “A highly annotated whole-genome sequence of a Korean individual,” Nature advance online publication, 8 July 2009.

La verdad, yo no tengo mucho más que decir sobre este artículo. Un genoma más, algo importante ahora que hay pocos. En mi opinión de ignorante, comparar el número de polimorfismos de un solo nucleótido (SNP) entre genomas de origen étnico diferente me parece poco interesante. Así que os dejo con las palabras de los propios autores, quizás de interés para algún biólogo experto en secuenciación de genomas.

We have obtained the genome sequence of a Korean individual by a unique combination of whole-genome shotgun sequencing, targeted BAC sequencing, and custom-designed high-resolution array CGH. This combination of approaches improved the accuracy of SNP, indel and CNV detection, and will assist in the assembly of contiguous sequences. Agreement on technical standards for individual genome sequences will aid in comparisons between genomes and, ultimately, to associations with phenotypic differences.”

PD: Los interesados en saber algo más de lo que aporta este nuevo genoma pueden recurrir a Gonzalo Casino, “Secuenciado el quinto genoma humano. Los genes asiáticos se parecen más a los europeos que los africanos,” El País, 08/07/2009. Los interesados en leer los comentarios en Menéame aquí tienen el enlace aunque muchos están enfocados en la línea del racismo.

Biología de sistemas en acción: observar 1020 proteínas en tiempo real

La biología de sistemas trata de entender el funcionamiento de la célula viva. Su complejidad es terrible. Se estima que el genoma humano tiene unos 25000 genes codificadores de proteínas. En cualquiera de nuestras células, ahora mismo, están expresadas miles de genes y otras tantas proteínas están actuando cual instrumentos de una orquesta bien afinada. También hay cientos de metabolitos y miles de ácidos nucleicos (ARN no codificantes).

dibujo20081122sciencecellPara entender un sistema bioquímico tan complejo como la célula hay que verlo en acción. Las técnicas de análisis bottom-up (de lo simple a lo complejo) difícilmente pueden “ver” las complejas interacciones del sistema en su conjunto. Se requieren técnicas que nos permitan ver “en tiempo real” el funcionamiento simultáneo de las decenas de miles de moléculas responsables del correcto funcionamiento celular. ¿Es una utopía? No, ni mucho menos. Los avances en biología de sistemas son increíbles, como nos informa Jocelyn Kaiser, “Cast of 1000 Proteins Shines in Movies of Cancer Cells,” Science 322: 1176-1177, 21 November 2008 . Biólogos de sistemas liderados por Uri Alon del Weizmann Institute of Science, en Rehovot, Israel, han logrado visualizar unas 1000 proteínas humanas en acción simultánea en una célula cancerígena gracias a las técnicas de marcadores fluorescentes (Nobel de Química este año): A.A. Cohen et al. “Dynamic Proteomics of Individual Cancer Cells in Response to a Drug,” Science, Published Online November 20, 2008 . 

El grupo de Alon infectó células de cáncer de pulmón con retrovirus que contenían en su ADN genes de proteínas fluorescentes. Estos virus introdujeron su ADN aleatoriamente en el de las células marcando muchas proteínas de forma fluorescente. Los investigadores aislaron dichas proteínas e identificaron 1020 proteínas marcadas. Decidieron estudiar cómo afectan medicinas anticancerígenas a estas células. Gracias a un microscopio con una cámara de video pudieron estudiar la fluorescencia en una colonia de 12 células durante 48 horas y su reacción a diferentes fármacos. Todo un logro que pasará a la historia de la biología de sistemas.

Desde un punto de vista práctico, el logro les ha permitido identificador dos proteínas que diferencian a las células que sobreviven al tratamiento farmacológico de las que perecen, lo que sugiere nuevas estrategias terapéuticas contra este tipo de cáncer.

¿Para cuándo se podrán las, digamos, 10000 proteínas en acción simultánea en una sola célula? Al ritmo actual de avances científicos en biología, posiblemente en menos de un lustro.

¿Por qué es más fácil secuenciar el genoma de un mamut que el de un elefante?

dibujo20081118lyubiamamut

Cría de mamut congelada encontrada en Siberia.

Lo primero es lo primero. Ya lo habrás leído en todos los medios. Se ha secuenciado el (70% sólo) del genoma de un mamut a partir de sus cabellos (pelo) congelado a 20 grados bajo cero, en Webb Miller et al. “Sequencing the nuclear genome of the extinct woolly mammoth,” Nature 456: 387-390, 2008 . Nos lo cuenta de forma “digerida” Michael Hofreiter, “DNA sequencing: Mammoth genomics,” News and Views, Nature 456: 330-331, 2008 , y también Henry Nicholls, “Darwin 200: Let’s make a mammoth,” News Feature, Nature 456, 310-314, 2008 . En español puedes leer a Malen Ruiz de Elvira, “Un genoma a partir del pelo de dos mamuts,” El Pais, 20-11-2008 , a Miguel G. Corral, “Secuenciado por primera vez el genoma de un animal extinguido: el mamut,” El Mundo, 20/11/2008 , e infinidad de blogs.

Lo segundo, la respuesta a la pregunta. Sí, es más fácil secuenciar el genoma “publicable” de un mamut que el “publicable” de un elefante moderno. 

El ADN encontrado en fósiles está muy fragmentado, además de contaminado por el de bacterias y hongos, con lo que las técnicas de secuenciación de genomas estándares son imposibles de utilizar. Sin embargo, en 2005 se desarrolló una nueva técnica, el método 454, que permite obtener el genoma partido en un gran número de secuencias cortas (de unas 30 bases), con un gran número de errores. Para recuperar el genoma completo es necesario secuenciar entre 10 y 20 veces el mismo genoma y comparar los múltiples resultados obtenidos. Es un proceso muy costoso si se quiere un genoma con calidad. Esto es un poblema grave a la hora de “vender” (anunciar) que se ha secuenciado un genoma moderno. Pero no un genoma fósil, que se encuentra fragmentado en trozos de unas 100 bases como mucho y no podemos esperar obtener el genoma con calidad y el método 454 permite obtener un borrador “malo” pero un borrador “publicable”. Por ello es más fácil secuenciar el genoma de un mamut que el de un elefante moderno. 

Por cierto, se ha secuenciado el genoma de “una” mamut. El cromosoma Y es demasiado pequeño para ser secuenciado con la técnica utilizada. De hecho, uno de los grandes problemas ahora es “repartir” el genoma secuenciado en cromosomas, ni siquiera se sabe cuántos tiene un mamut (¿los mismos que un elefante?). De hecho, ya en la novela Jurassic Park, de Michael Crichton, se clonanban dinosaurios “hembra” (con la excusa de que no se reprodujeran). Si algún día se clona un mamut y se reproduce en un elefante, será hembra.

¿Para qué sirve secuenciar el genoma de un mamut? La verdad, para muy poco. Las diferencias entre su ADN y el de un elefante moderno, del orden del 0.6% son insuficientes para pensar que vayamos a aprender mucho de su genoma.

¿Cuál el próximo borrador del genoma de un animal extingido que se publique? Casi con toda seguridad, el genoma del hombre de Neanderthal.

Para qué estudiar la relación entre los rasgos de las caras de las personas y sus enfermedades

Las manchas del iris del ojo indican a los iridólogos nuestra predisposición a ciertas enfermedades. Las líneas de la mano indican a los quiromantes algo parecido. La cara es el espejo del alma y muchos afirman ver nuestro estado de salud en nuestra propia faz. Sin embargo, para muchos esto es pseudociencia. ¿Quién dedicaría cientos de millones de euros a estudiar las correlaciones entre estos fenotipos y nuestra salud?

Para la mayoría es obvio, hoy en día, que nuestra predisposición a ciertas enfermedades está escrita en nuestros genes. Para la mayoría es obvio que conocer el ADN de cada uno de nosotros permitirá ahorrar miles de millones de euros a los sistemas sanitarios de los países occidentales. Es por ello que se invierten miles de millones de euro en estudiar técnicas para secuenciar genomas humanos de forma ultrarrápida. Hoy todos tenemos móvil. Muchos creen que en unos años todos llevaremos encima un pequeño chip con nuestro ADN grabado. Y muchos otros creen que estaremos dispuestos a pagar su coste (igual que pagamos lo que cuesta nuestro televisor o nuestro ordenador personal).

El número de genomas humanos secuenciados completamente se acaba de doblar (ya hay 6) como nos cuenta Elizabeth Pennisi, “Number of Sequenced Human Genomes Doubles,” Science, 322: 838, 7 November 2008 . Hace menos de una década costó cientos de millones de dólares secuenciar un único genoma humano. Esta semana se han publicado el primer genoma de un africano, el primero de un asiático y el primero de un enfermo de cáncer. Sólo cuatro genomas publicados de individuos anónimos, aunque ya algunos famosos también tienen su genoma secuenciado como J. Craig Venter y James Watson. Estos genomas han costado entre 250 y 500 mil dólares cada uno. El costo seguirá bajando y varias compañías tienen como objetivo bajarlo a unos “ridículos” 1000 dólares por ADN.

Intersección entre conjuntos de SNP entre 3 genomas.

Intersección entre conjuntos de SNP entre 3 genomas.

Estos nuevos genomas, todavía a alto coste, son la base para estudios de la variabilidad genética entre poblaciones humanas y para identificar variaciones relacionadas con la predisposición a enfermedades. Especial interés tienen las cambios de un sólo nucleótico (SNP) y las variaciones estructurales en secuencias duplicadas dentro del propio ADN. Actualmente, se conocen millones de estas variantes y su análisis bioinformático está entre las prioridades en el campo de la genética médica.

Richard Wilson y sus colaboradores de la Washington University School of Medicine, en St. Louis, Missouri, han secuenciado los genomas de una célula de un tumor y una célula normal en una mujer que sufre leucemia mielogénica aguda (AML), Timothy J. Ley et al. “DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome,” Nature, 456: 66-72, 6 November 2008 . La diferencia entre ambos genomas es muy pequeña, menor del 3% de los SNP encontrados. Entre todos los SNP encontrados, los investigadores han destacado 10 como “aparentemente” únicos y característicos de estas células tumorales. Wilson afirma, “creo que no se nos ha escapado ninguno más.” Dos aparecen en genes asociados a la leucemia, pero los ocho restantes apuntan a nuevos candidatos a genes asociados con la leucemia. Estudios similares con otros cánceres no tardarán en llegar y prometen revolucionar nuestro conocimiento sobre las bases genéticas de los diferentes (cientos) tipos de cáncer.

David R. Bentley y sus colaboradores de la empresa británica Illumina Cambridge Ltd. (antes Solexa Ltd.), han secuenciado el genoma de un nigeriano de la tribu de los Yoruba (ver figura), básicamente para demostrar sus avances en la tecnología de secuenciación automática de genomas, David R. Bentley et al. “Accurate whole human genome sequencing using reversible terminator chemistry,” Nature, 456: 53-59, 6 November 2008 . Han necesitado 8 semanas y unos 250.000 dólares. Lo que no es mucho. Las tecnologías de secuenciación masivamente paralela permitirán convertir la secuenciación del genoma en una herramienta clínica imprescindible en el futuro, proclaman los autores, obviamente mostrando que son parte interesada en ello. 

Jiang Wang del Beijing Genomics Institute, en Shenzhen, China, y sus colegas han secuenciado el genoma de un hombre chino de Han, Jun Wang et al. “The diploid genome sequence of an Asian individual,” Nature, 456: 60-65, 6 November 2008 . Mientras que el africano mostraba unos 4 millones de SNP, de los cuales 1 millón eran nuevos, el genoma del chino muestra unos 3 millones de los cuales 417.000 son nuevos. Como es de esperar, la variación genética por kilobase del africano es mayor que la del chino y que la del caucásico (secuenciado por el Proyecto Genoma Humano, Nature, 2001, y por Celera Genomics, Science, 2001), dado que sus ancestros se remontan más lejos en la escala evolutiva humana.

La empresa Illumina espera que el costo de secuenciar un genoma baje a unos 10.000 dólares el año que viene y a unos 1000 dólares en un lustro. La competencia entre varias empresas del sector a nivel mundial garantizará que cumplan con sus objetivos. El problema ahora es otro, ¿cómo interpretar clínicamente los datos ofrecidos por un genoma dado? ¿Para qué sirve conocer un genoma? Ahora mismo, para lo mismo que sirve la quiromancia (lectura de las manos) o la iridología (lectura del iris) o la intución de nuestra abuela (“niño qué mala cara tienes”). Ahora mismo, para nada. Dentro de unas décadas, la mayoría espera que sirva para mucho. ¿Se cumplirán sus expectativas?

Para qué sirve el ADN basura y por qué las células fabrican ARN a partir de él

Sólo del 1-2% del ADN humano produce ARN que codifica proteínas. El resto era calificado como ADN “basura” (junk), ¿sirve para algo? Anna Petherick trata de contestar a las preguntas del título en Nature News, Nature 454, 1042-1045 ( 2008 ), published online 27 August 2008 .

En el cromosoma humano 12 se encuentra un trozo de ADN llamado HOTAIR (HOX antisense intergenic RNA), que no codifica ninguna proteína, luego no corresponde a un gen, aunque sí produce una molécula de ARN de unos 2.200 nucleótidos, llamada STAR por su descubridor, que afecta a ciertos genes del cromosoma humano 2 relacionados con el crecimiento de células de la piel. HOTAIR fue descubierto por John Rinn, quien lo califica como una “joya en el mar de los ARN largos.” Esta gran molécula de ARN no codificante es similar a Xist, el ejemplo más famoso de ARN largo no codificante, descubierto en 1991, que tiene 17.000 nucleótidos.

Hace sólo una década el ARN era considerado un mero intermediario entre el ADN y la maquinaria molecular de fabricación de proteínas, sin embargo, hoy las cosas han cambiado. Thomas Gingeras en 2005 demostró que en algunas células el 80% del ADN produce moléculas de ARN. En 2008, se ha demostrado que el 74% del genoma de la levadura de la cerveza (Saccharomyces cerevisiae) y el 90% de la levadura Schizosaccharomyces pombe producen ARN no codificante. ¿Para qué sirven todos estos “genes de ARN”? Actualmente no se sabe para qué sirven, ni siquiera se sabe si todos sirven para algo o sólo algunos. En especial, la polémica está servida para los trozos grandes de ARN no codificantes, algunos de más de 10.000 nucleótidos. De hecho, hay investigadores que creen que son “errores” que han permanecido en el genoma durante la evolución.

¿Cómo se puden saber para qué sirven? Lo más fácil es alterar genéticamente el ADN y ver qué pasa. Por ejemplo, en ratones, Jürgen Brosius de la University of Münster, Alemania, ha eliminado 150 nucléotidos que gneran ARN no codificantes en neuronas de ratones. Como resultado, aparentemente, nada ha pasado. Eso sí, el comportamiento de los animales parece “ligeramente” alterado en ciertos test de inteligencia. pero los cambios son muy sutiles para poder asociarlos completamente a dicha alteración genética.

Los investigadores que creen que estas cadenas largas de ARN no sirven para nada ponen siempre como ejemplo ciertos estudios de levaduras que muestran que muchas cadenas largas de ARN son rápidamente destruidas por el exosoma nuclear, un complejo protéico que degrada el ARN. En dicho caso, es difícil suponer que tienen alguna función específica. Gingeras contesta a dichos investigadores que dos tercios de los ARN largos portan una etiqueta molecular que hace que sean rápidamente degradados, pero el tercio restante no la porta, al menos que se sepa, luego puede tener algún tipo de función específica.

La cuestión está abierta actualmente. Futuros estudios decidirá si los ARN largos forman parte del transcriptoma, las redes de señalización celular que determinan cuándo se debe expresar o reprimir la producción de genes, o por el contrario son en su mayoría meros “errores” de transcripción que se han propagado gracias a la evolución.