Qué significan cinco sigmas para el descubrimiento del bosón de Higgs

Casi todos los lectores de este blog saben que cuando los indicios sobre la existencia de un bosón de Higgs alcancen cinco sigmas se podrá afirmar que ha sido descubierto. Sin embargo, lo que casi todos ignoran es que la frase anterior, escrita como tal, es mentira. Qué significan “cinco sigmas” a secas, nada en absoluto. Hay que clarificar los parámetros de la hipótesis, es decir, en el caso de la existencia del bosón de Higgs hay que especificar en que intervalo de masas se han alcanzado cinco sigmas de significación estadística. Este intervalo de masas es diferente en el Tevatrón, que buscó el Higgs en el intervalo entre 100 y 200 GeV, y en el LHC, donde además depende de la energía de las colisiones, ya que a 7 TeV c.m. (año 2011) se buscó el Higgs en el intervalo entre 100 y 600 GeV, mientras que a 8 TeV c.m. (año 2012) se está buscando entre 100 y 800 GeV.

¿Por qué no buscar el Higgs donde creemos que está, digamos entre 115 y 135 GeV? Porque desde un punto de vista estadístico se estaría sesgando la búsqueda, con lo que fluctuaciones estadísticas muy probables entre 100 y 800 GeV, parecerían muy excepcionales en un intervalo tan pequeño. Las cinco sigmas de significación estadística deben ser globales si queremos ser rigurosos. Cinco sigmas de significación estadística local solo son del agrado de los blogueros a los que nos encanta propagar rumores con poco fundamento (estadístico, valga la redundancia).

¿Cuál es el intervalo de masas más adecuado para estudiar la hipótesis de la existencia del Higgs? La pregunta del millón de dólares no tiene una respuesta clara. En los anuncios oficiales de la dirección del CERN (así ha sido durante 2011) se ha utilizado el intervalo de masas completo utilizado en la búsqueda (recuerda, entre 100 y 600 GeV en 2011, intervalo que llegará en 2012 hasta los 800 GeV). ¿Se trata de la decisión más adecuada? No importa, se trata de la decisión más conservadora y la que más información aporta a los físicos, pues cinco sigmas en un intervalo tan grande no solo implica un descubrimiento, sino también la ausencia de otros primos del Higgs (reafirmando de forma indirecta que se trata del único bosón de Higgs predicho por el modelo estándar). ¿Por qué no usar en su lugar el mismo intervalo de masas utilizado por el Tevatrón? Pues porque no es necesario. A finales de año, incluso en el intervalo más grande disponible se podrá proclamar un descubrimiento a cinco sigmas, para qué molestarse entonces en reducir dicho intervalo antes de tiempo.

¿Qué significa todo esto en relación al anuncio del próximo miércoles 4 de julio? El anuncio oficial de diciembre de 2011 fue muy pesimista y no llegó ni a dos sigmas de significación estadística global en todo el intervalo entre 110 y 600 GeV para los dos grandes experimentos del CERN (en concreto, 1,5 sigmas en CMS, aunque alcanzó 2,2 sigmas en ATLAS). Si pensamos que es más razonable un intervalo pequeño alrededor de 125 GeV, la significación crece hasta 3,6 sigmas en ATLAS y hasta 2,6 sigmas en CMS. Y si además combinamos estos resultados con los del Tevatrón y los de LEP2, podemos estar hablando de unas 4 sigmas (solo con los datos disponibles a fecha de diciembre de 2011). Esto es casi un descubrimiento, por eso muchos blogs y yo mismo creemos que era una señal muy firme del Higgs (aunque dicha señal apunta a un primo del Higgs). Por supuesto, esta significación local es muy discutible, pues implica un sesgo (busco donde sé que se encuentra y asumiendo que se encuentra allí). Es mucho más fiable una significación global en todo el intevalo de búsqueda en el que puedo buscar, lo que oficialmente hace la dirección del CERN para no mojarse las manos.

Imagina que el próximo miércoles, 4 de julio, los dos grandes experimentos del LHC, llamados ATLAS y CMS, ofrecen indicios sobre la existencia del Higgs a cuatro sigmas (de confianza estadística para la hipótesis de que el Higgs existe en un intervalo entre 100 y 600 GeV). Combinando ambos indicios se superarán las cinco sigmas, lo que significa que se podría proclamar oficialmente un descubrimiento. ¿La dirección del CERN proclamará un descubrimiento oficial del Higgs? En mi opinión no, no lo harán. Sin realizar la combinación de forma rigurosa, no será utilizada de forma oficial.

¿Deberían combinarse los datos de ATLAS y CMS antes de publicarlos por separado? Quizás sí, es una cuestión de opiniones, pero no se hará. No se hará porque no es necesario hacerlo. En diciembre de 2012, ambos experimentos tendrán indicios sobre el Higgs a más de cinco sigmas y por tanto ambos proclamarán un descubrimiento. La combinación de sus colisiones no se realizará hasta 2013 (quizás no se publique hasta el verano de 2013).

¿Por qué no se acelera todo el proceso? Porque no merece la pena hacerlo. El trabajo teórico de Higgs tiene casi 50 años, el LHC se propuso hace unos 30 años, su diseño y construcción ha costado unos 20 años, y solo llevamos un año y medio tomando datos. ¡Solo 18 meses! La búsqueda del Higgs en el LHC acaba de empezar y confirmar de forma definitiva que se trata de la partícula predicha por el modelo estándar costará unos 20 años. ¿Por qué van a tener prisa las autoridades del CERN? ¿A quién le importa lo que algunos digan? Las cosas son así y así seguirán, ¿por qué han de cambiar?

Como nos cuenta Aidan Randle-Conde, “Why we shouldn’t combine Higgs searches across experiments,” USLHC, Quantum Diaries, June 28th 2012, la razón por la que dos experimentos están buscando el Higgs en el LHC es porque si uno de ellos proclama un descubrimiento, no estará confirmado hasta que otro lo confirme (o lo refute). Por eso, muchos experimentos se diseñan a pares, ATLAS y CMS en el LHC, CDF y DZero en el Tevatrón, UA1 y UA2 en el SPS, Belle y BaBar, etc. Combinar la información de dos experimentos en competencia solo tiene sentido una vez se ha proclamado el descubrimiento por separado en cada uno de ellos. En el Tevatrón nos hemos acostumbrado a que las combinaciones de CDF y DZero se publicaran muy poco después de su publicación por separado, quizás por la presión del LHC, en un intento desesperado por ser los primeros, pero no podemos considerar que esa costumbre excepcional deba ser la regla a seguir; el Tevatrón solo debe ser considerado como la excepción que confirma la regla: solo se combinan los datos de experimentos en competencia mutua cuando ambos han proclamado un descubrimiento. En mi opinión, así se hará en el LHC del CERN.

Lo de siempre, aunque no tenga nada que ver. Que te salgan 5 caras seguidas no significa que la moneda esté trucada y tenga dos caras. Puede que sí, puede que no. Pero que te salgan 50 caras seguidas apunta de forma muy firme a ello. Mirar solo 5 tiradas de 10 monedas da poca información sobre cuáles están trucadas y cuales no; mirar 50 tiradas de una sola moneda da mucha más información sobre si está trucada o no. Pero las sigmas se pueden calcular tanto en un caso como en otro. No es lo mismo 5 sigmas en el primer caso, que 5 sigmas en el otro.

Por todo ello la dirección del CERN prefiere una significación estadística global. ¿Qué harán el próximo miércoles? No creo que cambien de chaqueta en el último momento (como suelen hacer los políticos), sobre todo teniendo en cuenta que en diciembre de 2012 , salvo que ocurra una catástrofe, podrán afirmar que el Higgs existe con una significación global superior a 5 sigmas (y una local cercana a 10 sigmas en algunos canales en el intervalo de 120 a 130 GeV o similar). Por supuesto, ofrezco mi opinión, tan discutible como la de cualquiera.

Mucho hablar de sigmas, pero ¿qué son las sigmas de confianza en la validez de una hipótesis? Nos lo contó Aidan Randle-Conde, “A sigma here, a sigma there…,” Quantum Diaries, 9 May 2012. La palabra “sigma” se refiere a la desviación estándar, denotada por la letra griega del mismo nombre, σ. En el caso más sencillo podemos considerar una distribución gaussiana de probabilidad (también llamada distribución normal). Tomando una con media cero y desviación estándar igual a la unidad, diremos que un dato está desviado más de una sigma de la media si están en la zona rayada de la figura (su módulo es mayor que la unidad). La probabilidad de una fluctuación estadística sea responsable de señal a una sigma es igual a alrededor del 32%. De manera similar la probabilidad de fluctuaciones a dos, tres, cuatro y cinco sigmas más allá de la media es del 5%, 0,3%, 0,005% y 0,00005%, respectivamente.

En los experimentos de física de partículas hay dos fuentes de desviaciones respecto a las predicciones del modelo estándar, por un lado, los errores debidos a fluctuaciones estadísticas y los errores sistemáticos debidos a que calcular las predicciones por ordenador no se puede hacer de forma exacta, y por otro lado, la presencia de una nueva partícula o de una ley física que hace que la Naturaleza difiera de las predicciones teóricas. Para distinguir ambas posibilidades se utiliza el número de sigmas comparado con la probabilidad de que una fluctuación estadística explique dicho resultado. Esta probabilidad depende los parámetros de la hipótesis que se esté estudiando (por ejemplo, el intervalo de masas considerado en el caso del Higgs).

Esta figura muestra la simulación de 100 resultados de una distribución gaussiana junto a la banda de una sigma. Se pueden ver claramente fluctuaciones a dos sigmas de origen puramente estadístico. Si en lugar de 100 resultados tuviéramos 1000, habría alguna fluctuación a tres sigmas. Conforme el número de realizaciones del experimento crece, la probabilidad de observar un punto alejado de la media por un gran número de sigmas crece.

En el caso del bosón de Higgs encontrar una fluctuación estadística a tres sigmas en el intervalo de energías entre 100 y 800 GeV es mucho más probable que encontrarla en un intervalo entre 117 y 127 GeV, por ello el número de sigmas se corrige para tener en cuenta el efecto de la longitud del intervalo. Por tanto,  si observamos una señal a cinco sigmas locales entre 117 y 127 GeV no significa que tengamos un descubrimiento, ya que dicha señal observada en el intervalo entre 100 y 800 GeV se reduce a menos de cuatro sigmas globales. O lo que es lo mismo, una señal a cinco sigmas globales que permite proclamar un descubrimiento es una señal a más de siete sigmas locales lo que nos hace estar muy seguros de lo que parece que estamos observando realmente está ahí.

Espero haber aclarado un poco este tema (hacerlo de forma rigurosa requiere recordar las técnicas matemáticas de contraste de hipótesis y hoy no quiero ser más matemático de la cuenta).

Una revisión informal de la historia de la partícula de Higgs

Mucha gente dice que mi blog es muy técnico y difícil de entender. La verdad es que para mí no es fácil utilizar un lenguaje sin jerga. Esta entrada es informal y muchos físicos me tirarán de las orejas, pero así es como le conté a un buen amigo, periodista, hace solo unos días, la historia del Higgs. Lo dicho, quizás os guste o quizás no.

El problema original que resolvió Higgs es teórico, buscar los límites de un teorema matemático que entonces conocían (y preocupaba a) muy pocas personas en todo el mundo, el teorema de Nambu-Goldstone. El teorema predecía que el universo estaba plagado de partículas sin masa que nadie había observado. Si así fuera, no existiríamos, pero como existimos, tenía que haber una puerta trasera para salir del entuerto. Planteado alrededor de 1960, la solución se obtuvo en 1964 (por los pocos a los que preocupaba resolver esta tontería, ex-alumnos de Nambu y Goldstone, obviamente).

Como resultado de la solución tenía que existir una partícula (la de Higgs), pero no importaba que nadie la hubiera observado porque su masa era arbitraria y por tanto podía ser tan grande que no afectase en nada en absoluto a toda la física conocida entonces. Problema resuelto, todos nosotros podíamos existir (bueno, ya existíamos, pero me entendéis…)

Para qué servían estas ideas. Para nada. Una chorrada técnica más. Hasta que dos alumnos de Goldstone, llamados Weinberg y Salam aplicaron en 1967 la idea de Higgs a una teoría propuesta por Glashow en 1961. Nadie les hizo ni caso. Imaginaos qué chorrada. Puro exotismo teórico. De hecho, Weinberg abandonó esta línea de trabajo porque no llevaba a ninguna parte y se puso a trabajar en cosmología; muchos habréis leído su famoso libro de divulgación “Los tres primeros minutos del universo.”

Pero resulta que en 1971 uno de los pocos que trabajaban en estas chorradas (había poquísimos en todo el mundo), le mandó a uno de sus alumnos, uno de los mayores genios de la historia reciente, ‘t Hooft, que resolviera un sencillo ejercicio: demostrar lo que todo el mundo sabía, que la teoría de Weinberg-Salam-Glashow era incorrecta y no servía para nada (en lenguaje técnico que no era renormalizable). El ejercicio de Veltman estaba orientado a entrenar a ‘t Hooft en el estudio de la renormalizabilidad de la gravedad cuántica para un gravitón masivo (problema mucho más duro que también resolvió el chaval, que hoy ya es Premio Nobel).

La enorme sorpresa fue que la teoría era renormalizable (gracias a las técnicas inventadas por Veltman y a que ‘t Hooft utilizó un programa de ordenador para hacer los cálculos, el mismo que ahora, mejorado, utilizan muchos físicos jóvenes). Gracias a esta propiedad se podían realizar cálculos con la teoría de Weinberg-Salam-Glashow (antes la teoría no servía para nada porque nadie podía calcular nada con ella). Lo maravilloso fue que los cálculos coincidían con la realidad. En 1973 ya se sabía que tenía que ser la teoría correcta, porque era la única que describe todo lo que conocemos, la única capaz de hacerlo, entonces y ahora, porque aún sigue siéndolo.

Poder calcular las predicciones de una teoría es maravilloso porque permite demostrar que la teoría es incorrecta. Se calcula todo lo que predice, se comprueba que falla y listo, ya nos podemos poner manos a la obra y desarrollar una teoría mejor. Pero aquella teoría, llamada modelo estándar, no ha fallado nunca.

Nunca quiere decir nunca. Eso sí, la teoría permite añadir o quitar ciertas cosas. Los neutrinos pueden tener masa o no tenerla. La navaja de Ockham prefiere que no la tengan, pero nada prohíbe que la tengan. Cuando se descubrió que la tenían, pues nada, ningún problema se mete y punto (todavía no sabemos bien cómo hacerlo porque hay dos opciones, que los neutrinos sean partículas de Dirac o de Majorana, pero no importa en esta historia).

Sin embargo,  también hay cosas que no podemos poner o quitar a la ligera. Una de ellas es el llamado mecanismo de Higgs. Sabemos que existe, está demostrado en los experimentos y funciona a las mil maravillas. En palabras sencillas este “mecanismo” es equivalente a que, a baja energía el electromagnetismo y la fuerza nuclear débil están separadas, pero a alta energía están unificadas. Más de 40 años de experimentos (más o menos desde 1973) lo han demostrado fuera de toda duda. A baja energía son dos fuerzas separadas. A alta energía son una única fuerza. Estoy simplificando las cosas, pues a alta energía son también dos fuerzas, pero otras dos diferentes que a baja energía; los detalles no son importantes y el nombre que se usa es fuerza electrodébil, que alude a una unificación con “pegamento” (el mecanismo de Higgs).

La versión más sencilla del mecanismo de Higgs (la original de 1964) predice la existencia de una partícula, el bosón de Higgs. Hay versiones más avanzadas que predicen varios bosones de Higgs, e incluso que no predicen ninguno. Bastan pequeños retoques en la teoría (“pequeños” quiere decir que ha costado 40 años dominarlos a la perfección y que los físicos teóricos jóvenes si no los dominan suspenden los exámenes y no reciben su título universitario).

El mecanismo de Higgs es maravillosamente simple pues solo tiene un parámetro libre (en su versión mínima) y todo se calcula a partir de dicho número. Solo un número. ¡Qué maravilla! ¿Cuál es ese número? El número mágico es la masa del bosón de Higgs. Este número puede ser cero, infinito o cualquier otro número. Bueno, ya Higgs sabía en 1964 que no es cero (no existiríamos) y que el número más grande posible es la masa más grande compatible con el modelo estándar, la masa de Planck. Pero para la teoría da lo mismo que el número sea 1 GeV, 100 GeV, 10 TeV, o 1019 GeV (la masa de Planck). He dicho para la teoría, pero no para el experimento.

La existencia del Higgs influye en las demás partículas y esa influencia permite saber más o menos cuál es su masa. Alrededor de 1985 se pensaba que la masa estaba entre 1 GeV (0,001 TeV) y 10.000 GeV (10 TeV), por eso el SSC (Superconducting Super Collider) se diseñó para alcanzar colisiones hasta 40 TeV. En 1995 (tras el descubrimiento del quark top) se pensaba que la masa estaría entre unos 10 GeV y unos 1000 GeV. Por la parte baja, unas decenas de GeV, se pensaba que LEP y luego LEP 2 podrían descubrirlo, pero al final solo descubrieron que la masa es mayor de 114,4 GeV. Por la parte alta, se diseñó el LHC con colisiones hasta 14 TeV para poder explorar hasta los 2000 GeV y se pensaba que el Tevatrón con colisiones de casi 2 TeV podría descubrir el Higgs con una masa hasta unos 200 GeV. No fue así. Resulta que el Higgs tiene una masa alrededor de 120 GeV, la región inalcanzable para LEP2 y la región más difícil para el Tevatrón.

El LHC ha tenido suerte, dentro de la mala suerte que es tener un accidente gravísimo como el de 2009. Funcionando a medio gas, con colisiones a 7 TeV hasta 2011 y a 8 TeV en 2012 puede descubrir un Higgs con una masa alrededor de 120 GeV en poco tiempo (solo unos años). Además, está funcionando a las mil maravillas. Este año, el LHC está explorando el rango de masas entre 110 y 800 GeV. El año pasado explorando entre 100 y 600 GeV observó una señal alrededor de 125 GeV. Si se confirma, conoceremos ese parámetro que nos falta, la masa del bosón Higgs (o de uno de los bosones, pues solo importa que sea el que menos masa tenga, con eso basta para que todo funcione a las mil maravillas).

¿Cuántas colisiones hay que analizar en el LHC para descubrir el Higgs? El número es “fácil” de calcular (un físico teórico joven debería ser capaz de calcularlo tras unas semanas de trabajo hasta segundo orden (de la teoría de perturbaciones), es decir, hasta NLO). Por supuesto, calcular a tercer orden NNLO (u otros cálculos más avanzados, como los NLL) son temas de investigación en la actualidad; para sorpresa de muchos, yo entre ellos, los cálculos NLO y NNLO difieren casi en un 50% cuando se esperaba una diferencia menor del 5%. No es que sea difícil realizar estos cálculos, pero requiere mucho tiempo de ordenador, mucho tiempo, y por tanto se requiere cierta “experiencia” para guiar los cálculos del ordenador y hacerlos en un tiempo razonable.

Cuando se realiza este cálculo (que a NLO está publicado por doquier) lo que se descubre es que aún no hay colisiones suficientes para un descubrimiento (del bosón de Higgs del modelo estándar mínimo). Hay muchos primos del bosón de Higgs para los que sí hay colisiones suficientes y muchos otros para los que nunca habrá colisiones suficientes en el LHC.

¿Qué se dirá el 4 de julio? No lo sé. Pero quien piense que se publicará el descubrimiento definitivo del Higgs debe saber que no puede ser el Higgs del modelo estándar, será uno de sus primos. La estadística nunca miente. Siento decepcionarte, pero no quiero engañarte. El anuncio no será más gordo que el de diciembre de 2011. La razón es muy sencilla, se han analizado un número insuficiente de colisiones para asegurar 100% un descubrimiento. A lo más, se ratificará la señal ya observada, lo que para los físicos es muy importante, pero recuerda mis palabras, desde el CERN en la rueda de prensa dirán que todavía no se puede asegurar al 100% que el Higgs existe.

Hay muchos rumores, pero siendo realistas, 5 sigmas de significación local no es suficiente para que los directores del CERN proclamen un descubrimiento. Ellos son así. No quieren volver a cometer el error de Carlo Rubbia en 1984 (cuando proclamó con un número de colisiones insuficiente que el quark top había sido descubierto con una masa de unos 40 GeV). La significación global es imposible que alcance 5 sigmas, los números no salen (esto es como sumar 2+2, por mucho que quieras no da 22), al menos antes de diciembre de 2012 (y siempre que todo vaya viento en popa y a toda vela en el LHC; crucemos los dedos).

Recuerda que esto es como cuando se supo que la Tierra era “redonda” y se le podía dar la vuelta. Maravilloso. Un gran descubrimiento. Pero hasta que alguien no intentó darle la vuelta no se hicieron descubrimientos de verdad. Aquí pasa lo mismo. Una partícula que parece ser el Higgs es solo eso, un candidato a ser el Higgs. Estudiar su física en detalle requiere una fábrica de Higgs que produzca miles al año (no bastan unos pocos, menos que los dedos que tenemos para contarlos).

Cassini observa pruebas de un océano líquido a 100 km de profundidad en Titán, el mayor satélite de Saturno

La superficie helada de Titán, la mayor luna de Saturno, se mueve siguiendo el ritmo de las mareas como si se encontrara encima de un inmenso océano líquido (que se encontraría a 100 km de profundidad bajo la superficie). Así lo ha descubierto la sonda Cassini tras medir el campo gravitatorio de esta luna en seis sobrevuelos realizados entre 2006 y 2011. Titán orbita alrededor de Saturno con un periodo de 16 días y posee una atmósfera compuesta sobre todo de nitrógeno, con algo de metano y en menor cantidad algunos hidrocarburos. El nuevo océano descubierto bajo la superficie podría ser el responsable de la existencia de esta atmósfera. ¿Podría haber vida en este océano bajo la superficie? Los exobiólogos creen que no, ya que se trata de un océano más frío de lo que permitiría la bioquímica de la vida  de forma sostenible. Cassini seguirá tomando datos de Titán durante los próximos cinco años, lo que nos permitirá conocer mejor sus propiedades. Nos lo cuenta Richard A. Kerr, “Cassini Spies an Ocean Inside Saturn’s Icy, Gassy Moon Titan,” Science 336: 1629, 29 June 2012, haciéndose eco del artículo técnico de Luciano Iess et al., “The Tides of Titan,” Science Express, Published Online June 28 2012. Más información en Teresa Guerrero, “Un océano de agua líquida bajo la superficie de Titán,” El Mundo, 28 junio 2012.

Los conos en la retina de los peces elefante forman un cristal fotónico que les permite ver colores a través de aguas turbias

Los cristales fotónicos son materiales ópticos estructurados que repiten cierto patrón en una escala nanométrica, por debajo de la longitud de onda de luz. En la Naturaleza son muy comunes (por ejemplo, en los ópalos o en las alas de las mariposas). Se publica hoy en Science que los conos (fotorreceptores) de la retina de los peces elefante (Gnathonemus petersii) se agrupan formando macrofotorreceptores de tipo cristal fotónico. Gracias a ello se incrementa su sensibilidad para detectar estímulos coloreados en un ambiente muy ruidoso, permitiéndoles ver colores a través de las aguas turbias del hábitat en el que viven. El artículo técnico es Moritz Kreysing et al., “Photonic Crystal Light Collectors in Fish Retina Improve Vision in Turbid Water,” Science 336: 1700-1703, 29 June 2012.

Este vídeo muestra una reconstrucción tridimensional de cómo 6 conos (células fotorreceptoras) se agrupan formando un macrorreceptor hexagonal con forma de copa o jarrón. Las paredes de esta copa están formadas por cristales de guanina y melanina. Os recuerdo que en la retina hay dos tipos de fotorreceptores, los bastones (para ver en blanco y negro) y los conos (para ver en color). Los bastones permiten ver en un ambiente muy oscuro, pero los conos son “ciegos” en dicho ambiente. Por ello de noche no podemos distinguir bien los colores y vemos como en blanco y negro. Los macrorreceptores de la retina de los peces elefante permiten que sus conos sean capaces de ver colores en un ambiente con una luz muy tenue, como el agua turbia. Ya se sabía que algunos peces podían ver colores en estas circunstancias, pero no se conocía la razón última.

El nuevo artículo en Science propone una solución muy razonable a este problema, que se ha comprobado con simulaciones por ordenador mediante el método de diferencias finitas en el dominio del tiempo (FDTD). La parte interior de las “copas” formadas por los sesis conos, gracias a la presencia de cristales de guanina y melanina, actúa como un espejo parabólico que amplifica la luz en ciertas regiones donde se encuentran fotopigmentos para los colores verde (536 nm) y rojo (615 nm). Gracias a ello, los peces Gnathonemus son capaces de observar colores rojos en aguas muy turbias. La Naturaleza, gracias a la evolución por selección natural, encuentra soluciones sorprendentes que ofrecen muchas oportunidades a los ingenieros especializados en biomimética.

Hoy se ha publicado el nuevo JCR 2011 de Thomson Reuters

Como todos los años, me hago eco de la publicación del nuevo Journal of Citations Reports (2011 JCR Science Edition).  Los que publicamos artículos, tenemos la obligación de actualizar los índices de calidad de nuestras publicaciones aparecidas en 2011, que hasta hoy solo tenían información sobre 2010. Nature (36,280) vuelve a estar por encima de Science (31,201), algo que ya viene ocurriendo desde 2007. España cuenta con 78 revistas (en el Science JCR), cuando en el 2010 JCR solo tenía 73. Como ya sabéis me gusta la categoría de ciencia multidisciplinar, os dejo los primeros 10 puestos.

Como bien sabéis la utilidad del 2011 JCR está en la comparación de revistas dentro de un área de conocimiento concreta. Las comparaciones generales son odiosas. A los que tengáis acceso en España (vía la FECYT) os animo a ojear las categorías que más os atañan, aunque sin olvidar que no debemos abusar del índice de impacto (aunque la ANECA lo haga por nosotros).

En mi área de conocimiento “natural,” que es MATHEMATICS, APPLIED, vuelve a reinar SIAM Review con una diferencia cada más abultada (pasa de 6,620 a 10,020). Me alegra, porque ha habido desviaciones no deseadas en los últimos años (gracias a la ingeniería del índice de impacto por parte de los editores de ciertas revistas de “segunda”). Revistas “patológicas” como Chaos, Solitons & Fractals vuelven al redil (después de estar por encima de 3 hasta 2009, fictioso, obviamente, ahora tiene 1,222, cuando tuvo 1,268 en el 2010 JCR, un valor mucho más natural para el impacto real de esta revista); o como el International Journal of Nonlinear Scienes and Numerical Simulation que lleva una caída abismal como muestra la siguiente figura (en mi opinión su índice de impacto natural es del orden de la unidad, no más y porque publican en ella muchos “lobbies” de chinos).

 Por cierto, ¿cómo ha quedado PLoS ONE, la gran revista de acceso gratuito en la que todo el mundo quiere publicar? La aprovecharé para explicar qué es el índice de impacto, que quizás mucha gente no conoce o no recuerda cómo se calcula.

El cálculo del índice de impacto es muy sencillo. Se suman todos los artículos publicados por la revista en los dos últimos años (en el 2011 JCR serán 2010 y 2009); en el caso de PLoS ONE son 11.125, sí has leído bien, más de once mil artículos. Se suman el número de artículos publicados en 2011 en revistas del 2011 JCR que han citado a algún artículo de la revista publicado en 2009 o 2010. En el caso de PLoS ONE, 45.521 artículos de 2011 (tanto de PLoS ONE como de otras revistas) han citado a los anteriores artículos. Finalmente, se obtiene el índice de impacto como el cociente entre ambos números. En el caso de PLoS ONE resulta 4,092, lo que no está mal.

Lo importante es la posición de la revista en las categorías (o áreas de conocimiento) a las que pertenece. En el caso de PLoS ONE solo pertenece al área de BIOLOGY y se encuentra en la posición número 12 de un total de 84, es decir, en el primer cuartil. Por cierto, en este área la revista mejor impactada es PLoS Biology, que alcanza un índice de impacto de 11,452.

Bueno, no sé qué más decir; además ahora tengo que actualizar mi currículum vitae.

PS (29 junio 2012): Álvaro Cabezas, “Las revistas españolas en los JCR 2011,” Primer Cuartil (Q1), 29 Junio 2012, nos recuerda que “Los JCR de Thomson Reuters recogen este año el índice de impacto de 10.677 publicaciones, de los cuales 528 lo reciben por vez primera. Son 127 las revistas españolas incluidas, en concreto 78 revistas corresponden al índice de Ciencias (SCI) y 54 al de Sociales (SSCI), cinco están en ambos índices, lo que significa en el caso del SCI cinco y en el del SSCI seis revistas más que el año anterior. (…) El dato anómalo en lo que respecta a las revistas españolas lo encontramos este año en la Revista de Psicodidáctica, editada por la Universidad del País Vasco, que ha aumentado su factor de impacto espectacularmente, desde el 0,815 hasta el 2,667, alzándose a la sexta posición en su categoría (Psychology, Educational). (…) A nivel internacional, por vez primera una revista supera los 100 puntos de factor de impacto (CA – A Cancer Journal for Clinicians; 101,780); [además] PLoS One, pese a su absurda política de publicación indiscriminada se mantiene con un índice por encima de cuatro. (…) Finalmente, la polémica este año la podemos tener con la desconocida revista turca Energy Education Science and Technology que alcanza un impacto de más de 31 puntos, por encima de Science, y que con una evidente falta de escrúpulos (autocitación del 90% y vida media de citas de solo 1,5 años) es la candidata número uno a ser expulsada del ISI ipso facto.”

PS (30 junio 2012): Los interesados en ver el listado de todas las revistas incluidas en el JCR pueden consultar este PDF. Las nuevas revistas que han sido incluidas aparecen en este otro PDF. Como nos cuenta Richard Van Noorden, “Record number of journals banned for boosting impact factor with self-citations,” Nature News Blog, 29 Jun. 2012, “Thomson Reuters ha excluido este año 51 revistas del 2011 JCR, cuando solo fueron excluidos 34 en 2010, 26 en 2009, 20 en 2008, y solo 9 en 2007. Casi todos han sido excluidos porque tienen un número excesivo de autocitas (“an anomaly in citation stacking”). Hay 140 revistas con un índice de autocitas superior al 70% que están en la sala de espera. ¿Cuál es el número normal de autocitas? 4/5 de todas las revistas tienen un porcentaje de autocitas menor del 30%.

Un ejemplo de cómo funciona la exclusión por autocitas. La revista Journal of Biomolecular Structural Dynamics (JBSD) ha sido excluida del 2011 JCR porque su índice de impacto subió de 1,1 en 2009 hasta 5,0 in 2010. Thomson Reuters solicitó al editor que explicara la razón de su éxito. Por lo que parece el editor decidió en 2009 recomendar a todos los autores de nuevos artículos que relacionaran su trabajo con el presentado en artículos recientes publicados en JBSD (supuestamente con objeto de mejorar la formación de los jóvenes estudiantes de doctorado que empiezan a leer la revista). Obviamente, la revista ha sido excluida del 2011 JCR por mala praxis del editor. El editor ha decidido cambiar de política (ya no apoyará la formación de los jóvenes doctorandos) y espera que dicho cambio le permita volver a entrar en el JCR (durante un par de años estará siendo vigilada y si corrige su mala praxis volverá a entrar en 2012 o en 2013).

¿Por qué no elimina Thomson Reuters las autocitas del cálculo del índice de impacto? Desde hace 3 años, el JCR incluye tanto el índice de impacto con autocitas como sin ellas. Por lo que parece, estadísticamente están bien correlacionados, luego no “merece la pena” utilizar solo el índice sin autocitas; según Thomson Reuters significaría un cambio fundamental en los cálculos del índice de impacto para corregir un problema que casi no existe.

 

Para los españoles que leen esto, les recuerdo que desde la ANECA todavía no han descubierto que el JCR incluye el índice de impacto de las revistas sin autocitas; espero que no lo descubran (por si acaso).

PS (01 julio 2012): En las revistas españolas también hay ingeniería del índice de impacto: Topo, “JCR 2011. Todo se pega. Ahora le toca manipular a la Revista de Psicodidáctica,” Un nombre al azar, Julio 01, 2012.

La teoría electrodébil, el bosón de Higgs y su historia

Mucha gente que afirma a la ligera que el bosón de Higgs podría no existir (e incluso que de hecho no existe) no tiene ninguna duda sobre la unificación electrodébil. Creen a pies juntillas que el electromagnetismo y la interacción débil están unificadas a alta energía, aunque no exista el bosón de Higgs. Esta contradicción es curiosa, pues sin el campo de Higgs la unificación electrodébil se hunde en el fango (la teoría no es renormalizable). A baja energía la interacción electromagnética y la débil son muy diferentes entre sí; la constante de acomplamiento electromagnética, α, es mucho mayor que la débil, sea α/(MW)2  o  α/(MZ)2, ambas están gobernadas por la misma constante adimensional α, siendo la única diferencia que los bosones vectoriales W y Z tienen masa y el fotón no la tiene. A alta energía la interacción electrodébil unifica ambas fuerzas imponiendo una simetría que afirma que Mϒ=MZ=MW (en realidad estas partículas a alta energía reciben como nombres A y B, pero esto es un detalle menor).  El campo de Higgs es el encargado de romper esta simetría a una energía v=246 GeV y separar el comportamiento del fotón y los bosones W y Z. El bosón de Higgs es consecuencia natural del campo de Higgs. Que alguien piense que no existe el bosón de Higgs, pero sí el campo de Higgs, en mis cortas miras, es muy poco natural. Obviamente, hay muchas propuestas teóricas, retruques técnicos para evitar lo natural, pero cuántas de ellas son renormalizables; quizás, la teoría correcta no tenga que ser renormalizable, pero muchos de lo que afirman que el bosón de Higgs no existe, no dudan de la renormalizabilidad. Os pido perdón, pero yo no entiendo por qué mucha gente famosa habla con total naturalidad sobe el Higgs afirmando que puede que exista o puede que no exista, en pie de igualdad, cuando la natural es que exista y lo “antinatural” es que no exista.

Hemos progresado mucho en 10 años. En el año 2000, LEP2 excluyó un Higgs con una masa menor de 113,4 GeV (más tarde se subió a 114,4 GeV). No supimos nada más hasta el año 2008, cuando el Tevatrón logró excluir un Higgs con una masa de 170 GeV al 95% CL. El avance ha sido rapidísimo y el LHC ha buscado el Higgs en el intervalo entre 110 y 600 GeV desde el año 2010, excluyendo su existencia salvo en un pequeño intervalo de masas entre 117 y 127 GeV (a fecha de hoy). La semana que viene sabremos un poquito más. ¿Por qué todo el mundo tiene tanta prisa en saberlo todo sobre el Higgs? ¿Por qué se olvida que no llegaremos a saberlo todo sobre el Higgs hasta dentro de un par de décadas, como mínimo? Lo natural es que el Higgs exista y que lo encontremos este año, pero lo interesante está en los detalles y no los conoceremos este año; repito, serán necesarias al menos dos décadas para que profundicemos en estos detalles. Para mí es realmente curioso.

Esta figura, ya obsoleta, muestra los límites de exclusión para el bosón de Higgs obtenidos por el experimento ATLAS del LHC en el CERN en el verano de 2011. Hace solo un año y ya no interesa absolutamente a nadie. En verde la curva correspondiente a las colisiones del año 2010, en rojo la curva publicada en julio de 2011 (EPS-HEP 2011) y en negro la curva de finales agosto (LP 2011). Estas dos últimas curvas se obtuvieron con entre 1 /fb y 2,3 /fb de colisiones a 7 TeV c.m., según el canal de búsqueda del Higgs. ¡Cuánto hemos avanzado desde entonces y solo ha pasado un año! La figura la he extraído de Sven Heinemeyer (IFCA, Santander, CSIC), “Farewell,” Higgs days at Santander, Sept. 2011.

A veces hay que retomar el pasado para darse cuenta de lo rápido que estamos avanzando. Pero nunca es suficientemente rápido, siempre queremos aún más rápido. ¡Qué dirá Peter Higgs al respecto tras haber esperado casi 50 años! Quizás deberíamos recordar la prehistoria del Higgs.

Empezaré con Philip Anderson, que se dio cuenta en el verano de 1962 que el mecanismo utilizado en la superconductividad para explicar el efecto Meissner podía ser utilizado en física de partículas elementales para hacer que los bosones de Goldstone se convirtieran en los grados de libertad longitudinales que dotan de masa a una partícula como el fotón. El artículo que describía el “mecanismo de Higgs” apareció en 1963, pero no detallaba los cálculos relativistas correspondientes. Anderson cuenta su historia aquí. Él era físico de la materia condensada, pero publicó su artículo en una revista de física de partículas. A Brout le encantó la idea y junto a Englert, dos años más tarde, desarrolló un modelo de ruptura de la simetría basado en la idea de Anderson. Sin embargo, Brout y Englert en su artículo en Physical Review Letters omitieron la referencia al trabajo previo de Anderson. El artículo llegó a la revista el 26 de junio 1964 y se publicó en la edición del 31 de agosto de 1964.

Brout y Englert relataron la historia de su artículo aquí, donde afirmaron que conocían el trabajo de Anderson sobre la superconductividad y que su idea fue extender dicho trabajo a una teoría cuántica relativista (una teoría gauge de tipo Yang-Mills). Ellos conocían el trabajo de Nambu y Goldstone según el cual si la simetría gauge era global debían aparecer partículas sin masa que no habían sido observadas. Su objetivo fue desarrollar una teoría con invarianza gauge local y su guía para ello eran las ideas de Anderson. Su trabajo no fue fácil ya que la matemática es más sutil en el caso relativista y según confiesan necesitaron más de un año para completar la labor en 1964. La sorpresa es que podían evadir la existencia de los bosones de Goldstone sin masa, aunque fueron capaces de indicar de forma explícita que podrían aparecer bosones con masa.

Peter Higgs, de forma independiente, envió un artículo en julio de 1964 a Physics Letters en el que desarrollaba el argumento de Anderson en el caso relativista, pero como en el caso de Brout y Englert no predecía la existencia de bosones con masa. Higgs envió una semana más tarde otro artículo en el que estudiaba más detalles de la ruptura espontánea de la simetría en una teoría gauge local, pero dicho artículo fue rechazado. Hizo una serie de cambios, entre ellos la mención de la posible existencia de mesones con masa (que ahora llamamos bosones de Higgs) y lo volvió a enviar el 31 de agosto de 1964, siendo aceptado en la revista Physical Review Letters (se publicó en la edición del 19 de octubre 1964 ). Nambu fue el revisor de este artículo y le indicó a Higgs la existencia del artículo de Brout y Englert (Higgs incluyó en su artículo una nota a pie de página al respecto). En este artículo Higgs hace mención explícita al artículo previo de Anderson.

Higgs da su versión de la historia aquí , y se refiere al “mecanismo de Anderson” de forma explícita. Guralnik, Hagen y Kibble habían estado trabajando también en el “mecanismo de Higgs-Anderson” y escribieron un artículo sobre él que enviaron a PRL. Guralnik da su versión de la historia aquí y Kibble aquí. Entre todos estos autores, él único que menciona de forma explícita la consecuencia (obvia por otro lado a partir del formalismo matemático) de la de existencia de una partícula (un “mesón”) como resultado del mecanismo de ruptura espontánea de la simetría es Higgs.

Otros dos artículos de exposición reciente sobre este tema y su historia, ver aquí y aquí .

Un joven estudiante descubre con Google una solución al misterio de los rayos cósmicos del año 774-775 d.C.

El 8 de junio nos hacíamos eco de un misterio sin respuesta: El incremento de los rayos cósmicos ocurrido en el año 774-775 d.C. ”El análisis mediante carbono 14 de los anillos en ciertos cedros japoneses muestra un incremento del 12 por mil.” Textos antiguos indican que en el año 774 apareció un misterioso “crucifijo rojo” en el cielo, lo que se interpreta como la explosión de una supernova. Así lo ha propuesto en Nature el joven estudiante Jonathon Allen, Universidad de California en Santa Cruz. Tras leer la noticia hizo una búsqueda por la web gracias a Google sobre cosas que hubieran pasado en el cielo en el año 774 y encontró una crónica anglosajona del siglo VIII en el “The Avalon Project” en la que se hablaba de una “cruz roja” que apareció en el cielo tras la puesta del sol. Allen pensó que podría ser una supernova escondida tras una nube de polvo que hizo que se observara de color rojo; los restos de esta supernova no serían visibles ahora porque los taparía dicha nube de polvo. Los expertos están impresionados. Geza Gyuk, astrónomo del Planetario Adler de Chicago, EE.UU., experto en utilizar las crónicas anglosajonas para investigar eventos astronómicos, dice que el descubrimiento de Allen es sorprendente y muy sugerente. Donald Olson, físico de la Texas State University en San Marcos, EE.UU., dice que “otra posible explicación del “crucifijo rojo” en el cielo puede ser la dispersión de la luz del sol en un nube tenue de cristales de hielo.” Obviamente, ahora les toca a los astrofísicos buscar pruebas firmes que confirmen o desmientan la hipótesis del joven Allen. Más información en Jonathon Allen, “Astronomy: Clue to an ancient cosmic-ray event?,” Nature 486: 473 (28 June 2012). También nos lo cuenta Richard A. Lovett, “Supernova Could Have Caused Mysterious ‘Red Crucifix’ in Sky in 774 A.D.,” Scientific American, June 27, 2012, y Richard A. Lovett, “Ancient text gives clue to mysterious radiation spike. Eighth-century jump in carbon-14 levels in trees could be explained by “red crucifix” supernova,” Nature News, 27 June 2012. Traducción al español en Kanijo, “Antiguos textos dan pistas sobre un misterioso pico de radiación,” Ciencia Kanija, 28 junio 2012.

A.D. 774. This year the Northumbrians banished their king, Alred, from York at Easter-tide; and chose Ethelred, the son of Mull, for their lord, who reigned four winters. This year also appeared in the heavens a red crucifix, after sunset; the Mercians and the men of Kent fought at Otford; and wonderful serpents were seen in the land of the South-Saxons.” The Avalon Project

Más caliente que Justin Bieber y Emma Stone juntos, el plasma de quarks y gluones

Nuevo récord de temperatura (efectiva) en el Libro Guinness, los cuatro billones de grados centígrados en un plasma de quarks y gluones logrados en el Colisionador de Iones Pesados Relativistas (RHIC) del Laboratorio Nacional de Brookhaven. Un líquido (casi) perfecto formado por la colisión de núcleos de oro que reproduce las condiciones del universo pocos instantes tras la Gran Explosión (Big Bang). Este récord del Libro Guinness durará poco, quizás solo hasta el año que viene, pues en ALICE del LHC (CERN) se alcanzan temperaturas más altas, solo que todavía no se han molestado en realizar una medida suficientemente precisa de dichas temperaturas. Más información en Alan Boyle, “Big-bang soup wins hotness record,” Cosmic Log, 27 june 2012.

La producción fotocatalítica de hidrógeno y las hojas artificiales

El petróleo fue la fuente de energía y el vector energético del siglo XX. Todo apunta a que el hidrógeno será el vector energético del siglo XXI gracias a la energía solar como fuente de energía. Para ello se tendrán que desarrollar sistemas de producción de hidrógeno a gran escala basados en materiales electrocatalíticos y fotoelectrocatalíticos. A partir de haluros de hidrógeno, compuestos HX, se puede generar hidrógeno (H2) por división fotocatalítica; normalmente, X=Cl (cloro) o X=Br (bromo). La reacción química (global) utilizada es 2 HX → H2 + X2, una reacción endotérmica (que necesita de un aporte de energía); para el cloro (X=Cl) se necesita un incremento en la energía libre de Gibbs de ΔG° = 131 kJ/mol y para el bromo (X=Br) ΔG° = 103 kJ/mol. Gracias un fotocatalizador oxidativo [Cat] apropiado se puede utilizar la energía solar como fuente de energía; la producción autosostenida de hidrógeno requiere desarrollar un ciclo cerrado de reacciones químicas. Los avances recientes en este campo han sido muy importantes, destacando los del grupo de investigación del Dr. Nocera en el MIT (Instituto de Tecnología de Massachusetts, Cambridge, EE.UU.). Sin embargo, aún estamos lejos para que estos avances se puedan introducir en la industria de la producción masiva de hidrógeno gracias a la energía solar. Los interesados en más detalles disfrutarán del breve artículo de Thomas S. Teets y Daniel G. Nocera, “Photocatalytic hydrogen production,” Chemical Communications 47: 9268-9274, 06 Jun 2011.

Otra de las líneas más interesantes de trabajo del grupo de Daniel Nocera es el desarrollo de hojas artificiales, reacciones químicas que imitan la fotosíntesis que utilizan las plantas para obtener energía directamente del sol. Lla electrólisis (romper una molécula de agua en hidrógeno y oxígeno) no se puede realizar con células solares fotovoltaicas porque requiere un voltaje más alto del que éstas son capaces de producir. Las hojas artificiales son unos materiales catalíticos que combinan ambas funciones, las de una célula solar y las de un sistema de electrólisis. Las primeras hojas artificiales se desarrollaron en 1998 por John Turner (Laboratorio Nacional de Energías Renovables, Boulder, Colorado), pero utilizaban materiales muy caros y su química era tan compleja que era difícil obtener sistemas estables para producción industrial. El Dr. Nocera y su grupo ha tratado de imitar a las plantas utilizando “ingeniería inversa” y han logrado las primeras hojas artificiales prácticas (baratas y fáciles de fabricar). Una especie de lámina de silicio que introducida en un vaso de agua expuesto al sol empieza a producir burbujas de hidrógenos y oxígeno; no se necesita agua ultrapura lo que permite usar fuentes naturales de agua y pone este dispositivo al alcance de muchas partes del tercer mundo. Nos lo contó Richard A. Lovett, “MIT scientist announces first “practical” artificial leaf,” Nature News Blog, March 28, 2011.

La luz solar es la fuente más abundante y sostenible de energía que dispone la humanidad. La Tierra recibe de la energía solar unos 120 000 TW (terawattios o billones de wattios), de los que unos 170 W por metro cuadrado llegan al año a la superficie de la Tierra (el número varía dependiendo de la ubicación geográfica). Aprovechar toda esta energía requiere el desarrollo de dispositivos de alta eficiencia similares a los utilizados por los organismos vivos fotosintéticos, que gracias a la mecánica cuántica alcanzan un porcentaje de fotones absorbidos de casi el 100% en condiciones óptimas, pero esto no implica que su eficiencia total sea del 100%. Se estima que las leyes de la termodinámica implican una reducción de la eficiencia a ~ 50%. Para un sistema fotovoltaico artificial se aplica el llamado límite de Shockley-Queisser de ~ 24% (en lugar del 100%),  lo que reduce la eficiencia de producción teórica a solo un ~ 12%.

Comparar la eficiencia de un sistema fotosintético con uno fotovoltaico no es fácil. Ambos procesos recogen la energía de la luz solar, pero funcionan de forma diferente y producen diferentes tipos de productos: fotosíntesis natural produce biomasa y productos químicos, mientras que un sistema fotovoltaico produce una corriente eléctrica. Una posibilidad para comparar ambos sistemas es la generación de hidrógeno (en el caso fotovoltaico mediante electrólisis del agua). El resultado muestra que la fotosíntesis es entre 2 y 3 veces más eficientes que los sistemas fotovoltaicos. Por ello, en la actualidad hay un gran interés en la investigación en la fotosíntesis artificial y en el diseño mediante biología sintética de hojas artificiales. Nos lo contó Robert E. Blankenship et al, “Comparing Photosynthetic and Photovoltaic Efficiencies and Recognizing the Potential for Improvement,” Science 332: 805-809, 13 May 2011.

Conferencia de Richard Feynman en 1986 en memoria de Paul Dirac y su obra

Esta conferencia de Richard Feynman titulada “Elementary Particles and the Laws of Physics” impartida en 1986 en memoria de Paul A. M. Dirac merece la pena (dura 70 minutos). Me apena que no se vean las transparencias, que nos tenemos que imaginar. La he visto en Lubos Motl, “Feynman’s 1986 Dirac Memorial Lecture,” TRF, 26 june 2012.

La inflación cósmica

La inflación cósmica fue introducida hace 30 años por Alan H. Guth (entonces postdoc en el SLAC, Stanford Linear Accelerator Center). Una hiperaceleración brevísima de la expansión del universo en los primeros instantes de la gran explosión (big bang). La inflación forma parte del modelo cosmológico de consenso, aunque muchos teóricos, el más famoso es Roger Penrose, dudan de ella. ¿Se puede verificar encontrar evidencias [pruebas indiscutibles] de la inflación cósmica de forma experimental?

Muchos cosmólogos creen que el satélite Planck de la ESA será capaz de observar señales de la inflación en su estudio del fondo cósmico de microondas. Estas señales permitirán demostrar si la inflación realmente ha existido y cuáles han sido sus características. Los llamados modos B que se supone que podrán ser observados por Planck, aunque su debilidad extrema podría complicar su deteccióin, mostrarán trazas de las ondas gravitatorias producidas durante la inflación; gracias a estas ondas se podrán descubrir los detalles del potencial de energía responsable de la dinámica del inflatón, el campo o partícula responsable de la inflación cósmica.

A principios de 2013, en enero se cumplen los 3 años y medio del lanzamiento, se espera la publicación de los primeros resultados de Planck sobre el fondo cósmico de microondas, muchos estaremos expectantes. Nos lo ha contado Paul J. Steinhardt, “The Inflation Debate. Is the theory at the heart of modern cosmology deeply flawed?,” Scientific American, April 2011 [aparecerá en español en Investigación y Ciencia en el número de junio de 2011]. Permitidme un breve resumen para ir abriendo boca.

La teoría de la gran explosión asume que el universo inició la flecha del tiempo y la expansión cósmica hace 13 700 millones de años. El universo es más grande de lo necesario para explicar por qué es tan homogéneo y tan isótropo a grandes escalas. La inflación cósmica es la explicación más sencilla: las inhomogenidades y las anisotropías en los primeros instantes de la gran explosión serían aplanadas por la hiperexpansión del espacio durante la inflación dejando un universo primitivo tan homogéneo e isótropo como el que conocemos hoy en día. La inflación cósmica aparece en todos los libros de texto aunque en la actualidad es una teoría sin verificación el apoyo de evidencia experimental específica. Más aún, tampoco conocemos qué energía inflacionaria (el campo cuántico llamado inflatón) que antigravita es su responsable; para el campo inflacionario la gravedad debe ser repulsiva en lugar de atractiva. El inflatón es un campo escalar (un partícula escalar) como el campo de Higgs (como la partícula de Higgs) responsable de un incremento en el tamaño del universo de 25 órdenes de magnitud (× 1025) durante una millonésima de billonésima de billonésima de segundo (10–30 s). Un crecimiento tan rápido y tan grande del radio del universo resulta en un universo plano, homogéneo e isótropo similar al obervado en la actualidad.

Los detalles de la inflación cósmica dependen del potencial de autointeracción del inflatón. La forma exacta de este potencial conduce a diferentes tipos de inflación que se diferencian en el tamaño de las pequeñas inhomogeneidades y anisotropías que permanecen tras la inflación y que más tarde dan lugar a la formación de las primeras galaxias. En los modelos más sencillos para el inflatón se introduce un parámetro que, grosso modo, tiene que tener un valor adecuado para que la inflación sea “buena” (compatible con la distribución a grandes escalas de la materia en el universo). Si el parámetro es demasiado pequeño o demasiado grande la inflación es “mala” y puede ser descartada. El ajuste fino de este parámetro requiere un error menor de 15 dígitos decimales, como mostró Roger Penrose a finales de los 1980. Este ajuste fino de la inflación ha llevado a muchos cosmólogos a recurrir al principio antrópico como explicación.

Un problema adicional de la inflación, descubierto en 2008 por Gary W. Gibbons (Universidad de Cambridge) y Neil G. Turok (Perimeter Institute for Theoretical Physics, en Ontario) es la inflación eterna. En la gran explosión lo más “natural” es que hayan surgido infinidad de universos burbuja, cada uno con sus propias leyes físicas, siendo el nuestro uno entre dicha infinidad. Estudiando la probabilidad de que aparezca un universo como el nuestro en el multiverso resulta que esta probabilidad es muy baja. Finalmente, el último gran problema de la inflación es la determinación del momento en el que para. Si para o después no tendríamos un universo como el que observamos, pero la probabilidad de que el campo del inflatón pare la inflación en el momento adecuado para lograr un universo plano como el observado resulta un número muy pequeño.

En resumen, la inflación es una idea maravillosa para explicar el universo, pero el diablo está en los detalles. El año que viene se publicarán los primeros datos sobre el fondo cósmico de microondas del satélite Planck. Aportarán información muy relevante sobre los detalles de la inflación. Habrá modelos que sobrevivan y otros tendrán que ser descartados. La ciencia es apasionante.

PS (nota histórica): La inflación cósmica fue propuesta por Starobinsky en 1979, Guth en 1981, Sato en 1981, Linde en 1982 y muchos otros.

PS (resultados de WMAP 7): La inflación predice una distribución estadística casi gaussiana para las fluctuaciones primordiales que se observan en el fondo cósmico de microondas. Aunque se ha dicho que WMAP 7 ha encontrado ciertas señales (en concreto los multipolos altos están algo reforzados comparados con los bajos) que han sido interpretadas como una prueba de la inflación, todavía es pronto para poder afirmar que la inflación está demostrada experimentalmente fuera de toda duda (aunque la mayoría de los físicos teóricos, yo incluido, creemos que es la teoría correcta). Esta figura está extraída de Komatsu, E., et.al., “Seven-Year Wilkinson Microwave Anisotropy Probe (WMAP) Observations: Cosmological Interpretation,” ApJS, 192, 18 (2011) [ApJ / preprint / astro-ph]. Sin embargo, la prueba definitiva será la observación de ondas gravitatorias producto de la inflación. Si queremos ser rigurosos, los datos de WMAP 7 son compatibles con la inflación, pero no demuestran la inflación (aunque Hawking, Zel’dovich y muchos otros hayan afirmado sí lo demuestran fuera de toda duda).

PS: He cambiado “verificación experimental” por “evidencia experimental,” es decir, por pruebas fuera de toda duda. Hoy en día los hechos experimentales que llevaron a la propuesta de la teoría de la inflación son los únicos que la apoyan. Hay pruebas que podrían estar en contra de la teoría y no lo están (como las de WMAP 7) pero no hay pruebas indiscutibles que permitan discernir entre la inflación y otras teorías que también explican los hechos experimentales que la apoyan.

PS (3 junio 2012): Los que tengan acceso disfrutarán con el interesante artículo de Amanda Gefter, “Bang goes the theory,” New Scientist, 30 june 2012. “El gran problema de la inflación es que una vez que empieza no puede parar, con lo que tras el Big Bang se forman infinidad de “universos” o lo que muchos llaman un “multiverso” inflacionario. Esto es un problema porque resta valor predictivo a la inflación (predecirlo todo es lo mismo que no predecir nada).”

El artículo propone como más razonable una reinterpretación del Big Bang de mano de la teoría de cuerdas, como dos branas que colisionan. Ciertos cálculos recientes apuntan a que este modelo tiene las mismas consecuencias que la inflación, por lo que predice una “inflación aparente” y un “Big Bang aparente.” Una propuesta sugerente aunque todavía muy alejada de lo medible de forma experimental.

Los láseres de plasmones o spasers

Hace tan solo 10 años, cuando un físico confesaba que trabajaba en plasmones, todos le miraban como un bicho raro. ¡Plasmones, no habrá cosas mucho más útiles en las que trabajar! Algunos cambiaron de opinión cuando en 2003 se publicó la idea teórica del láser de plasmones o spaser (SPASER es el acrónimo de “Surface Plasmon Amplification by Stimulated Emission of Radiation”). Otros no. ¡Estos teóricos ya no saben que inventar! El gran problema del láser es el límite impuesto por la difracción de la luz que impide concentrar la luz en espacios más pequeños que la mitad de su longitud de onda. Los plasmones superficiales son oscilaciones electrónicas colectivas en una interfaz metal-dieléctrico con una longitud de onda mucho menor que la de la luz que los excita o de la luz que emiten. Un láser de plasmones podría superar la barrera de la difracción. Todavía nadie ha logrado fabricar un spaser, pero muchos nanotecnólogos lo está tratando. Una fuente nanométrica de luz coherente promete infinidad de aplicaciones. Nos lo contó Volker J. Sorger, Xiang Zhang, “Spotlight on Plasmon Lasers,” Science 333: 709-710, 5 August 2011.

El primer intento experimental serio de lograr un spaser fue el “dedo láser de oro” que se publicó en Nature Photonics en 2007 (Martin T. Hill et al., “Lasing in metallic-coated nanocavities,” Nature Photonics 1: 589 – 594, 2007; gratis aquí). Una heteroestructura semiconductora (dispositivo formado por varias capas de materiales en forma de sandwich) recubierta por una delgada capa de oro que se comportaba como un láser (convencional) cuando recibía una corriente de electrones. No se trataba de un dispositivo plasmónico, por lo que estaba limitado por la difracción, pero fue el punto de partida para desarrollar el primer nanoláser plasmónico en 2009 (Martin T. Hill et al., “Lasing in metal-insulator-metal sub-wavelength plasmonic waveguides,” Optics Express 17: 11107-11112, 2009; gratis aquí también). Este nanoláser utilizaba plata en lugar de oro y tenía enormes pérdidas por lo que solo funcionaba a temperaturas criogénicas (la mayoría de los resultados del artículo eran para 78 Kelvin).

El primer spaser que se publicó con tal nombre, en Nature, utilizó un enfoque diferente, nanopartículas esféricas de 40 nm con un núcleo de oro de 14 nm que se encontraban en suspensión coloidal en agua. Al bombear estas nanopartículas con luz láser, se excitaban plasmones localizados en su superficie metálica. El gran problema de este spaser es lo difícil que es implementar conexiones electrónicas con él. Además, la emisión óptica de este spaser era casi omnidireccional (algo que se puede mitigar).

Ya se han publicado otras variantes, pero aún podemos considerar estos éxitos como preliminares (aunque muy interesantes). ¿Son los spasers versiones nanométricas de los láseres convencionales? En principio no, ya que los mecanismos físicos de un láser de plasmones son diferentes. ¿Qué aplicaciones se esperan para los spasers? Como los láseres de plasmones son de tamaño muy pequeño y muy rápidos ofrecen gran números de aplicaciones. Por ejemplo, en sistemas de computación completamente ópticos (integrados en chips fotónicos ultrarrápidos, como sustitutos de los chips electrónicos convencionales) para incrementar la velocidad y funcionalidad de las redes de comunicaciones. Por su pequeño tamaño, casi molecular, se auguran aplicaciones de diagnóstico en biomedicina de ultraalta resolución. También pueden servir para sistemas de almacenamiento de datos, tanto ópticos como magnéticos, cuya capacidad de integración extrema les haría no tener competencia en el mercado de la electrónica de consumo.

Los ángulos asociados a los quarks y a los neutrinos en las matrices CKM y PMNS

Uno de los lectores de este blog, Aitor, me pedía que explicara los ángulos de la matriz PMNS (Pontecorvo–Maki–Nakagawa–Sakata) asociados al fenómeno de la oscilación de los neutrinos. Este blog no pretende ser un buen sustituto de un libro de texto y hay muchas fuentes en la web que explican este asunto muy bien, pero trataré de hacer una excepción, aunque mi exposición será concisa y con la mínima matemática posible.

Hay muchos experimentos que indican que los neutrinos y los antineutrinos cambian de identidad en el vacío, un fenómeno llamado oscilación de los neutrinos. Hay tres tipos (“sabores”) de neutrinos asociados  al electrón, al muón y al tauón, llamados neutrino electrónico, mu (muónico) y tau (la palabra “tauónico” no gusta a muchos físicos). La oscilación de los neutrinos significa que un neutrino electrónico puede transmutarse en un neutrino mu, un neutrino mu puede transmutarse en un tau y, como ha verificado fuera de toda duda el experimento Daya Bay (situado en la Bahía de Daya, a 52 km de Hong Kong, en el sur de China) [noticia en este blog], un neutrino electrónico puede transmutarse en un tau. Asociado a cada una de estas transmutaciones hay un parámetro real adimensional, un ángulo, llamado θ12, θ23 y θ13, respectivamente. En grados estos ángulos valen unos θ12=45 grados, θ23=34 grados y θ13=8,8 grados. Hay un cuarto parámetro, otro ángulo llamado δ, asociado a la posible violación de la simetría CP (la asimetría entre materia y antimateria) en la física de los neutrinos. Este cuarto ángulo aún no ha sido medido y podría ser nulo, pero  la mayoría de los físicos cree que no es así, por que el modelo estándar de la física de partículas contiene menos violación (según los experimentos) de la simetría CP de la necesaria para explicar la asimetría entre la materia y la antimateria, por lo que debe haber fuentes escondidas (aún no descubiertas en los experimentos). La física de los neutrinos podría ser una de estas fuentes. Además de los cuatro ángulos anteriores, si los neutrinos son partículas de Majorana, habría dos ángulos más (dos fases de Majorana); si los neutrinos son partículas de Dirac, aunque solo se han observado neutrinos con helicidad izquierda, deben existir neutrinos con helicidad derecha cuya masa sea tan enorme que está fuera de la detección de los experimentos actuales (el mecanismo del “balancín” (seesaw en inglés) según el cual la pequeña masa de los neutrinos levógiros es debida a la gran masa de los neutrinos dextrógiros).

La matriz PMNS que describe la oscilación de los neutrinos (si son partículas de Dirac) se escribe en analogía con la matriz CKM (Cabibbo–Kobayashi–Maskawa) que describe la masa de los quarks arriba (u, c y t) a partir de la masa de los quarks abajo (d, s y b). Los estados cuánticos de los quarks según la cromodinámica cuántica (QCD) están desacoplados, el estado |u> y el |d> no están relacionados entre sí y la interacción fuerte no puede permitir que un quark |d> se transforme en un quark |u>, incluso a sabiendas que el |d> tiene mayor masa que el |u>. Sin embargo, los estados cuánticos de los quarks según la teoría electrodébil (EWT) están acoplados entre sí y esta interacción permite que un quark abajo se desintegre en un quark arriba (si lo permite la ley de conservación de la masa) y viceversa; pero no es posible que un quark tipo abajo se desintegre en otro quark tipo abajo y tampoco puede ocurrir con los quarks tipo arriba. Estas desintegraciones con cambio de sabor indican que los estados cuánticos de los quarks tipo abajo según la EWT (llamados |d’>, |s’> y |b’>) , los que están asociados a los quarks arriba (|u>, |c> y |t>), son una mezcla de los estados de los quarks tipo abajo (|d>, |s> y |b>). La conservación cuántica de las probabilidades requiere que la matriz que transforma los estados tipo abajo en los estados tipo arriba sea una matriz unitaria (una matriz de números complejos cuya inversa es igual a su traspuesta conjugada), con lo que la transformación toma la forma

La matriz CKM es una matriz 3×3 formada por 9 números complejos (18 números reales) que al ser una matriz unitaria U(3) solo tiene 9 parámetros reales libres (los números de la diagonal tienen que ser reales y los números por encima de la diagonal determinan los que están por debajo de ella). Ahora bien, las probabilidades asociados a un estado cuántico, sea |u>, no dependen de la fase (solo dependen de <u|u>=||u||² que es independiente de la fase), por lo que 6-1=5 de los parámetros de la matriz se pueden absorber redefiniendo las 6 fases de los quarks (una de estas fases queda libre por no ser observable). Como resultado quedan 9-5=4 parámetros reales libres en la matriz CKM. Cuando se factoriza la matriz CKM en “rotaciones” complejas se requieren 3 ángulos (de Euler), llamados ángulos de mezcla, y queda un parámetro libre que se puede escribir como una fase compleja asociada a uno de estos ángulos que representa la posible violación de la simetría CP. Cada una de estas rotaciones “elementales” se escribe con un coseno y un seno (normalmente escritos como c12 = cos θ12 y s12 = sin θ12). En una matriz 3×3 el ángulo δ debe estar en la tercera componente, pues la submatriz 2×2 en la parte superior izquierda no debe incluirlo, con lo que la matriz CKM se escribe de la siguiente forma.   

En general, los N² parámetros reales de una matriz unitaria U(N) se reducen a solo (N−1)² gracias a la absorción por 2N−1 fases; de estos (N−1)² parámetros, N(N−1)/2 son ángulos de mezcla asociados a rotaciones complejas y los restantes (N−1)(N−2)/2 son fases complejas asociadas a la violación de la simetría CP.

En el caso de que los neutrinos sean partículas de Dirac, la matriz PMNS es del todo similar a la matriz CKM que he mostrado arriba y está caracterizada por 4 ángulos,  θ12, θ23, θ13 y δ. Si los neutrinos son partículas de Majorana, hay dos ángulos adicionales, porque en dicho caso las fases de los espinores no pueden absorber todos los parámetros. El resultado es la siguiente matriz PMNS.

Los valores de los ángulos δ, α1 y α2, no han sido determinados todavía por ningún experimento. Si δ no es nulo significará que el fenómeno de la oscilación de los neutrinos es diferente a la oscilación de los antineutrinos, introduciendo una asimetría entre materia y antimateria en la física de los neutrinos. En el caso de que los neutrinos sean partículas de Majorana, los neutrinos y los antineutrinos serán la misma partícula (el neutrino será su propia antipartícula).

Hay muchas más cosas que se pueden decir, pero creo que este es un buen aperitivo para que los interesados busquen más información sobre la física de la oscilación de los neutrinos. En los libros se suele discutir en más detalle la razón por la cual una matriz U(3) está caracterizada por solo 4 ángulos, realizando todas las operaciones trigonométricas oportunas.

Paul A. M. Dirac y el descubrimiento del positrón

La historia de la física nos muestra que el camino hacia los grandes descubrimientos no es recto como una autopista, sino que está lleno de curvas, travesías, semáforos y múltiples indicaciones erróneas. La versión oficial es que Dirac predijo el antielectrón en 1931 y Anderson lo descubrió un año más tarde, recibiendo el primero el Premio Nobel de Física en 1933 y el segundo en 1936. Sin embargo, la historia de la física nunca es tan simple. Ni realmente Dirac predijo al antielectrón en 1931, ni Anderson fue el primer físico que observó el positrón. En esta entrada trataré de resumir brevemente la historia del descubrimiento teórico del positrón. Me basaré en el artículo de Graham Farmelo, “Did Dirac predict the positron?,” Contemporary Physics 51: 97-101, 2010. Por supuesto, también es muy recomendable la lectura de su biografía de Dirac titulada “The Strangest Man: The Hidden Life of Paul Dirac, Quantum Genius,” Faber and Faber (2009).

Antes de empezar, debemos recordar que el Premio Nobel de Física de 1936 se repartió a partes iguales entre Victor Franz Hess y Carl David Anderson. Merece la pena leer la Nobel Lecture de Carl D. Anderson, “The production and properties of positrons,” December 12, 1936, quien nos explica que en esta imagen un “electrón” de 63 MeV atraviesa un placa de plomo de 6 mm y emerge con una energía de 23 MeV, pero lo hace con la curvatura “equivocada” como si fuera una partícula de carga positiva, como si fuera un protón pero con la masa de un electrón. La Nobel Lecture muestra muchas otras fotografías de positrones y electrones. Anderson afirma: “The present electron theory of Dirac provides a means of describing many of the phenomena governing the production and annihilation of positrons.”

Por otro lado, el Premio Nobel de Física de 1933 se repartió a partes iguales entre Erwin Schrödinger y Paul Adrien Maurice Dirac. También vale la pena leer la Nobel Lecture de Paul A. M. Dirac, “Theory of electrons and positrons,” December 12, 1933, aunque no cuente la historia de su descubrimiento, afirma que su ecuación predice el “antielectrón” de soslayo: ”There is one other feature of these equations which I should now like to discuss, a feature which led to the prediction of the positron.”

Dirac descubrió su ecuación a finales de 1927, siendo publicada en febrero de 1928 en su archifamoso artículo “The Quantum Theory of the Electron,” Proc. Royal Soc. London. Series A 117 (Feb. 1, 1928) 610-624 [copia pdf gratis]. La ecuación fue aclamada de inmediato y se consideró el avance teórico más importante de 1928. A pesar de la belleza matemática de la ecuación, pocos meses más tarde quedó claro que no había manera de eliminar su predicción de niveles de energía negativos para un electrón libre. Dirac no dijo nada al respecto en su artículo, pues pensaba que le sería fácil solucionar este grave problema, pero no fue así. Necesitó dos años para encontrar una posible solución, que envió a publicación en diciembre de 1929, en su famoso artículo “A Theory of Electrons and Protons,” Proc. Royal Soc. London. Series A 126 (Jan. 1, 1930) 360-365 [copia pdf gratis].

El primer epígrafe no deja duda sobre los contenidos del artículo (“Nature of the Negative Energy Difficulty“). Lo primero que hace es dejar claro que los estados de energía negativa son imposibles de evitar y que corresponden a “electrones” que se mueven como si tuvieran carga positiva (“Thus an electron with negative energy moves in an external field as though it carries a positive charge“). Lo segundo es afirmar que estos “electrones de carga positiva” no pueden ser los protones (“One cannot, however simply assert that a negative-energy electron is a proton, as that would lead to paradoxes“). Lo tercero es proponer la idea del “mar de Dirac,” que el vacío de su teoría es un conjunto infinito de partículas con energía negativa en el que puede haber “huecos” (vacant states or “holes”) que se mueven como si fueran partículas de carga positiva con energía positiva (“These holes will be things of positive energy and will therefore be in this respect like ordinary particles“). Y por último, concluye que como las únicas partículas que han sido observadas con carga positiva son los protones, los “huecos” deben ser protones (“We are therefore led to the assumption that the holes in the distribution of negative-energy electrons are the protons“). Sin embargo, Dirac confiesa que no sabe resolver las paradojas de su propuesta, la más grave es ¿por qué los protones y los electrones tienen diferente masa? (“Can the present theory account for the great dissymmetry between electrons and protons, which manifests itself through their different masses and the power of protons to combine to form heavier atomic nuclei?“); en su opinión, algún día será posible resolver este problema (“We may hope it will lead eventually to an explanation of the different masses of proton and electron“).

La propuesta de Dirac de que los “huecos” tienen que ser los protones fue mal acogida por la mayoría de los físicos. Victor Weisskopf recuerda más tarde que en ella época todo el mundo pensaba que la idea no era creíble ni natural. Niels Bohr afirmó que la teoría de Dirac no podía ser la teoría definitiva del electrón, pues le tenía que faltar algo importante aún por descubrir. Más aún, de forma independiente, Robert Oppenheimer, Wolfgang Pauli y Hermann Weyl señalaron que la teoría era inconsistente si la masa del “hueco” y del electrón no eran idénticas. No existía ninguna solución posible al problema. Los “huecos” de Dirac no podían ser los protones.

El propio Dirac calculó las propiedades de la aniquilación mutua entre un electrón y un protón en “On the Annihilation of Electrons and Protons,” Math. Proc. Cambridge Phil. Soc. 26 (19 May 1930) 361-375. La gran diferencia entre la masa de ambas partículas hacía que este cálculo no tuviera mucho sentido (“The large difference between the masses of the proton and electron forms an unsolved difficulty in the existing theory. (…) This means, of course, a serious deficiency in our work and prevents one from attaching much physical importance to the result“). Las leyes de conservación de la energía y del momento no permitían que un electrón y un protón se aniquilaran emitiendo un solo fotón y era necesario que se emitieran al menos dos fotones. La fórmula final incluye un único valor para la masa de las partículas que se aniquilan y Dirac no sabe qué valor elegir, la masa del electrón o la del protón (“We cannot give an accurate numerical interpretation to our result because we do not know whether the m there refers to the mass of the electron or of the proton“).

En 1931 era insostenible afirmar que los “huecos” son los protones, por lo que Dirac decidió arriesgarse y se atrevió a proponer que se trataba de nuevas partículas aún no descubiertas a las que llamó “anti-electrones.” Lo sorprendente es que propuso esta idea a la chita callando en su famoso artículo en el que presentó su teoría de los monopolos magnéticos (“magnetic poles“). En su artículo “Quantised Singularities in the Electromagnetic Field,” Proc. Royal Soc. London Series A 133 (Sep. 1, 1931) 60-72 [copia pdf gratis], podemos leer “It thus appears that we must abandon the identification of the holes with protons and must find some other interpretation for them. (…) A hole, if there were one, would be a new kind of particle, unknown to experimental physics, having the same mass and opposite charge to an electron. We may call such a particle an anti-electron.” Más aún, y al más puro estilo de los físicos teóricos actuales, también sugirió que el protón debía tener su propia antipartícula (“The protons on the above view are quite unconnected with electrons. Presumably the protons will have their own negative-energy states, all of which normally are occupied, an unoccupied one appearing as an anti-proton“).

Para los que no lo sepan, Dirac propuso los monopolos magnéticos en un intento de comprender por qué la carga eléctrica está cuantizada (en unidades de carga del electrón). Como no habían sido observados, pensó que tendría que existir alguna razón por la cual electricidad y magnetismo eran asimétricos, quizás la misma razón por la cual el electrón y el protón también lo son (“There remains to be discussed the question of why isolated magnetic poles are not observed. (…) There must be some cause of dissimilarity between electricity and magnetism (possibly connected with the cause of dissimilarity between electrons and protons)“). Al leer el artículo de Dirac da la sensación que él sigue pensando que los “huecos” son protones. Por cierto, ¿por qué no han sido observados los monopolos magnéticos? Dirac contesta de forma sencilla, quizás porque la fuerza que los une es miles de veces mayor que la que une al electrón y al protón en el átomo, lo que ha impedido separarlos (“This means that the attractive force between two one-quantum poles of opposite sign is (137/2)² = 4692,25 times that between electron and proton. This very large force may perhaps account for why poles of opposite sign have never yet been separated.“)

¿Realmente predijo Dirac en 1931 la existencia del positrón? La opinión al respecto depende del historiador de la ciencia que opine. Su frase siguiente afirma que no podemos esperar observar los “anti-electrones” porque se recombinan rápidamente con electrones y solo podemos esperar producirlos de forma experimental en un vacío muy alto, donde no haya electrones (“We should not expect to find any of them in Nature, on account of their rapid rate of recombination with electrons, but if they could be produced experimentally in high vacuum they would be quite stable and amenable to observation“). Muchos historiadores piensan que Dirac seguía pensando en 1931 que los “huecos” eran protones. Treinta y cinco años más tarde el teórico Murray Gell-Mann le preguntó a Dirac por qué no predijo la existencia de las anti-partículas e instó a los físicos experimentales a tratar de encontrarlas; su lacónica respuesta es muy famosa: “por pura cobardía.”

Sin embargo, hay historiadores que opinan lo contrario, que Dirac era consciente de que los anti-electrones podían ser observados en los experimentos. La fuente más habitual son unas charlas sobre mecánica cuántica que impartió Dirac en el otoño de 1931 en la Universidad de Princeton (transcritas por Banesh Hoffman) en las que  afirmó que los anti-electrones no eran una ficción matemática y debería ser posible detectarlos en los experimentos (“[they] are not to be considered as a mathematical fiction; it should be possible to detect them by experimental means“). Ni Dirac, ni ningún otro físico de la época, propuso que los “anti-electrones” podrían ser observados en los rayos cósmicos, aunque estos últimos estaban muy de moda (apareciendo a menudo en noticias de divulgación en periódicos como el New York Times).

Por cierto, el domingo 8 de mayo de 1932, un artículo en el New York Times titulado “The Atom is Giving up its Mighty Secrets” escrito por su editor científico Waldemar Kaempffert, se hacía eco de la posibilidad de producir energía mediante la colisión de materia contra antimateria y mencionaba al “anti-electrón” (varios meses antes de que Anderson descubriera el positrón). El autor se hizo eco de una idea que oyó en el congreso de la AAAS (American Association for the Advancement of Science) celebrado en Cleveland; podría parecer que en aquella época muchos físicos conocían y/o se tomaban en serio la idea de Dirac sobre el anti-electrón.

Carl Anderson tomó una intrigante fotografía de rayos cósmicos el 2 de agosto de 1932. La única explicación posible parecía ser una partícula con la misma carga que un protón, pero con una masa comparable a la del electrón. Reportó su interpretación (sin fotografía) en la revista Science, una breve nota titulada “The Apparent Existence of Easily Deflectable Positives,” Science 76 (Sep. 9, 1932) 238-239 [copia pdf gratis]. No menciona a Dirac, ni al anti-electrón, ni al positrón (solo habla de “positive particles”). Anderson conocía la teoría de Dirac sobre los “huecos” ya que asistió a un curso sobre ella impartido por Robert Oppenheimer. Sin embargo, fue Rudolph Langer, colega de Anderson que había leído el artículo de Dirac donde se menciona al “anti-electrón,” quien le comentó que quizás había observado el anti-electrón. Pero en la primavera de 1934, Anderson aún dudaba de que su partícula fuera la “predicha” por Dirac.

La historia del descubrimiento experimental del positrón me alejaría del objetivo de esta entrada (obviamente, hay pruebas de su existencia antes del descubrimiento de Anderson). Por cierto, ¿quién le puso el nombre de “positrón” al “anti-electrón” de Dirac? Por lo que parece, el término fue introducido por el editor de Science, en su editorial del número de 24 de febrero de 1933: “‘Positron’ is the name with which the newly discovered positive electron will be christened by its discoverer, Dr. Carl D. Anderson, (…) as soon as the existence of the free positive electron becomes fully established.”

No hay constancia de que Dirac (o sus colegas Kapitza, Fowler o Eddington) hubiesen leído el artículo en Science de Anderson. Si lo hicieron, no asociaron su descubrimiento con el “anti-electrón.” No se sabe cuando Dirac oyó hablar por primera vez del descubrimiento de Anderson, pero es razonable suponer que fue a mediados de diciembre de 1932 (como muy tarde en enero de 1933) cuando estaba en el Cavendish, trabajando junto a su amigo Blackett.

Quiero acabar esta entrada con una sugerente y famosa frase de Patrick M.S. Blackett: “We experimentalists are not like theorists: the originality of an idea is not for being printed in a paper, but for being shown in the implementation of an original experiment” (Londres, 1962).

Nota dominical: Kapitza, Dirac y el “antielectrón”

Muchos de los grandes descubrimientos teóricos de la historia pasaron varios años sin pena ni gloria hasta que un resultado experimental los convirtió en revolucionarios. Un buen ejemplo es la ecuación de Dirac para el electrón de 1928. Durante muchos años nadie le prestó ninguna atención a dicha ecuación y la mayoría de los físicos no se la tomaba en serio. El físico ruso Piotr Kapitza, compañero de Paul Dirac en Cambridge, donde ambos eran pupilos de Ernest Rutherford, recuerda que todas las semanas, tras el seminario de física al que ambos asistían, fuera el que fuese el tema tratado, siempre le hacía la misma pregunta a Dirac: “Paul, ¿dónde está el antielectrón?” Kapitza y Dirac eran grandes amigos, aún así, como muchos otros físicos de la época, Kapitza pensaba que la ecuación de Dirac generaba más problemas de los que resolvía. Muy pocos físicos sospechaban que la ecuación de Dirac era uno de los grandes logros teóricos del siglo XX. Muy pocos sospechaban que existía la antimateria, hasta que fue encontrada en los rayos cósmicos.

Esta es mi primera “Nota dominical.” Mi idea es iniciar con ella una serie de notas históricas, breves y curiosas. Una nota cada domingo. Hasta que me canse o vosotros os canséis.

Los agujeros negros desde Einstein hasta Maldacena

Según la teoría de la relatividad general de Einstein, un objeto muy masivo y muy compacto colapsará en un agujero negro. En un artículo escrito en 1939, Albert Einstein afirmó que los agujeros negros (en aquel momento se llamaban “singularidades de Schwarzschild”) son una mera simplificación matemática que no existe en la realidad física. Ese mismo año J. Robert Oppenheimer y su estudiante Hartland S. Snyder utilizaron la teoría de la relatividad general para estudiar cómo se pueden formar agujeros negros por el colapso de una estrella. Hoy sabemos que existen objetos en el cielo que son agujeros negros (casi con toda seguridad, pues no tenemos ninguna otra explicación para ellos y para sus propiedades observadas).

Un agujero negro tiene una superficie que se llama “horizonte de sucesos,” que marca un punto de no retorno, quien lo cruza nunca volverá a salir. Sin embargo, debido a las fluctuaciones cuánticas cerca del horizonte de sucesos, un agujero negro debe emitir radiación de Hawking.  La existencia de esta radiación implica que los agujeros negros tienen una temperatura y que pueden “evaporarse” hasta desaparecer. En termodinámica, la temperatura es debida al movimiento de los constituyentes elementales de un objeto. ¿Qué se mueve en un agujero negro? Un agujero negro es solo gravedad, es solo espaciotiempo, luego debe moverse el propio espaciotiempo. ¿Cuántos constituyentes tiene un agujero negro? En termodinámica, el número de configuraciones microscópicas de un sistema viene dado por su “entropía.” La fórmula de Hawking implica una fórmula para la entropía de un agujero negro, obtenida previamente por Bekenstein, que resulta ser proporcional al área del horizonte o al cuadrado de su masa. Este resultado es un poco extraño. La entropía de casi todas los objetos crece en proporción a su volumen, no a su área, y a su masa, en lugar de a su cuadrado. Por otro lado, la radiación de Hawking implica que los agujeros negros pierden masa porque irradian energía. Un agujero negro en el espacio vacío se puede “evaporar” como una gota de agua. Aquí se encuentra una interesante paradoja. La radiación de Hawking implica que el agujero negro emite radiación térmica. Esta radiación térmica, aparentemente no lleva información acerca de las cosas que cayeron en su interior (de hecho, esta radiación se genera en las cercanías del horizonte). El agujero negro se puede formar de diferentes maneras, pero simpre se evapora del mismo modo. En la mecánica cuántica la información sobre un sistema no se pierde. ¿Qué pasa con la información que se ha tragado el agujero negro?

¿Obedecen los agujeros negros las leyes de la mecánica cuántica? Cualquier teoría cuántica del espaciotiempo debe ser capaz de describir con precisión cómo se forman los agujeros negros y cómo se evaporan. También debe dar una explicación precisa a la entropía de un agujero negro. Hawking sugirió que los agujeros negro violarían este principio básico de la mecánica cuántica: la radiación que sale de un agujero negro sería totalmente térmica, sin ninguna información sobre lo que cayó en el agujero negro. Por tanto, los agujeros negros serían como sumideros de información, monstruos perversos que amenazan las leyes fundamentales de la mecánica cuántica.

La teoría de cuerdas es un conjunto de ideas teóricas que pretenden describir la mecánica cuántica del espaciotiempo. Como tal, la teoría debe explicar si los agujeros negro son consistentes con la mecánica cuántica o no lo son. La teoría de cuerdas obedece los principios de la mecánica cuántica pero, en su formulación original, aplicarla a un espaciotiempo curvo parecía imposible. Por tanto, nadie pensaba que lograría resolver el problema de la pérdida de información en los agujeros negros. Sin embargo, a mediados de los 1990, Joseph Polchinski hizo un gran avance al descubrir que la teoría de cuerdas contiene unos objetos llamados D-branas. Una sola D-brana no tiene suficiente masa para curvar el espaciotiempo de forma apreciable, por lo que para formar un agujero negro hay que poner muchas D-branas juntas, sean N. Para describir la posición de estas D-branas es necesaria una matriz N×N. Pues resulta que las N² componentes de dicha matriz corresponden a campos cuánticos en una teoría gauge de tipo SU(N), lo que implica que existe una fuerza entre cada par de D-branas. La entropía asociada a esta interacción entre cada pareja de D-branas coincide, para un agujero negro extremal, con la fórmula de Hawking-Bekenstein; un agujero negro cargado puede almacenar una cantidad máxima de carga eléctrica para ser estable y se llama extremal al que tiene dicha cantidad de carga.

Gracias a estas ideas, hoy tenemos una descripción cuántica razonable de los agujeros negros en el marco de la teoría de cuerdas que nos permite calcular sus propiedades termodinámicas. Los agujeros negros se rigen por las leyes de la mecánica cuántica y durante la última década han pasado de ser una mera curiosidad matemática a convertirse en una herramienta física muy poderosa para estudiar sistemas cuánticos en interacción fuerte. Todo gracias a los avances en la llamada conjetura de Maldacena, la dualidad gravedad-teoría de campos.

Traducción libre y resumen de Juan Maldacena, “Black Holes and Quantum Mechanics,” The Institute Letter, IAS, Summer 2011.

Predicciones de Hughes en 1991 para el futuro de la física de partículas

Ian Simpson Hughes publicó en 1972 un libro sobre partículas elementales, que tuvo una segunda edición en 1985 y una tercera en 1991. En esta última introdujo un epílogo en el que agrupaba los problemas más importantes de la física de partículas en tres bloques. Tres de las cuatro problemas del primer bloque ya han sido resueltos y el cuarto casi. Ningún problema del segundo bloque ha sido resuelto, aunque parte del primero lo será pronto. Para los que no conozcan el libro quizás convengan recordar estas cuestiones.

Bloque 1:

  • ¿Cuál es la masa del quark top? Descubierto en 1995, hoy se estima su masa en 173,5±1,0 GeV/c² [Particle Data Group 2012, quark top].
  • ¿Se puede medir la vida media del protón? El límite inferior actual es de 1,1 × 10³⁴ años [fuente].
  • ¿Tienen masa los neutrinos? Descubierto en 1998, hoy en día las estimaciones cosmológicas indican que Σ mν ≤ 0,29 eV [fuente WiggleZ].
  • ¿Cuál es la solución del problema de los neutrinos solares? Que los neutrinos tienen masa.

Bloque 2:

  • ¿Es el mecanismo de Higgs responsable del origen de la masa? ¿Existe el bosón de Higgs? ¿Cuál es su masa?
  • ¿Por qué hay tres familias de quarks y leptones?
  • ¿Cuál es razón del patrón de las masas de las partículas en cada familia y entre ellas?
  • ¿Son los quarks y los leptones partículas puntuales?
  • ¿Cuál es la teoría correcta para la gran unificación entre las interacciones electrodébil y cromodinámica?

Bloque 3:

  • ¿Cuál es la naturaleza de la materia oscura?
  • ¿Cuál es el origen real de la violación CP?
  • ¿Es el universo cerrado o abierto?
  • ¿Qué mecanismo determina la escala de masas de los bariones y la densidad de materia oscura?
  • ¿Por qué la constante cosmológica es cero o cercano a cero? En 1991 no se sabía que era cercana a cero.
  • ¿Por qué nuestro Universo parece depender de pequeñas violaciones de la simetría?
  • Es la teoría de cuerdas en realidad una “teoría de todo” y cómo puede ser puesta a prueba.

Una sorpresa que podemos esperar en el canal difotónico para la búsqueda del Higgs

Hay una cosa que mucha gente olvida y que es de capital importancia en la búsqueda del bosón de Higgs en el LHC del CERN: las predicciones teóricas del modelo estándar son muy difíciles de calcular y mejoran conforme pasa el tiempo. Buen ejemplo de ello es esta figura. En la parte izquierda se muestra lo que era un misterio en noviembre de 2011 (publicado como tal en la revista JHEP en enero de 2012). En la parte derecha aparece la solución del misterio (aparecida en ArXiv en febrero de 2012). Había un misterioso exceso en las colisiones protón-protón que mostraban un par de fotones en el experimento CMS, al compararlas con las predicciones teóricas calculadas hasta el orden NLO. Dicho exceso ha desaparecido al compararlas con las predicciones teóricas calculadas hasta NNLO. Esto nos recuerda que no siempre la contribución del siguiente orden de la teoría de perturbaciones es pequeña; en este caso el orden NNLO introduce un efecto entre el 40 y el 55% respecto al orden NLO.

¿Qué significa esto con respecto a la búsqueda del bosón de Higgs con masa alrededor de 125 GeV/c²? El canal difotónico es el “gold channel” de esta búsqueda y mostraba un exceso respecto a las predicciones del modelo estándar, que llevó a algunos físicos a proponer que la señal a 125 GeV/c² correspondía a un primo (“fermiofóbico”) del Higgs. ¿Hasta qué orden se calculó dicho canal difotónico? El cálculo se realizó hasta NLO, luego es posible que veamos sorpresas cuando se calcule hasta NNLO. ¿Significa esto que la señal observada de un Higgs desaparecerá? Como también fue observada por ATLAS, no creo que ese sea el caso. Más bien, pero es una opinión personal mía, podría significar lo contrario, que la señal publicada en diciembre de 2011 aparentaba ser más débil de lo que en realidad era y que un nuevo análisis de dichos datos podría reforzar dicha señal. Obviamente, es solo una opinión mía. Que nadie me tire de las orejas si me equivoco (quizás lo sabremos el 4 de julio). Los autores de blogs estamos para eso, para equivocarnos.

El misterioso exceso observado por CMS se publicó el 1 de noviembre de 2011 en “Measurement of the Production Cross Section for Pairs of Isolated Photons in pp collisions at s√ = 7 TeV,” CMS-QCD-10-035, CERN-PH-EP-2011-171, arXiv:1110.6461 y apareció en revista el 25 de enero de 2012 (J. High Energy Phys. 01 (2012) .133). Mucha gente se hizo eco de este exceso, como Matt Strassler, “Two-Photons: Data and Theory Disagree,” OPS, Nov. 1, 2011 (que achacó de forma acertada el exceso a un error en el cálculo teórico de la predicción del modelo estándar); Matti Pitkanen, “CMS observes large excess of diphotons,” TGD Diary, Nov. 2, 2011 (que también acertó al afirmar que se trataba de un error sistemático); Lubos Motl, “CMS: a very large excess of diphotons,” TRF, Nov. 1, 2011 (que rápido como el rayo soñó con nueva física más allá del modelo estándar); y otros. Por cierto, yo no me molesté en hacerme eco de esta noticia en este blog (aunque escribí un borrador al respecto que quedó inacabado y por eso ahora rescato esta noticia).

La solución del misterio aparece publicada en múltiples sitios: Leandro Cieri, “Diphoton production at NNLO,” Winter School, Ascona, January 27, 2012; Leandro Cieri, “Diphoton production at LHC: 120 < Mγγ < 140 GeV,” Rencontres de Moriond, March 11, 2012; Jonathan M. Butterworth, Guenther Dissertori, Gavin P. Salam, “Hard Processes in Proton-Proton Collisions at the Large Hadron Collider,” Annual Review of Nuclear and Particle Science, arXiv:1202.0583; y otros artículos más recientes.

Rueda de prensa en el CERN para el 4 de julio sobre el bosón de Higgs

Actualización: La rueda de prensa en el CERN ya es oficial (Noticia CPAN). Será retransmitida vía webcast (http://webcast.cern.ch/). Steve Myers dice que “Data taking for ICHEP concluded on Monday 18 June after a very successful first period of LHC running in 2012.” Por tanto, debemos esperar el análisis de 6,52 /fb en ATLAS, 6,58 /fb en CMS, y 0,651 /fb en LHCb [fuente].

Actualización (23 junio): Peter Woit vuelve con otro rumor “uno de los experimentos” (tiene que ser ATLAS),” y quizás los dos” (también CMS) “han observado a 5 sigmas una señal del Higgs al combinar sus datos de 2011 y 2012 en los canales más sensibles al Higgs.” Tras el seminario técnico de 2 horas, habrá una rueda de prensa a las 11:00. Por supuesto, Peter Woit también nos recuerda que el 4 de julio de 1984 hubo un gran anuncio en el CERN (el descubrimiento del quark top) que al final fue un gravísimo error (el top no se descubrió hasta 1995). Por cierto, Tommaso Dorigo (miembro de CMS) dice que lo que ocurrirá el 4 de julio será algo grande (“a major event”).

Hamish Johnston nos informa en “CERN calls press conference for 4 July…,” PhysicsWorld.com,  que se ha convocado una rueda de prensa en el CERN para el 4 de julio, a las 09:00 (hora de Ginebra), el primer día del ICHEP (International Conference on High Energy Physics) que se celebrará en Melbourne, Australia. Se supone que en la rueda de prensa se comunicarán los últimos resultados sobre la búsqueda del bosón de Higgs en el LHC (Large Hadron Collider). Hamish se atreve a afirmar que el “anuncio oficial” de estos nuevos resultados en Australia tiene el problema de que este país no es miembro del CERN y además que ya ha comprado el billete para Ginebra para asistir en persona a la rueda de prensa. Supongo que habrá video streaming, así que yo lo veré desde casa. Cuando el anuncio sea oficial (aparezca en la web del CERN) ya os indicaré el enlace correspondiente.

Por cierto, “Los rumores sobre la detección del Higgs se convirtieron ayer” (20 de junio) “en trending topic a través del HT #HiggsRumors” (fuente @RSEF_ESP).

Tommaso Dorigo, “How Fast Do We Get Higgs Mass Plots From Raw Data ?, AQDS, June 17th 2012, nos cuenta cuánto tiempo cuesta convertir los datos de los análisis de las colisiones (“raw data”) en las figuras finales (histogramas en función de la masa) que aparecerán en las charlas del ICHEP y en los artículos científicos. Según él, primero hay que preseleccionar los eventos interesantes para cada canal de desintegración del Higgs, que para unos 5 /fb de datos recogidos en el LHC en 2012 puede costar unos 3 meses; afortunadamente este proceso se realiza en paralelo con la toma de datos. Por cierto, este proceso puede hacerse de forma “ciega” sin que los científicos involucrados puedan saber cuál será el resultado final. La parte final del análisis, recopilar todos los datos y “sumar” los resultados obtenidos, Tommaso estima que se pueda hacer en medio día (como mucho). Por ello, un día nadie sabe nada sobre el Higgs y al día siguiente todo el mundo (dentro de la colaboración de científicos) sabe lo mismo que las primeras personas que vieron la figura final.

PS: Como dice Jorge Díaz, “CERN anunciará nuevos resultados en búsqueda del Higgs,” Conexión Causal, junio 22, 2012, “¿por qué el CERN convoca este seminario [científico] adelantándose a la presentación en ICHEP [tres días más tarde] si no [es] para anunciar algo importante? Ojalá no se trate de estrategia publicitaria y de resultados de verdad importantes.”

El estaño “doblemente mágico,” cuyo núcleo tiene 50 neutrones y 50 protones

El isótopo 100 Sn del estaño es el núcleo “doblemente mágico” más pesado, es decir, tiene un número mágico tanto de protones como de neutrones. El físico Eugene Wigner acuñó el término “número mágico” para referirse a ciertos números de protones (o de  neutrones) en el núcleo atómico para los que se espera que sean mucho más estables que los demás, en concreto, 2, 8, 20, 28, 50, 82 y 126. Los núcleos doblemente mágicos son ideales para estudiar la fuerza nuclear efectiva que une a los nucleones entre sí. No siempre estos núcleos son estables, lo son para el helio (4 He), oxígeno (16 O) y calcio (40 Ca), debido a la repulsión eléctrica entre los protones, que conforme crece Z requieren más neutrones que protones para su (meta)estabilidad. Por ello, los núcleos doblemente mágicos del níquel (56 Ni) y estaño (100 Sn) son inestables (radiactivos), aunque al primero solo le faltan dos neutrones para serlo (el 58 Ni es estable); por contra, el núcleo 100 Sn está demasiado lejos, tiene 12 neutrones menos, que el más ligero de los isótopos estables del estaño, 112 Sn, lo que lo hace muy difícil de estudiar. Se publica en Nature el primer estudio detallado de sus propiedades, como nos cuenta Daniel Bazin, “Nuclear physics: Symmetrical tin,” Nature 486: 330–331, 21 June 2012, haciéndose eco del artículo técnico de C. B. Hinke et al., “Superallowed Gamow–Teller decay of the doubly magic nucleus 100 Sn,” Nature 486: 341–345, 21 June 2012.

Lo más atractivo del 100 Sn es lo que lo hace muy difícil de estudiar, lo lejos que está de otros isótopos estables que hace que “fabricarlo” sea extremadamente difícil. Se han propuesto dos métodos, la colisión de núcleos de menor número atómico y la fragmentación mediante partículas alfa de núcleos más pesados. Hinke y sus colegas han utilizado el segundo, fragmentando núcleos de xenón 124 Xe, “cortando” sus nucleones más externos con proyectiles de alta energía. Aún así no es fácil y  Hinke y sus colegas solo han podido fabricar 259 núcleos para su estudio. Los resultados son espectaculares. Se ha mejorado mucho la precisión en la medida de su vida media, que ha resultado ser 1,16 ± 0,20 segundos. Por primera vez se ha medido en detalle el espectro de este núcleo tanto en su desintegración beta (emisión de positrones) como gamma (emisión de fotones), desintegración hacia el indio 100 In, que ha sido comparada con éxito con simulaciones númericas (predicciones teóricas). También se ha medido por primera vez el espectro de energía de los positrones en estas desintegraciones. Entrar en los detalles técnicos de este estudio nos llevaría muy lejos. Lo más importante es que en un futuro próximo se podrán utilizar estos isótopos para entender en detalle la fuerza nuclear efectiva que une a los protones y a los neutrones en los núcleos.