Conexión, curvatura y la geometría diferencial de las teorías de Yang-Mills

Volviendo la hilo que estaba siguiendo, resumo lo anterior. Las teorías de Yang-Mills son la versión no lineal de las ecuaciones de Maxwell, donde “no lineal” quiere decir que las excitaciones del campo tipo partícula pueden interaccionar entre sí (algo imposible en el electromagnetismo). Para especificar una teoría de Yang-Mills se necesita especificar una conexión en un fibrado y una métrica en su espacio base (el espaciotiempo). El grupo de estructura del fibrado representa las simetrías “internas” del campo, es decir, las transformaciones geométricas que se pueden aplicar a las componentes del campo sin que cambie la física descrita por dicho campo. Se llama “internas” a estas simetrías porque no afectan a los puntos del espaciotiempo (como las transformaciones de Lorentz y Poincaré). A estas transformaciones geométricas “internas” se les llama transformaciones gauge y a las teorías de Yang-Mills también se les llama teorías de campo gauge.

El párrafo anterior se puede repetir con símbolos matemáticos. Un campo de Yang-Mills es una conexión en un fibrado principal cuyo espacio base es el espacio de Minkowski en 4D, sea \mbox{M}_{4}, y cuyo grupo de estructura (que coincide con el espacio de fibras) es un grupo de Lie, sea \mbox{G}, con álgebra de Lie \mbox{g} (recuerda que el álgebra de Lie es el espacio tangente a cada punto del grupo de Lie); la importancia del álgebra es que permite tratar de forma lineal las transformaciones no lineales del grupo, luego es más fácil cuantizar objetos que “viven” en el álgebra que en el grupo, pues la física cuántica es “intrínsecamente” lineal. En física, el fibrado principal se considera trivial \mbox{E}=\mbox{M}_{4}\times\mbox{G}, lo que significa que se asocia a cada punto del espaciotiempo una transformación geométrica “interna” del grupo que actúa sobre los campos definidos en dicho espaciotiempo.

El potencial del campo de Yang-Mills, la conexión, es una 1-forma A:\mbox{M}_{4}\rightarrow\mbox{g}, que a cada punto del espaciotiempo le asigna un elemento del álgebra de Lie; usando una base del álgebra, podemos escribir A(x)=A^{a}_{\mu}(x)t^{a}dx^{\mu}, donde se ha usado el convenio de suma de índices repetidos de Einstein, x^{\mu}\mu=0,1,2,3 son las coordenadas (locales) en el espaciotiempo \mbox{M}_{4}, y t^{a}, a=1,2,\ldots,\dim\mbox{g}=\dim\mbox{G} son los elementos de una base (también llamados generadores) del álgebra \mbox{g}; recuerda que los generadores del grupo se obtienen exponenciando los del álgebra.

Una teoría de Yang-Mills es una teoría gauge porque la intepretación física de A se realiza módulo la acción del grupo (la aplicación de una transformación del grupo no afecta a la física). En concreto, si aplicamos una transformación arbitraria del grupo a cada punto del espacio, sea h:\mbox{M}_{4}\rightarrow\mbox{G} la matriz que la representa en la representación adjunta del grupo, los generadores del álgebra se transforman como t^{a}\rightarrow{h(x)}t^{a}h^{-1}(x), lo que induce una transformación gauge en el campo A(x)\rightarrow{h^{-1}(x)}A(x){h(x)}+h^{-1}dh(x)=A^{h}(x), pero la física descrita por A(x) y A^h(x) es exactamente la misma. Un estado físico de la teoría es una clase de equivalencia de los potenciales del campo bajo transformaciones gauge.

Los físicos derivan las ecuaciones del campo a partir de un principio variacional de acción extrema. La acción del campo de Yang-Mills viene determinada por la curvatura, una 2-forma con valores en \mbox{g} dada por F=F^{a}_{\mu\nu}t^{a}dx^{\mu}{\wedge}dx^{\nu}, donde F^{a}_{\mu\nu}={\partial}_{\mu}A_{\nu}-{\partial}_{\nu}A_{\mu}+f^{abc}A^{b}_{\mu}A^{c}_{\nu}, y f^{abc} son las constantes de estructura del álgebra \mbox{g}, es decir, [t^{a},t^{b}]=t^{a}t^{b}-t^{b},t^{a}=f^{abc}t^{c}. En la literatura físico-matemática es habitual escribir F=dA+A{\wedge}A (usando el lenguaje de las formas diferenciales).

Una transformación gauge no solo afecta a los potenciales, sino también a los campos vía la curvatura F\rightarrow{h^{-1}}{F}{h}. Como la física (los campos y sus ecuaciones) tienen que ser invariantes ante transformaciones gauge, las ecuaciones del campo que se deducirán de aplicar un principio de “mínima” acción exigen que la acción se defina utilizando una expresión invariante gauge. En la teorías de Yang-Mills se utiliza la expresión más obvia, la 4-forma \mbox{tr}F\wedge{F^{*}}=F^{a}_{\mu\nu}F^{a}_{\mu\nu}, donde F^{*} es el dual de Hodge de F respecto a la métrica (aquí se ve como determinar la acción del campo requiere especificar una métrica); recuerda que esta expresión matemática contiene derivadas hasta el segundo orden de A. La acción del campo en forma integral toma la forma

S(A)=\frac{1}{4\,g^{2}}\int_{\mbox{M}_{4}}F^{a}_{\mu\nu}F^{a}_{\mu\nu}d^{4}x=\frac{1}{4\,g^{2}}\int\mbox{tr}F\wedge{F^{*}}d^{4}x,

donde la constante positiva g^{2} es un parámetro adimensional llamado constante de acoplamiento.

Quizás conviene que comprobemos que la constante de acoplamiento es adimensional. Recuerda, en general, la dimensión de una magnitud física es el producto de las tres unidades fundamentales de longitud [L], tiempo [T] y masa [M]. Cuando se usan unidades en las que la velocidad de la luz c=1 y la constante de Planck \hbar=1, lo habitual en física teórica, tanto los tiempos como las masas se miden en unidades de longitud (en concreto, [T] = [L]/c y [M]=[L]^{-1}\hbar/c). Se comprueba fácilmente que la dimensión de la conexión (el potencial) es [A]=1/[L], la de la curvatura (los campos) es [F]=1/[L]^2, y obviamente la de elemento de espaciotiempo [d^4 x]=[L]^4, con lo que si la acción es adimensional S también lo es g^{2}.

La constante de acoplamiento adimensional es una propiedad en 4D y no es verdad en 3D, donde [d^3 x]=[L]^3, implica que [g^2]=[L], ni en 2D, donde [d^2 x]=[L]^2, implica que [g^2]=[L]^2. Por tanto, en 2D y 3D la constante de acoplamiento tiene unidades de longitud, o de masa, y aparece de manera natural un parámetro de masa en la teoría de Yang-Mills; sin embargo, en 4D es adimensional y la teoría no tiene ningún parámetro de masa, luego en la teoría clásica no existe ningún “salto de masa” y cualquier versión cuántica de la teoría a nivel perturbativo (es decir, una aproximación en serie de potencias de la constante de acoplamiento) tampoco puede tener ninguno. Sin embargo, la versión cuántica de la teoría puede mostrar un “salto de masa” si de forma dinámica aparece un parámetro de masa, por ejemplo debido al efecto de términos no lineales como (A{\wedge}A)^2.

La ecuaciones para el campo clásico de Yang-Mills son ecuaciones hiperbólicas (ecuaciones de onda). En la teoría cuántica constructiva o axiomática se utiliza una transformación de Wick (que vuelve el tiempo complejo t\rightarrow \mbox{i}t) para transformar el espacio de Minkowski en un espacio euclídeo y obtener ecuaciones elípticas (ecuaciones de campo) para el campo. Siguiendo esta filosofía la acción del campo se escribe

S(A)=\frac{1}{4\,g^{2}}\int_{\mathbb{R}^{4}}\mbox{tr}F\wedge{F^{*}}d^{4}x,

que no afecta a la física descrita (pues la transformación de Wick se puede deshacer fácilmente) y facilita enormemente el análisis matemático del problema.

El comportamiento de las soluciones de un problema elíptico depende del tipo de singularidades que presenten. Si la curvatura no presenta singularidades y es de cuadrado integrable, F\in\mbox{L}^2, entonces el campo es autodual F^{*}=\pm{F} y las soluciones del campo son de tipo solitón (llamadas en este contexto “instantones”). Se ha conjeturado que las ecuaciones de Yang-Mills autoduales son integrables (lo que permitiría escribir la expresión general de sus soluciones y realizar una cuantización directa), pero no está demostrado. Sin embargo, en física, se da el caso complicado, la curvatura no es de cuadrado integrable y presenta singularidades, F\not\in\mbox{L}^2 y $latex F^{*}\neq\pm{F}$. Las singularidades pueden ser un conjunto finito de puntos aislados (soluciones llamadas “merons”), una curva unidimensional (soluciones llamadas “líneas de carga”), o superficies bidimensionales (soluciones llamadas “vórtices”). El análisis matemático detallado de todas estas soluciones es un problema abierto.

La manera más directa para un físico de realizar la cuantización de una teoría de Yang-Mills es utilizar una integral funcional de caminos; en ejemplos sencillos se ha demostrado que es equivalente a utilizar cualquier otro tipo de cuantización. Sin embargo, para el matemático este método está plagado de dificultades y se requiere el desarrollo de nuevas herramientas matemáticas para entender estas integrales de forma rigurosa. El problema del milenio requiere desarrollar estas herramientas. De hecho, todos los libros y artículos de revisión sobre la teoría constructiva o axiomática de campos cuánticos (como el libro de Glimm y Jaffe, o los trabajos de Balaban o Rivasseau) omiten considerar las teorías de Yang-Mills pues prácticamente no hay nada que contar, más allá de un sinnúmero de dificultades.

En términos generales, la integral de caminos conecta los estados asintóticos de las partículas lejos del lugar de su interacción, antes y después de ésta, mediante la acción del campo. Los estados asintóticos son solución de las ecuaciones linealizadas del campo y describen las partículas del campo como partículas “libres” (algo que a los físicos no les gusta cuando se aplica a los “gluones” ya que estos estados “libres” no son observables como tales), llamémosles A_{{in}}A_{{out}}. Obviamente, estos estados “libres” sufren correcciones debidas a la autointeracción del campo no lineal de Yang-Mills (la interacción de estas partículas “libres” con el vacío las reviste y las confina impidiendo que sean observables).

Volviendo a la matemática, la integral funcional de caminos toma la forma

Z(A_{{in}},A_{{out}})=e^{\mbox{i}W(A_{{in}}, A_{{out}})}=\int_{A_{{in}},t\to{-\infty}}^{A_{{out}}, t\to{+\infty}}e^{\mbox{i}S(A)}dA,

donde S(A) es la acción clásica del campo (que incluye otra integral en su definición). No hay una teoría rigurosa de las integrales de camino que nos permita lidiar con estos objetos tan complicados, a lo más podemos hacerlo con las gaussianas (las que tienen como integrando una exponencial de una forma cuadrática). Además, hay que factorizar el efecto de la simetría gauge en la métrica del espacio de conexiones dA, ya que solo hay que integrar utilizando las clases de equivalencia de las conexiones, las órbitas del grupo, es decir, todas las conexiones que se pueden obtener unas a partir de las otras utilizando las transformaciones del grupo conducen a la misma física y solo se deben contar una sola vez en la integral.

Para obtener un integrando gaussiano, siguiendo los pasos de la técnica de Fadéev y Popov, también introducida por ‘t Hooft, se puede realizar un cambio de variable de integración a A=B+ga, donde B describe el efecto de las condiciones de contorno o estados asintóticos “libres” (normalmente se escribe W(B)=W(A_{{in}}, A_{{out}})), a tiene condiciones de contorno nulas y g es la constante de acoplamiento. Utilizando este cambio de variable, se puede factorizar de la métrica en el espacio de conexiones dA la parte correspondiente a las órbitas del grupo, ya que el funcional S(B+a)-S(B) es constante a lo largo de estas órbitas. Nótese que, fijado B, una transformación gauge conduce a a\to{a^{h}}=\frac{1}{g}(A^{h}-B).

No quiero entrar en detalles muy técnicos, solo quiero mostrar dónde puede aparecer un parámetro con unidades de masa en la teoría. Gracias al cambio de variable anterior se puede obtener una integral gaussiana para a que permite obtener los propagadores de las partículas (los “gluones” libres) de la teoría. Para dar sentido a dicha integral hay que regularizarla introduciendo un valor de corte, es decir, substituyendo una integral infinita por \int_{0}^{\infty}=\int_{0}^{\mu}+\int_{\mu}^{\infty}=\lim_{\epsilon\to{0}}\int_{\epsilon}^{\mu}+\int_{\mu}^{\infty}; para \epsilon\to{0} la dependencia respecto a \epsilon y \mu debe desaparecer en los resultados finales obtenidos, algo que solo ocurrirá si la teoría es renormalizable (ésta es una de las definiciones de renormalizabilidad). La primera integral diverge logarítmicamente como \ln\epsilon/\mu. El parámetro \mu tiene unidades de longitud, es decir, de masa y en la literatura física a veces se escribe \ln\Lambda/m, donde m corresponde a la “masa” de las partículas “libres” de la teoría.

Un cálculo detallado (ver los detalles en las referencias de más abajo), conduce a

W(B)=\frac{1}{4}\left(\frac{1}{g^{2}}+\frac{11}{48\pi^{2}}C(G)\ln\frac{\epsilon}{\mu}\right)\int\mbox{tr}(F\wedge{F^{*}})+\cdots,

donde C(G) es el valor del operador de Casimir del grupo \mbox{G} en su representación adjunta y se han omitido correcciones de orden superior. Sin entrar en más detalles de teorías cuánticas de campos, lo importante de esta expresión para W(B) es la aparición de un parámetro dimensional \mu. El problema del “salto de masa” está relacionado con la posibilidad (bastante razonable a la vista de esta expresión) de que los estados asintóticos de las partículas (descritos por B) dependan del parámetro \mu de forma explícita y por tanto correspondan a partículas con masa (aunque no le guste a un físico, los “gluones” de la teoría serían partículas con masa).

Obviamente, en QCD, el confinamiento de los gluones hace que los estados asintóticos “libres” tengan que ser neutros respecto a la carga de color, las llamadas glubolas (“glueballs”). No se debe confundir esto con el problema del salto de masa que describe estados de la teoría que no pueden ser observados. Ya hablé de la confusión típica entre los físicos de hablar de “salto de masa” para las glubolas, cuya masa es mayor que la de un protón (un gigaelectrónvoltio). En el problema del milenio, el salto de masa no puede superar la escala de energía de confinamiento, \Lambda, que ronda los 270 megaelectrónvoltios, y las estimaciones hablan de valores incluso muchísimo más pequeños.

La masa de las partículas de la teoría (los “gluones” no confinados) corresponde al espectro del operador hamiltoniano (u operador de energía) de la teoría y si existe el salto de masa se puede demostrar que dicho espectro será \{0\}\cup\{m\}\cup[2m,\infty), donde el valor 0 corresponde a la energía del vacío, el valor m a la masa de los “gluones” libres de la teoría y aparece un espectro continuo de energía a partir del valor 2m. Si no existe el salto de masa, algo de lo que dudan pocos expertos, pero que hasta que no se demuestre lo contrario es una posibilidad que no podemos descartar de forma rotunda, el espectro sería [0,\infty), exactamente el mismo que en la teoría clásica de Yang-Mills (los “gluones” no confinados podrían tener una energía arbitraria). El salto de masa es una propiedad genuínamente cuántica que no aparece en la teoría clásica.

Toda esta derivación “formal” es conocida desde los 1970, pero nadie sabe cómo realizarla de forma matemáticamente rigurosa. Por un lado, hay que demostrar que la integral de caminos es un objeto bien definido, lo que requiere una construcción rigurosa de la medida en el espacio de conexiones, es decir, de un objeto aparentemente tan trivial como dA. Una vez logrado hay que determinar el espectro de la teoría resultante y comprobar si el operador de energía (el generador de las traslaciones en el tiempo) presenta un salto de masa en su espectro.

Definir la medida en el espacio de conexiones en una teoría en redes (lattice Yang-Mills) es fácil pero no se sabe obtener su límite continuo o límite para volumen infinito. Este es un posible camino para resolver el problema del milenio, aunque ahora mismo no hay “buenas ideas” sobre cómo llevarlo a cabo. Tampoco se sabe si una versión rigurosa del procedimiento formal esbozado más arriba conducirá a una solución del problema (de hecho, la mayoría los expertos opina que esto no se puede hacer y que hay que partir de ideas completamente nuevas). La situación actual del problema del salto de masa es que no hay ningún camino abierto que parezca prometedor. Mucha gente opina que es uno de los problemas del milenio más difíciles, sino el más difícil.

El salto de masa (la masa de los gluones) es un fenómeno no observado en la Naturaleza debido al efecto del confinamiento, es decir, existen efectos cuánticos que impiden que se observen en la Naturaleza estados libres de los gluones con masa. Por ello, el problema del salto de masa está relacionado con el confinamiento porque su efecto no es observable debido al confinamiento. Sin embargo, esta relación no se puede explotar porque tampoco existe una teoría matemática rigurosa que explique el confinamiento; de hecho, no se sabe si tal teoría ayudará a resolver este problema al permitir separar su efecto o no. La mayoría de los expertos opina que no es una buena vía de ataque tratar de resolver el problema del confinamiento y que ocurrirá al contrario, la solución del problema del sato de masa ayudará a entender el primero y no al revés.

No aburro más. Los interesados en más detalles técnicos deben saber que he seguido el hilo del artículo de L. D. Faddeev, “Mass in Quantum Yang-Mills Theory,” arXiv:0911.1013. A los que quieran más detalles les recomiendo el libro (que está en español y es fácil de conseguir) A. A. Slavnov, L. D. Faddéev, “Introducción a la teoría cuántica de los campos gauge,” Editorial URSS, 1999. Por supuesto, hay mucha literatura adicional, pero no quiero marear mucho más sobre este tema. Recomiendo la lectura del último libro (aún en proceso de escritura y gratis en su web) de Vincent Rivasseau. Las charlas del congreso “Mathematical Foundations of Quantum Field Theory” January 2012, también son un buen punto de partida para conocer a los expertos en estos asuntos y seguir sus publicaciones.