Conexión, curvatura y la geometría diferencial de las teorías de Yang-Mills

Volviendo la hilo que estaba siguiendo, resumo lo anterior. Las teorías de Yang-Mills son la versión no lineal de las ecuaciones de Maxwell, donde “no lineal” quiere decir que las excitaciones del campo tipo partícula pueden interaccionar entre sí (algo imposible en el electromagnetismo). Para especificar una teoría de Yang-Mills se necesita especificar una conexión en un fibrado y una métrica en su espacio base (el espaciotiempo). El grupo de estructura del fibrado representa las simetrías “internas” del campo, es decir, las transformaciones geométricas que se pueden aplicar a las componentes del campo sin que cambie la física descrita por dicho campo. Se llama “internas” a estas simetrías porque no afectan a los puntos del espaciotiempo (como las transformaciones de Lorentz y Poincaré). A estas transformaciones geométricas “internas” se les llama transformaciones gauge y a las teorías de Yang-Mills también se les llama teorías de campo gauge.

El párrafo anterior se puede repetir con símbolos matemáticos. Un campo de Yang-Mills es una conexión en un fibrado principal cuyo espacio base es el espacio de Minkowski en 4D, sea \mbox{M}_{4}, y cuyo grupo de estructura (que coincide con el espacio de fibras) es un grupo de Lie, sea \mbox{G}, con álgebra de Lie \mbox{g} (recuerda que el álgebra de Lie es el espacio tangente a cada punto del grupo de Lie); la importancia del álgebra es que permite tratar de forma lineal las transformaciones no lineales del grupo, luego es más fácil cuantizar objetos que “viven” en el álgebra que en el grupo, pues la física cuántica es “intrínsecamente” lineal. En física, el fibrado principal se considera trivial \mbox{E}=\mbox{M}_{4}\times\mbox{G}, lo que significa que se asocia a cada punto del espaciotiempo una transformación geométrica “interna” del grupo que actúa sobre los campos definidos en dicho espaciotiempo.

El potencial del campo de Yang-Mills, la conexión, es una 1-forma A:\mbox{M}_{4}\rightarrow\mbox{g}, que a cada punto del espaciotiempo le asigna un elemento del álgebra de Lie; usando una base del álgebra, podemos escribir A(x)=A^{a}_{\mu}(x)t^{a}dx^{\mu}, donde se ha usado el convenio de suma de índices repetidos de Einstein, x^{\mu}\mu=0,1,2,3 son las coordenadas (locales) en el espaciotiempo \mbox{M}_{4}, y t^{a}, a=1,2,\ldots,\dim\mbox{g}=\dim\mbox{G} son los elementos de una base (también llamados generadores) del álgebra \mbox{g}; recuerda que los generadores del grupo se obtienen exponenciando los del álgebra.

Una teoría de Yang-Mills es una teoría gauge porque la intepretación física de A se realiza módulo la acción del grupo (la aplicación de una transformación del grupo no afecta a la física). En concreto, si aplicamos una transformación arbitraria del grupo a cada punto del espacio, sea h:\mbox{M}_{4}\rightarrow\mbox{G} la matriz que la representa en la representación adjunta del grupo, los generadores del álgebra se transforman como t^{a}\rightarrow{h(x)}t^{a}h^{-1}(x), lo que induce una transformación gauge en el campo A(x)\rightarrow{h^{-1}(x)}A(x){h(x)}+h^{-1}dh(x)=A^{h}(x), pero la física descrita por A(x) y A^h(x) es exactamente la misma. Un estado físico de la teoría es una clase de equivalencia de los potenciales del campo bajo transformaciones gauge.

Los físicos derivan las ecuaciones del campo a partir de un principio variacional de acción extrema. La acción del campo de Yang-Mills viene determinada por la curvatura, una 2-forma con valores en \mbox{g} dada por F=F^{a}_{\mu\nu}t^{a}dx^{\mu}{\wedge}dx^{\nu}, donde F^{a}_{\mu\nu}={\partial}_{\mu}A_{\nu}-{\partial}_{\nu}A_{\mu}+f^{abc}A^{b}_{\mu}A^{c}_{\nu}, y f^{abc} son las constantes de estructura del álgebra \mbox{g}, es decir, [t^{a},t^{b}]=t^{a}t^{b}-t^{b},t^{a}=f^{abc}t^{c}. En la literatura físico-matemática es habitual escribir F=dA+A{\wedge}A (usando el lenguaje de las formas diferenciales).

Una transformación gauge no solo afecta a los potenciales, sino también a los campos vía la curvatura F\rightarrow{h^{-1}}{F}{h}. Como la física (los campos y sus ecuaciones) tienen que ser invariantes ante transformaciones gauge, las ecuaciones del campo que se deducirán de aplicar un principio de “mínima” acción exigen que la acción se defina utilizando una expresión invariante gauge. En la teorías de Yang-Mills se utiliza la expresión más obvia, la 4-forma \mbox{tr}F\wedge{F^{*}}=F^{a}_{\mu\nu}F^{a}_{\mu\nu}, donde F^{*} es el dual de Hodge de F respecto a la métrica (aquí se ve como determinar la acción del campo requiere especificar una métrica); recuerda que esta expresión matemática contiene derivadas hasta el segundo orden de A. La acción del campo en forma integral toma la forma

S(A)=\frac{1}{4\,g^{2}}\int_{\mbox{M}_{4}}F^{a}_{\mu\nu}F^{a}_{\mu\nu}d^{4}x=\frac{1}{4\,g^{2}}\int\mbox{tr}F\wedge{F^{*}}d^{4}x,

donde la constante positiva g^{2} es un parámetro adimensional llamado constante de acoplamiento.

Quizás conviene que comprobemos que la constante de acoplamiento es adimensional. Recuerda, en general, la dimensión de una magnitud física es el producto de las tres unidades fundamentales de longitud [L], tiempo [T] y masa [M]. Cuando se usan unidades en las que la velocidad de la luz c=1 y la constante de Planck \hbar=1, lo habitual en física teórica, tanto los tiempos como las masas se miden en unidades de longitud (en concreto, [T] = [L]/c y [M]=[L]^{-1}\hbar/c). Se comprueba fácilmente que la dimensión de la conexión (el potencial) es [A]=1/[L], la de la curvatura (los campos) es [F]=1/[L]^2, y obviamente la de elemento de espaciotiempo [d^4 x]=[L]^4, con lo que si la acción es adimensional S también lo es g^{2}.

La constante de acoplamiento adimensional es una propiedad en 4D y no es verdad en 3D, donde [d^3 x]=[L]^3, implica que [g^2]=[L], ni en 2D, donde [d^2 x]=[L]^2, implica que [g^2]=[L]^2. Por tanto, en 2D y 3D la constante de acoplamiento tiene unidades de longitud, o de masa, y aparece de manera natural un parámetro de masa en la teoría de Yang-Mills; sin embargo, en 4D es adimensional y la teoría no tiene ningún parámetro de masa, luego en la teoría clásica no existe ningún “salto de masa” y cualquier versión cuántica de la teoría a nivel perturbativo (es decir, una aproximación en serie de potencias de la constante de acoplamiento) tampoco puede tener ninguno. Sin embargo, la versión cuántica de la teoría puede mostrar un “salto de masa” si de forma dinámica aparece un parámetro de masa, por ejemplo debido al efecto de términos no lineales como (A{\wedge}A)^2.

La ecuaciones para el campo clásico de Yang-Mills son ecuaciones hiperbólicas (ecuaciones de onda). En la teoría cuántica constructiva o axiomática se utiliza una transformación de Wick (que vuelve el tiempo complejo t\rightarrow \mbox{i}t) para transformar el espacio de Minkowski en un espacio euclídeo y obtener ecuaciones elípticas (ecuaciones de campo) para el campo. Siguiendo esta filosofía la acción del campo se escribe

S(A)=\frac{1}{4\,g^{2}}\int_{\mathbb{R}^{4}}\mbox{tr}F\wedge{F^{*}}d^{4}x,

que no afecta a la física descrita (pues la transformación de Wick se puede deshacer fácilmente) y facilita enormemente el análisis matemático del problema.

El comportamiento de las soluciones de un problema elíptico depende del tipo de singularidades que presenten. Si la curvatura no presenta singularidades y es de cuadrado integrable, F\in\mbox{L}^2, entonces el campo es autodual F^{*}=\pm{F} y las soluciones del campo son de tipo solitón (llamadas en este contexto “instantones”). Se ha conjeturado que las ecuaciones de Yang-Mills autoduales son integrables (lo que permitiría escribir la expresión general de sus soluciones y realizar una cuantización directa), pero no está demostrado. Sin embargo, en física, se da el caso complicado, la curvatura no es de cuadrado integrable y presenta singularidades, F\not\in\mbox{L}^2 y $latex F^{*}\neq\pm{F}$. Las singularidades pueden ser un conjunto finito de puntos aislados (soluciones llamadas “merons”), una curva unidimensional (soluciones llamadas “líneas de carga”), o superficies bidimensionales (soluciones llamadas “vórtices”). El análisis matemático detallado de todas estas soluciones es un problema abierto.

La manera más directa para un físico de realizar la cuantización de una teoría de Yang-Mills es utilizar una integral funcional de caminos; en ejemplos sencillos se ha demostrado que es equivalente a utilizar cualquier otro tipo de cuantización. Sin embargo, para el matemático este método está plagado de dificultades y se requiere el desarrollo de nuevas herramientas matemáticas para entender estas integrales de forma rigurosa. El problema del milenio requiere desarrollar estas herramientas. De hecho, todos los libros y artículos de revisión sobre la teoría constructiva o axiomática de campos cuánticos (como el libro de Glimm y Jaffe, o los trabajos de Balaban o Rivasseau) omiten considerar las teorías de Yang-Mills pues prácticamente no hay nada que contar, más allá de un sinnúmero de dificultades.

En términos generales, la integral de caminos conecta los estados asintóticos de las partículas lejos del lugar de su interacción, antes y después de ésta, mediante la acción del campo. Los estados asintóticos son solución de las ecuaciones linealizadas del campo y describen las partículas del campo como partículas “libres” (algo que a los físicos no les gusta cuando se aplica a los “gluones” ya que estos estados “libres” no son observables como tales), llamémosles A_{{in}}A_{{out}}. Obviamente, estos estados “libres” sufren correcciones debidas a la autointeracción del campo no lineal de Yang-Mills (la interacción de estas partículas “libres” con el vacío las reviste y las confina impidiendo que sean observables).

Volviendo a la matemática, la integral funcional de caminos toma la forma

Z(A_{{in}},A_{{out}})=e^{\mbox{i}W(A_{{in}}, A_{{out}})}=\int_{A_{{in}},t\to{-\infty}}^{A_{{out}}, t\to{+\infty}}e^{\mbox{i}S(A)}dA,

donde S(A) es la acción clásica del campo (que incluye otra integral en su definición). No hay una teoría rigurosa de las integrales de camino que nos permita lidiar con estos objetos tan complicados, a lo más podemos hacerlo con las gaussianas (las que tienen como integrando una exponencial de una forma cuadrática). Además, hay que factorizar el efecto de la simetría gauge en la métrica del espacio de conexiones dA, ya que solo hay que integrar utilizando las clases de equivalencia de las conexiones, las órbitas del grupo, es decir, todas las conexiones que se pueden obtener unas a partir de las otras utilizando las transformaciones del grupo conducen a la misma física y solo se deben contar una sola vez en la integral.

Para obtener un integrando gaussiano, siguiendo los pasos de la técnica de Fadéev y Popov, también introducida por ‘t Hooft, se puede realizar un cambio de variable de integración a A=B+ga, donde B describe el efecto de las condiciones de contorno o estados asintóticos “libres” (normalmente se escribe W(B)=W(A_{{in}}, A_{{out}})), a tiene condiciones de contorno nulas y g es la constante de acoplamiento. Utilizando este cambio de variable, se puede factorizar de la métrica en el espacio de conexiones dA la parte correspondiente a las órbitas del grupo, ya que el funcional S(B+a)-S(B) es constante a lo largo de estas órbitas. Nótese que, fijado B, una transformación gauge conduce a a\to{a^{h}}=\frac{1}{g}(A^{h}-B).

No quiero entrar en detalles muy técnicos, solo quiero mostrar dónde puede aparecer un parámetro con unidades de masa en la teoría. Gracias al cambio de variable anterior se puede obtener una integral gaussiana para a que permite obtener los propagadores de las partículas (los “gluones” libres) de la teoría. Para dar sentido a dicha integral hay que regularizarla introduciendo un valor de corte, es decir, substituyendo una integral infinita por \int_{0}^{\infty}=\int_{0}^{\mu}+\int_{\mu}^{\infty}=\lim_{\epsilon\to{0}}\int_{\epsilon}^{\mu}+\int_{\mu}^{\infty}; para \epsilon\to{0} la dependencia respecto a \epsilon y \mu debe desaparecer en los resultados finales obtenidos, algo que solo ocurrirá si la teoría es renormalizable (ésta es una de las definiciones de renormalizabilidad). La primera integral diverge logarítmicamente como \ln\epsilon/\mu. El parámetro \mu tiene unidades de longitud, es decir, de masa y en la literatura física a veces se escribe \ln\Lambda/m, donde m corresponde a la “masa” de las partículas “libres” de la teoría.

Un cálculo detallado (ver los detalles en las referencias de más abajo), conduce a

W(B)=\frac{1}{4}\left(\frac{1}{g^{2}}+\frac{11}{48\pi^{2}}C(G)\ln\frac{\epsilon}{\mu}\right)\int\mbox{tr}(F\wedge{F^{*}})+\cdots,

donde C(G) es el valor del operador de Casimir del grupo \mbox{G} en su representación adjunta y se han omitido correcciones de orden superior. Sin entrar en más detalles de teorías cuánticas de campos, lo importante de esta expresión para W(B) es la aparición de un parámetro dimensional \mu. El problema del “salto de masa” está relacionado con la posibilidad (bastante razonable a la vista de esta expresión) de que los estados asintóticos de las partículas (descritos por B) dependan del parámetro \mu de forma explícita y por tanto correspondan a partículas con masa (aunque no le guste a un físico, los “gluones” de la teoría serían partículas con masa).

Obviamente, en QCD, el confinamiento de los gluones hace que los estados asintóticos “libres” tengan que ser neutros respecto a la carga de color, las llamadas glubolas (“glueballs”). No se debe confundir esto con el problema del salto de masa que describe estados de la teoría que no pueden ser observados. Ya hablé de la confusión típica entre los físicos de hablar de “salto de masa” para las glubolas, cuya masa es mayor que la de un protón (un gigaelectrónvoltio). En el problema del milenio, el salto de masa no puede superar la escala de energía de confinamiento, \Lambda, que ronda los 270 megaelectrónvoltios, y las estimaciones hablan de valores incluso muchísimo más pequeños.

La masa de las partículas de la teoría (los “gluones” no confinados) corresponde al espectro del operador hamiltoniano (u operador de energía) de la teoría y si existe el salto de masa se puede demostrar que dicho espectro será \{0\}\cup\{m\}\cup[2m,\infty), donde el valor 0 corresponde a la energía del vacío, el valor m a la masa de los “gluones” libres de la teoría y aparece un espectro continuo de energía a partir del valor 2m. Si no existe el salto de masa, algo de lo que dudan pocos expertos, pero que hasta que no se demuestre lo contrario es una posibilidad que no podemos descartar de forma rotunda, el espectro sería [0,\infty), exactamente el mismo que en la teoría clásica de Yang-Mills (los “gluones” no confinados podrían tener una energía arbitraria). El salto de masa es una propiedad genuínamente cuántica que no aparece en la teoría clásica.

Toda esta derivación “formal” es conocida desde los 1970, pero nadie sabe cómo realizarla de forma matemáticamente rigurosa. Por un lado, hay que demostrar que la integral de caminos es un objeto bien definido, lo que requiere una construcción rigurosa de la medida en el espacio de conexiones, es decir, de un objeto aparentemente tan trivial como dA. Una vez logrado hay que determinar el espectro de la teoría resultante y comprobar si el operador de energía (el generador de las traslaciones en el tiempo) presenta un salto de masa en su espectro.

Definir la medida en el espacio de conexiones en una teoría en redes (lattice Yang-Mills) es fácil pero no se sabe obtener su límite continuo o límite para volumen infinito. Este es un posible camino para resolver el problema del milenio, aunque ahora mismo no hay “buenas ideas” sobre cómo llevarlo a cabo. Tampoco se sabe si una versión rigurosa del procedimiento formal esbozado más arriba conducirá a una solución del problema (de hecho, la mayoría los expertos opina que esto no se puede hacer y que hay que partir de ideas completamente nuevas). La situación actual del problema del salto de masa es que no hay ningún camino abierto que parezca prometedor. Mucha gente opina que es uno de los problemas del milenio más difíciles, sino el más difícil.

El salto de masa (la masa de los gluones) es un fenómeno no observado en la Naturaleza debido al efecto del confinamiento, es decir, existen efectos cuánticos que impiden que se observen en la Naturaleza estados libres de los gluones con masa. Por ello, el problema del salto de masa está relacionado con el confinamiento porque su efecto no es observable debido al confinamiento. Sin embargo, esta relación no se puede explotar porque tampoco existe una teoría matemática rigurosa que explique el confinamiento; de hecho, no se sabe si tal teoría ayudará a resolver este problema al permitir separar su efecto o no. La mayoría de los expertos opina que no es una buena vía de ataque tratar de resolver el problema del confinamiento y que ocurrirá al contrario, la solución del problema del sato de masa ayudará a entender el primero y no al revés.

No aburro más. Los interesados en más detalles técnicos deben saber que he seguido el hilo del artículo de L. D. Faddeev, “Mass in Quantum Yang-Mills Theory,” arXiv:0911.1013. A los que quieran más detalles les recomiendo el libro (que está en español y es fácil de conseguir) A. A. Slavnov, L. D. Faddéev, “Introducción a la teoría cuántica de los campos gauge,” Editorial URSS, 1999. Por supuesto, hay mucha literatura adicional, pero no quiero marear mucho más sobre este tema. Recomiendo la lectura del último libro (aún en proceso de escritura y gratis en su web) de Vincent Rivasseau. Las charlas del congreso “Mathematical Foundations of Quantum Field Theory” January 2012, también son un buen punto de partida para conocer a los expertos en estos asuntos y seguir sus publicaciones.

3 pensamientos en “Conexión, curvatura y la geometría diferencial de las teorías de Yang-Mills

  1. A pues no parece tan difícil a ver si tengo un ratillo :D Históricamente creo que se ha considerado a la hipótesis de Riemann el problema del milenio más difícil aunque eso nunca se sabe.
    Quizás se podrían aplicar a este problema alguna de las herramientas matemáticas de la teoría de cuerdas. Recientemente Strassler nos ha explicado que una colaboración de análisis de datos del LHC (los “sombreros negros”) se han basado en las matemáticas de las cuerdas para elaborar un nuevo software de análisis de datos. Quizás esto ha contribuido decisivamente a que se pudiera hacer un anuncio tan temprano del descubrimiento del Higgs.
    Esto sin duda alienta a seguir investigando en cuerdas (sin descartar otras opciones) ya que está claro que como mínimo, las herramientas matemáticas desarrolladas son útiles y quizás sean decisivas para resolver los misterios de la física.

  2. Hola de nuevo.

    Francis, creo que te confundes. Los estados asintoticos en YM no son gluones libres. No existe nada parecido a un gluon libre. Los estados asintoticos son un determinado campo A_\mu(x) muy complicado pero que estamos casi seguros (confinamiento) que tiene que ser un singlete de color. Un estado de cualquier teoria es, por definición, un autoestado del Hamiltoniano. Y también por definición un autoestado del Hamiltoniano no evoluciona en el tiempo. Un gluon no es nada parecido a eso. Si pones un gluon a capon polariza el vacio que hay alrededor. Por lo tanto los gluones no pueden ser los estados de la teoría. Las partículas de las teorias de YM son glueballs debido al confinamiento.

    El problema es algo distinto que en las teorias más normales como QED. En QED tienes un hamiltoniano libre que te describe fotones y electrones que no interaccionan y después una perturbación. Esto lleva a la interpretación de estados libres (electrones, fotones) que interaccionan.

    En las teorías gauge no abelianas esta imagen es imposible. La razón es que no existe nada parecido a una teoria no abeliana “libre”. Uno puede pensar que esto corresponde al limite g -> 0, pero si uno coge el hamiltoniano de YM y pone g=0 lo que te queda tiene una simetría distinta de la simetría gauge original. En un caso tiene SU(N), y en el otro U(1)^N, que son radicalmente distintas, sobre todo desde el punto de vista cuántico (un caso es asintoticamente libre y la otra no). Las teorías gauge no abelianas solo tiene sentido si hay interacción.

    Creo que para demostrar el problema del milenio, hay que demostrar confinamiento (por eso en la exposición del problema se le dedica tanto tiempo a discutirlo). Dicho de otra forma, una “estrategia” consiste en demostrar que todos los autoestados del Hamiltoniano son singletes de color (confinamiento), y después demostrar que todos los singletes de color tienen masa (a pesar de que están construidos de “gluones” sin masa) generada mediante la renormalización.

    El problema del salto de masa consiste en explicar por que las interacciones fuertes son tal y como son (partículas compuestas masivas, con una interacción de corto alcance), a pesar de que los grados de libertad ·”básicos” de la teoría son quarks y gluones que tienen masas o bien nulas o bien demasiado pequeñas para explicar la masa de las partículas que vemos.

    A alguien “bien entrenado” en teoría cuantica de campos perturbativa le enseñas el Lagrangiano de QCD, y automáticamente diría que esa teoría representa una interacción de largo alcance entre quarks con masas muy pequeñas, que intercambian gluones sin masa. Una “copia” de QED con más cargas,en vez de solo positiva y negativa. Y sin embargo ese físico bien entrenado en TCC no podría estar más equivocado!

    Tal y como tu lo planteas el problema del milenio parece un “problema académico” sin relación con el mundo donde vivimos, mientras que para mi representa uno de los dos misterios más grande que quedan en el modelo estandar.

  3. “No se debe confundir esto con el problema del salto de masa que describe estados de la teoría que no pueden ser observados.”

    Aquí creo que te equivocas. En una QFT formal, bien definida matemáticamente, los estados de su espacio de Hilbert no pueden ser inobservables, al menos no el mismo sentido que un gluón o un quark, ya que entre otras cosas son estables. Estrictamente hablando, ningún hadrón o glueball salvo el protón puede aparecer en este espacio, ya que ninguno es estable.

    En QCD puro, en ausencia de las demás interacciones (asumiendo que sea consistente suponer que se puede describir QCD de forma aislada) quizá otros hadrones, como el pión, se vuelvan estables, cuya masa por cierto es del orden de magnitud de Lambda_QCD. Pero en cualquier caso, cualquier partícula estable que encontrases en el espectro debería verse al menos como una resonancia en QCD real (conjeturo).

    Hablar de la “masa de los gluones” o que esta no es observada “debido al confinamiento” es en mi opinión bastante engañoso. ¿Has leido alguna referencia que afirme explícitamente algo parecido? Un saludo.

Los comentarios están cerrados.