VIII Carnaval de Matemáticas: La paradoja de Banach-Tarski y el axioma de elección

Esta tira cómica de Xkcd nos ilustra la paradoja de Banach-Tarski y nos recuerda la necesidad de usar el axioma de elección en su demostración. Sin embargo, el teorema de Banach-Tarski se puede demostrar sin utilizar el axioma de elección, basta usar el teorema de Hahn-Banach, que equivale a una especie de versión débil del axioma de elección. Os recuerdo a los despistados que el teorema de Banach-Tarski afirma que se puede dividir una esfera en un conjunto finito de partes disjuntas (conjuntos no medibles según Lebesgue) que pueden ser rotadas, trasladadas y vueltas a unir para dar lugar a dos esferas idénticas a la original. Este teorema se suele demostrar utilizando el axioma de elección. Los interesados pueden encontrar una demostración magistralmente simple del genial Terence Tao en su exposición “The Banach-Tarski Paradox,” Classroom Notes, UCLA, 2004. Sin embargo, el axioma de elección no es necesario. Se puede demostrar el teorema de Banach-Tarski utilizando el teorema de Hahn-Banach como demostró Janusz Pawlikowski (1991) como corolario trivial de la demostración de Matthew Foreman y Friedrich Wehrung (1991) de que dicho teorema implica la existencia de conjuntos que no son medibles según Lebesgue. Quizás debemos recordar que el axioma de elección implica el teorema de Hahn-Banach, que se puede demostrar utilizándolo, pero no al contrario, ya que el teorema de Hahn-Banach puede ser demostrado sin utilizar el axioma de elección. No he podido resistir la tentación de hablar del teorema de Banach-Tarski como mi contribución a la VIII Edición del Carnaval de Matemáticas organizado este mes por Juan Martínez-Tébar, “Los Matemáticos no son Gente Seria.” Quizás es una contribución muy técnica, pero es que Claudi y Tarski me recuerdan (gracias a Google) el artículo Enric Trillas y Clausi Alsina, “Logic: going farther from Tarski?,” Fuzzy Sets and Systems 53: 1-13, 1993 (el título promete más de lo que ofrece el artículo pero eso es lo de menos aquí).

El axioma de elección nos dice que si tenemos un conjunto no vacío, X, entonces para cada subconjunto no vacío S de X es posible elegir algún elemento s de S. Esto es, existe una función f que asigna a cada conjunto no vacío S de X un representante f(S) en S. Puede parecer un resultado matemático “obvio” (o intuitivo), pero cuando hablamos de conjuntos arbitrarios, cuyo cardinal puede ser infinito, lo obvio a veces no es tan obvio. Lo más curioso es que es un resultado matemático que no se puede demostrar (salvo a partir de algún resultado equivalente, como que todo espacio vectorial tiene una base). Por ello se denomina axioma. Más aún, este axioma es independiente del resto de los axiomas de la matemática (la aritmética de Zermelo-Fraenkel, por ejemplo), como demostró Paul J. Cohen en 1963 (Medalla Fields en 1966 por ello) utilizando ideas previas de Kurt Gödel (circa 1935-1938). Los matemáticos constructivistas prescinden del axioma de elección y desarrollan una matemática completa y consistente sin utilizarlo para nada, una matemática que, para sorpresa de muchos, es casi idéntica a la matemática que lo utiliza. Aún así, muchos creen que para todo teorema demostrado utilizando el axioma de elección, si existe su demostración sin dicho axioma, esta última es mucho más complicada que la primera. Aunque no siempre es así.

Antes de presentar la prueba de Terence Tao, un breve comentario sobre Terry. Tao obtuvo la Medalla Fields en 2006 en el ICM de Madrid y sigue siendo una referencia todoterreno en la matemática actualidad. Terry es el matemático bloguero por excelencia y su blog “What’s New” es editado todos los años en forma de libro por la American Mathematical Society. Si eres matemático, te recomiendo dicho blog, la mayoría de las veces muy técnico, pero siempre con grandes ideas de las que disfrutar.

Al grano. El grupo de Lie de las rotaciones en el el espacio tridimensional, SO(3), es un grupo continuo cuyo cardinal es infinito no numerable (hay tantas rotaciones en el espacio como valores reales posibles para tres ángulos). SO(3) contiene subgrupos G cuyo cardinal es infinito numerable (cuyas rotaciones tienen un subíndice natural, un número como 1, 2, 3, …). La primera versión del teorema de Banach-Tarski afirma que existe un subgrupo numerable G de SO(3) que se puede partir en cuatro trozos (subconjuntos disjuntos), convenientemente rotados, permiten construir dos copias idénticas de G cada una formada solo por dos de dichos trozos. En símbolos podemos escribir el siguiente teorema

Teorema: Existe un subgrupo numerable G of SO(3) con una partición G=G1∪G2∪G3∪G4, y dos rotaciones A,B en SO(3) tales que G=G1∪ AG2 y G=G3∪ BG4.

Demostración: Lo primero que se necesitan son dos rotaciones A y B tales que el subgrupo G de SO(3) generado por las cuatro rotaciones A, B, A-1, B-1 sea un subgrupo de cardinal numerable no finito; este subgrupo está formado por I, A, B, A-1, B-1, AB, AB-1, BA, BA-1, B-1A, B-1A-1,AAB, AAB-1, etc., por todas las “palabras” con un número arbitrario de “letras” formadas por las cuatro “letras” A, B, A-1, B-1. Es muy fácil encontrar dos rotaciones tales que no hay dos “palabras” iguales en este conjunto de “palabras” (los detalles y el álgebra los postergaremos al final de esta entrada para no “ensuciar” la demostración).

Llamemos G(A) a todos las “palabras” de G que empiezan con A (es decir, por I, A, AB, AB-1, AAB, AAB-1, ABA, ABA-1, etc.); ídem para G(B), G(A-1) y G(B-1). Obviamente, el grupo G se puede partir de la forma G={I}∪G(A)∪G(B)∪G(A-1)∪G(B-1), donde por {I} se denota el grupo trivial formado solo por el elemento identidad. Ahora viene la sorpresa. El grupo G también se puede escribir como G=G(A)∪ AG(A-1), ya que todas las “palabras” de G empiezan por A o son una palabra que se obtiene de quitarle la A-1 inicial a una palabra de G(A-1), es decir, pertenecen a G(A) o a AG(A-1).  De igual forma G=G(B)∪ BG(B-1).

Casi hemos acabado, pero no hemos acabado aún, ya que hemos partido G en 5 partes y hemos obtenido dos copias de G usando solo cuatro de dichas partes, pero queríamos partir G en cuatro partes. Necesitamos añadir la identidad a G(A) para que se transforme en G1. Piensa un poco, si quieres, pero la respuesta es muy fácil, bastan palabras por la inversa de A, de tal forma que G1=G(A)∪{ I, A-1, A-2, A-3, …}, y G2=G(A-1)\{A-1, A-2, A-3, …} (el operador \ es la diferencia de conjuntos). Obviamente, G3=G(B), G4=G(B-1), y ya hemos acabado la demostración.

El teorema anterior no requiere el axioma de elección, pero el siguiente corolario, que extiende dicho resultado del grupo de rotaciones numerable G a la esfera S² sí requiere su uso.

Corolario (paradoja de Hausdorff):  Existe un subconjunto numerable C de la esfera S² y una descomposición S²\C = Ω1∪ Ω2 ∪ Ω3∪ Ω4 tal que S²\C = Ω1∪ AΩ2 ∪ Ω3∪ BΩ4, para dos matrices de rotación A, B en SO(3).

Demostración: Sean A, B, G, G1, G2, G3, y G4 los mismos que en el teorema anterior. Cada rotación en G tiene dos puntos fijos en la esfera S² (la intersección en S² de su eje de rotación); sea C la unión de todos estos puntos fijos (obviamente un subconjunto numerable de S²). El grupo de rotación G actúa de forma libre sobre S²\C  (es decir, para todo x en dicho conjunto y g en el grupo, la ecuación gx=x tiene como única solución g=I, la identidad). Tomemos el subconjunto X de S²\C obtenido tomando un representante en S²\C de cada órbita del grupo G, entonces el axioma de elección nos permite obtener un recubrimiento S²\C = ∪x Gx (donde la unión es para todos los x en X); recuerda que la órbita Gx son todos los elementos que se obtienen de aplicar cualquier elemento g de G a x. Ahora tomando por definición Ωi = ∪x Gix, el corolario queda demostrado a partir del teorema anterior.

El conjunto numerable C puede ser eliminado utilizando el siguiente lema.

Lema. Sea C un subconjunto numerable de la esfera S². Entonces existe una descomposición S² = Σ1 ∪ Σ2, tal que S²\C = Σ1 ∪ R Σ2, para alguna rotación R en SO(3).

Demostración: Tomemos una rotación aleatoria R. Como C es numerable, podemos asegurar con probabilidad igual a la unidad que cualquier par de elementos de C pertenece a R-órbitas diferentes, es decir, Ri ∩ Rj = Ø, para i ≠ j. Eligiendo Σ2= C ∪ RC ∪ R²C ∪ …, y Σ1= S²\Σ2, obtenemos el resultado que queríamos demostrar.

Combinando este lema con el corolario anterior obtenemos un nuevo corolario.

Corolario. Existe una partición de S² = Γ1 ∪ Γ2 ∪ … ∪ Γ8, y matrices de rotación R1, R2, … R8 de SO(3) tales que S² = ∪i Ri Γi = ∪j Rj Γj donde i=1,2,3,4 y j=5,6,7,8.

Finalmente, como la bola (esfera sólida) B³ (la bola sin su punto central) en coordenadas polares corresponde al producto de la esfera S² y el intervalo (0,1], se puede concluir lo siguiente.

Corolario (paradoja de Banach-Tarski). Existe una partición de la bola B³ = E1 ∪ E2 ∪ … ∪ E8, y matrices de rotación R1, R2, … R8 de SO(3) tales que B³ = ∪i Ri Ei = ∪j Rj Ej donde i=1,2,3,4 y j=5,6,7,8.

En la demostración original de la paradoja de Banach-Tarski se elimina el problema de que el centro de la bola no esté incluido gracias al uso de traslaciones, además de rotaciones (los llamados movimientos en el espacio). Tao nos deja completar la prueba para este caso como ejercicio. Ahora bien, os lo ahorraré ya que para la “duplicación” de la calabaza en la tira cómica de Xkcd basta este resultado (las calabazas de Halloween son huecas).

Este resultado matemático puede resultar paradójico pero es importante recordar que alguno de los conjuntos Ei tiene que ser no medible según Lebesgue, lo que quiere decir que es un conjunto similara a un fractal, un conjunto muy intrincado y difícil (si no imposible) de imaginar. Los conjuntos que no son medibles según Lebesgue son “bestias” o “monstruos” más allá de lo que nuestra imaginación (no matemática) puede alcanzar.

Ahora para acabar nos quedaría demostrar que existen la rotaciones A,B en SO(3) que utilizamos en el teorema. Lo más sencillo es escribir dos ejemplos concretos de forma explícita: A será la matriz de rotación respecto al eje z con un ángulo θ tal que cos(θ)=3/5 y sin(θ)=4/5; y B es la matriz de rotación respecto al eje x también con un ángulo  θ tal que cos(θ)=3/5 y sin(θ)=4/5; sus inversas  A-1 y B-1 son obviamente las matrices correspondientes a un ángulo -θ (las matrices 3×3 traspuestas de las anteriores). Es fácil demostrar que ninguna composición no trivial de estas cuatro matrices da la identidad; el secreto es que los números 3, 4 y 5 son primos entre sí. Eliminando el denominador común, basta probar que ninguna composición no trivial de 5A, 5B, 5A-1 y 5B-1 da una matriz divisible entre 5. Un resultado casi obvio que dejamos al lector, para que piense un poco.

Con esto damos por terminada nuestra pequeña incursión matemática en la paradoja de Banach-Tarski. Espero no haber aburrido a los que odian la matemática porque no la entienden y tampoco a los que la aman porque las demostraciones hayan sido demasiado técnicas. Pero un Carnaval de Matemáticas bien merece algún que otro artículo que haga una incursión técnica en las paradojas para la intuición que atesora el Gran Libro de las demostraciones de Erdös.

3 pensamientos en “VIII Carnaval de Matemáticas: La paradoja de Banach-Tarski y el axioma de elección

  1. Me parece muy interesante. Quiero estar al corriente de novedades.

Los comentarios están cerrados.