Cuándo premiarán a Perelman con un millón de dólares

Me gustaría poder contar aquí esos “grandes” pequeños descubrimientos de los matemáticos que se publican periódicamente, al menos en los campos en los que yo trabajo; sin embargo, sinceramente creo que a nadie interesarían (sólo a unos pocos “amiguetes” que nos dedicamos “a lo mismo”). Las noticias matemáticas y de matemáticos son sólo los GRANDES descubrimientos (al contrario que en Física, donde la inyección, no la colisión, de dos haces de protones en un túnel es una  noticia tan “importante” como el supuesto romance entre nuestro ex Jose Marie [perdón] y una guapa ministra francesa).

El gran descubrimiento matemático del s. XXI, hasta el momento, es sin lugar a dudas la demostración de la conjetura de Poincaré por el método de Hamilton, esbozada por Perelman y completada por seis matemáticos en tres versiones diferentes. ¿Cuál es la noticia? La noticia fue. Fue hace dos años. Este año, en agosto, el Instituto Clay de Matemáticas debería dar por resuelto el Premio del Milenio correspondiente, el primero en ser resuelto. ¿Por qué la noticia todavía no ha “saltado” a las rotativas? Todos sabemos, o creemos saber, que Perelman rechazará el premio, pero, ¿y qué más da? ¿Por qué no dan por resuelto el asunto? Quizás esperan a anunciarlo a finales de noviembre o principios de diciembre coincidiendo con el anuncio de los Premios Nobel para restarles atención. O quizás tendremos que esperar “unos añitos.”

La verdad. No lo sé. Pero no me gusta el precedente. Los grandes premios matemáticos (en aquella época Matemática e Ingeniería eran lo mismo) del s. XIX eran resueltos y no pasaba nada, nadie se rasgaba las vestiduras, se resolvían y nada más. La Ciencia progresaba. Los matemáticos alimentaban a sus hijos (“sedientos” de conocimiento). Y si alguien encontraba un “error”, pues no pasa nada, qué más da. La ciencia avanza y ha avanzado con dichas demostraciones. Lo siento, pero me niego a poner un enlace al Instituto Clay, buscadlo vosotros mismos.

Mi opinión vale poco. ¿Pero qué opinan al respecto los “grandes” matemáticos? Callan. ¿Pero qué opinan al respecto los matemáticos? La mayoría callan. Bueno, entonces a qué viene esta entrada. MELVYN B. NATHANSON no quiere callar, como podemos leer en su “Opinion” en Notices of the AMS, August 2008, “DESPERATELY SEEKING MATHEMATICAL TRUTH,” aunque yo no coincido con su opinión. El artículo merece su lectura en inglés, pero permitidme algunos extractos traducidos.

“Los matemáticos creemos en la verdad. Demostramos teoremas. Los teoremas son deducciones a partir de axiomas. Cada línea de la demostración es una consecuencia simple de las líneas previas o de teoremas previamente probados. Sus conclusiones son verdaderas, incondicionales y eternas.  (…) ¿Cómo sabemos que una demostración es correcta? Comprobándola, línea a línea. Un ordenador podría hacerlo. Para descubrir una demostración (…) hay que ser un genio.” Pero comprobar una demostración es una labor “trivial”. ¿O no?

“En el año 2000 el Instituto Clay de Matemáticas anunció premios de un millón de dólares para la resolución de 7 problemas, calificados como “problemas del milenio.” (…) De acuerdo con las reglas, se requieren dos años tras la aparición de la solución en “publicaciones matemáticas con revisores de prestigio mundial,” y tras su “aceptación generalizada por parte de la comunidad matemática,” para que el premio sea concedido.” ¿Por qué tanto retraso? Un teorema es correcto o no lo es. ¿No puede ser comprobado por “cualquier” matemático? ¿Por qué esperar dos años?”

“La razón es que la mayoría de los teoremas matemáticos importantes no tienen demostración.” ¿Cómo? ¿Se le está yendo la “olla” a Nathanson? No, él nos lo aclara. Permitidme el inglés: “They have sketches of proofs, outlines of arguments, hints and intuitions,” más aún, que “son obvias para el autor, cuando las escribió, pero que tienen que ser comprendidas y creídas por, al menos, una parte de la comunidad matemática.” Pero esta comunidad es pequeña. “En la mayoría de los campos de las matemáticas hay muy pocos expertos (en activo)”. De hecho, el porcentaje de matemáticos entre la población humana es muy pequeño.

La mayoría de las demostraciones de teoremas matemáticos importantes son comprobadas por un reducido número de expertos (los únicos capaces de hacerlo). Los “jefes” (“bosses” en el original) son los que proclaman que un teorema está demostrado correctamente o no. Nathanson se nos confiesa “por supuesto, yo no digo que haya problemas en la demosración de Perelman. No lo sé. Nosotros (la comunidad de matemáticos) creemos que las demostraciones son correctas porque hay un “consenso político” que soporta dicha conclusión.”

¿Y a quién le echamos la culpa? ¿Por qué tanta obsesión en echar la culpa a alguien? Tema para otra entrada, sigamos con Nathanson. “Parte del problema es el proceso de revisión por pares.” ¡Manda cojones! ¡Aquí teníamos que llegar! Y Nathanson no se queda aquí, además afirma que “muchos (yo creo que la mayoría) de los artículso cientíticos publicados en la mayoría de las revistas internacionales con revisores no son revisados.” ¡Sí, lo habéis leído bien! Nathanson afirma que los revisores (y yo he sido revisor en múltiples ocasiones) no lo hemos hecho bien. No lo hacemos bien. Os animo a leer el artículo, así que repito el enlace “DESPERATELY SEEKING MATHEMATICAL TRUTH.”

En resumen los Premios del Milenio para ser concedidos requieren “dos [es decir, unos cuantos] años tras la aparición de la solución en “publicaciones matemáticas con revisores [de verdad, no sobre el papel] de prestigio mundial,” y tras su “aceptación generalizada por parte de la comunidad matemática.” No sería mejor haber puesto que la demostración sea estudiada en [muchos] cursos de doctorado hasta que sea comprendida por “miles” de matemáticos jóvenes de actitud crítica que la utilicen como parte de los cimientos de su futura carrera. ¿Habrá que esperar a que Perelman muera (ya está jubilado de la matemática, según él confesaba hace un par de años) para que le den el premio?

¿Para qué sirven los premios? Para incentivar a los jóvenes. ¿Incentiva a los jóvenes que los premios se conviertan en inalcanzables? ¿Qué es un millón de dólares? Una mi…. pinchá en un palo.

Disclaimer: Obviamente el objetivo del Instituto Clay es que, aparte de que Mr. Clay pase a la historia como Mr. Nobel, “incrementar y diseminar el conocimiento matemático.” Los premios una mera “mosca” de marketing. Y también “animar a los estudiantes “bien dotados” a seguir una carrera matemática.” Según sus estatutos.

Análisis del tráfico en eMule y eDonkey (o los “hechos” sobre las descargas P2P)

En este blog nos tenemos que hacer eco de las noticias “científico-técnicas” sobre la eMula, dado que parafraseamos su nombre en nuestro título “(th)E mule”. Un poco de historia muy conocida. Un hacker llamado Merkur pensó en 2002 que podía mejorar el cliente P2P llamado eDonkey y creó el proyecto eMule, que popularizó el protocolo eDonkey (sobre todo en Europa). Pero vayamos al grano, ¿cómo es el tráfico actual en eMule? El artículo de Frederic Aidouni, Matthieu Latapy, Clemence Magnien, “Ten weeks in the life of an eDonkey server,” ArXiv preprint, 19 Sep 2008 , lo estudia con cierto detalle (y no es fácil capturar estadísticas del protocolo eDonkey sin interferir en el tráfico).

Recapitulemos. Han estudiado de forma continua durante casi 10 semanas el tráfico en los protocolos UDP y TCP/IP de un servidor eDonkey “importante” observando la “friolera” de 8 867 052 380 peticiones, sí, casi 9 mil millones de mensajes, involucrando 89 884 526 diferentes direcciones IP, sí, casi 90 millones de usuarios, y 275 461 212 diferentes campos de identificación de ficheros (fileID), sí, más de 275 millones de ficheros “distintos”. ¡Increíble!

El trabajo de espionaje realizado … ¿Te habrán espiado? ¿Estarás tú en los datos que han recabado? No te preocupes, los autores han utilizado un sistema de anonimato tanto para los clientes (clientID), ficheros (fileID), cadenas de búsqueda (search strings), nombres de fichero (filenames) y tamaños de fichero (filesizes). Según los autores lo han hecho bien: “a very strong anonymisation scheme.” Creámosles, no nos queda otro remedio. En el artículo detallan bastante la técnica y parece “razonablemente” fiable (pero yo no soy experto en “desanomización”).

Vayamos a los resultados presentados. El número de clientes que “ofrece” partes de un fichero concreto sigue una ley de potencias (power law) con una cola “compleja” que sugiere que es la suma de varias leyes de potencia independientes. Los autores sugieren que es debido a que hay diferentes tipos de ficheros que siguen leyes de potencia con parámetros diferentes. Esta alta heterogeneidad también ha sido observada en cuanto al número de ficheros diferentes que un cliente “ofrece” a los demás. Pocos clientes ofrecen miles de ficheros y cientos de clientes ofrecen sólo algunos pocos. Sin embargo, en este caso la distribución observada se parece menos a una ley de potencia.

Una de las cosas más curiosas para mí, no por inesperada sino por lo contrario, porque era de esperar, es la gráfica de la izquierda en la que aparece el número de ficheros “compartidos” de un tamaño determinado. Hay un pico muy claro alrededor del tamaño de un CD (unos 700 MB), el tamaño típico de una película ripeada en un .avi o en .mpg. También sus subarmónicos, su mitad, 350 MB, su tercera parte, 230 MB, y su cuarta parte 175 MB. ¿Por qué un pico en 1 GB? Los autores suponen que porque mucha gente divide el tamaño de un DVD (unos 4.7 GB) en partes “redondas” de un 1 GB. Yo más bien soy de la opinión que está relacionado con el hecho de que las pelis de “mejor calidad,” sobre todo las ripeadas en formato MPEG, suelen ocupar algo más de 700 MB, rondando 1 GB (algo por encima).

Desafortunadamente no ofrecen más análisis de sus resultados. En mi opinión, el trabajo de Aidouni et al. es un primer paso en el estudio y análisis de todos los datos que han recabado. Estoy seguro de que próximamente veremos más artículos en los que dichos autores analizan otros factores de interés en la ingente cantidad de datos que han atesorado. La Mula Francis estará “al loro.”

Como apostilla, para los interesados en detalles técnicos, aunque no lo dicen en el artículo sus autores, el servidor eD2k que han utilizado es el desarrollado por Lugdunum en C, desarrollado por este hacker utilizando ingeniería inversa del protocolo eDonkey (como todo hacker debería hacer). Este protocolo es gratuito pero no es de software abierto (open soft) con objeto de evitar que se creen servidores falsos (fake) por parte de los “garantes” de la legalidad que deseen “penalizar” la red P2P bajo eDonkey (generándole penas a los humildes “peers”).

Más apostillas, el software de espía P2P que han desarrollado los autores del artículo se llama LogP2P.

Postdata: El Blog de Matthieu Latapy falleció recientemente, esperemos que renazca (para los interesados en su página web). Foto de los dos autores que firman en último lugar el artículo.