Cosas de japoneses (o un atasco de tráfico en una carretera circular)

La entrada de bitácora «Gran descubrimiento: hay atascos porque hay muchos coches,» nos muestra que los japoneses son un poco «cabezas cuadradas» (o «cabezas circulares») y hacen cosas que realmente nos llaman la atención. Nos comenta la noticia «An accident? Construction work? A bottleneck? No, just too much traffic,» que se basa en el artículo (de acceso gratuito a todo el mundo) Yuki Sugiyama et al, «Traffic jams without bottlenecks-experimental evidence for the physical mechanism of the formation of a jam,» New J. Phys. 10, 033001 (7pp), 2008.

Los autores del artículo dicen que por primera vez se ha demostrado experimentalmente que la aparición de un atasco es un fenómeno colectivo como una transición de fase «dinámica» que genera la formación de patrones en sistemas fuera de equilibrio, es decir, un fenómeno espontáneo. Los autores muestran como pequeñas fluctuaciones en la velocidad de los conductores puede conducir a grandes efectos, el atasco, cuando la densidad de vehículos supera un límite crítico, así como la propagación en forma de onda (solitaria) del propio atasco. Estos resultados eran «conocidos» a nivel teórico. Según los autores la teoría ha sido confirmada por el experimento: han mostrado como no es necesario un embotellamiento para producir un atasco. La creencia de que el embotellamiento es la causa del atasco es errónea, éste sólo provoca variaciones en la densidad de vehículos, siendo éstas las responsables del atasco, que se genera de forma «espontánea».

Si no has visto el video de youtube todavía, es buen momento para que lo hagas ahora y te «marees» viendo cómo los conductores «se marean» de dar más vueltas que un tíovivo. ¡¡Cosas de japoneses!!

Hablando de modelos del tráfico, los modelos cinemáticos de Lighthill-Witham (y de Richards) de los 1950s me han hecho recordar que Sir Michael James Lighthill, quien ocupó la silla lucasiana en Cambridge (que ocupó Newton años há) tras Dirac (en 1969) y antes de Hawking (que le relevó en 1979 tras su abandono para hacerse rector de otra universidad londinense), nunca fue doctor (no hizo el doctorado): estudió durante la Gran Guerra, con 22 años era profesor y con 26 años catedrático. Un genio. Nunca hizo el doctorado porque no lo necesitó, aunque recibió 24 doctorados «honoris causa» durante su larga vida académica. Aunque sí dirigió las tesis doctorales de varios doctorandos. Una bonita biografía de Debnath.  Un obituario de cuando falleció en 1998.

Una frase de Sir James en inglés, para no desvirtuarla «I want to suggest that educators may have most benefited their pupils when they have succeeded in giving them a feel for what is involved in the process of applying mathematics… Computers may be of great value in problem-solving, but apparently the human brain alone is able to tackle the subtler aspects of creating an effective correspondence between the mathematical world and the world of experiment and observation.»

Para qué sirve la Red Básica en Málaga (o estoy en un atasco de tráfico y el 80% de las calles están vacías)

Map of Malaga

Las calles en una ciudad se organizan de forma jerárquica de forma tal que la mayoría de las calles «sobran», mientras que una minoría son fundamentales (en Málaga, serían llamadas Red Básica). Sorprendentemente, esta partición puede ser caracterizada por el principio 80/20 (ley de Pareto), es decir, el 80% de las calles están menos conectadas que la media, mientras que el 20% restante estás más conectadas que la media, como muestra Bin Jiang, «Street Hierarchies: A Minority of Streets Account for a Majority of Traffic Flow» ArXiv, submitted on 9 Feb 2008. Más aún hay un 1% (contado en el 20%) que están extremadamente conectadas. El autor ha estudiado empíricamente una ciudad sueca.

Uno de los resultados más interesantes del artículo es el hecho de que el flujo del tráfico tiende a acumularse en las calles mejor conectadas (o al contrario, quizás se han diseñado así), es decir, la conectividad de una calle es un buen predictor del flujo de tráfico en ella. En el 20% de las calles correspodiente a las peor conectadas prácticamente no hay tráfico, en el 1% correspondiente de las mejores conectadas se concentra el 20% del tráfico (número de vehículos por día), y en el 20% de las mejor conectadas está el 80% del tráfico. La ley de Pareto (en el artículo se dice que de Zipf) del 80/20 se cumple también en esta caso.

¿Por qué el artículo habla de «ley de Zipf» en lugar de «ley de Pareto? Lada Adamic, «Zipf, Power-laws, and Pareto – a ranking tutorial» nos aclara su relación. Ambas leyes equivalen a que el dato considerado (conectividad o tráfico) sigue una distribución (probabilística) modelada por una ley potencial, es decir, power-law, Zipf law, y Pareto law son sinónimos. En todos los casos se describe fenómenos en los que los casos significativos son raros y los no significativos muy comunes.

La ley de Zipf tiene muchas aplicaciones, como medir la popularidad de las páginas web o el «share» (audiencia) de las cadenas de televisión. Veamos algunos ejemplos:

Feng Fu, Lianghuan Liu, Kai Yang, and Long Wang, «The structure of self-organized blogosphere,» ArXiv 2006, estudian la distribución estadística de la blogosfera, demostrando que cumplen la hipótesis del mundo pequeño que conduce a distribuciones potenciales (power law) para muchos de sus parámetros.

B. Blasius and R. Toenjes, «Zipf law in the popularity distribution of chess openings,» ArXiv 2007, analizan un gran número de bases de datos de partidas de ajedrez, mostrando que la ley potencial está en la base de la elección de la apertura tanto entre grandes maestros como en aficionados. Lo más interesante es que el exponente de la ley crece linelmente con la profundidad del juego, es decir, en la apertura la mayoría de los jugadores eligen entre muy pocas posibilidades, mientras que en el medio juego el número de posibilidades se diversifica extremadamente. 

Damian H. Zanette, «Zipf’s law and city sizes: A short tutorial review on multiplicative processes in urban growth,» ArXiv 2007, utilizan el modelo de Simon (basado en procesos estocásticos multiplicativos) para «predecir» la ley de la potencia en la distribución del tamaño de ciudades (276 áreas metropolitanas de EEUU y su tamaño censal en el 2000). Los resultados no son excesivamente buenos y los autores indican que se necesitan ciertas extensiones para conseguir mejorarlos.

Finalmente, Zike Zhang et al. «Empirical analysis on a keyword-based semantic system,» ArXiv, 2008, estudia las palabras clave en artículos científicos «demostrando empíricamente» que su distribución estadística (al menos en la revista Proceedings of the National Academy of Science of the United States of America, PNAS) sigue la ley de Zipf con exponente 0.86. Los autores suponen que ello ocurre en todos los casos.

En este blog, todavía pequeño para un análisis estadístico riguroso, la ley de Zipf va camino de cumplirse… ya comentaremos algo más adelante.