Todo lo que siempre quisiste saber sobre leyes de potencia

Las leyes de potencia están de moda a la hora de interpretar datos experimentales. Pero las leyes de potencia son un arma de doble filo. No es fácil estimar sus parámetros utilizando un estimador de máxima verosimilitud. Códigos en Matlab y en R que te permiten estimar los parámetros de una ley de potencias así como calcular la bondad de dicho ajuste los puedes encontrar en esta página web, resultado de un artículo que se publicará en la prestigiosa SIAM Review, “Power-law distributions in empirical data,” de Aaron Clauset, Cosma Rohilla Shalizi, y M. E. J. Newman, disponible en ArXiv desde junio de 2007 (last revised 2 Feb 2009).

El código más interesante plfit.m no funciona en la versión 6 de Matlab, requiriendo al menos la versión 7 (los cambios para adaptarlo a la versión 6 no son difíciles de hacer pero hay que hacerlos). Es un código lento pero ni mucho menos tan lento como plvar.m que estima el error en los parámetros del ajuste y plpva.m que determina el valor p del ajuste mediante un test de Kolmogorov-Smirnov (si p<0.1 la ley de potencias es un pésimo ajuste a los datos). Estos últimos comandos repiten 1000 veces un cálculo que tarda decenas de segundos. Así que hay que tomárselo con mucha tranquilidad.

Mucha gente afirma que las citas de artículos científicos de un investigador siguen una ley de potencia. Uno de los ejemplos del artículo de Clauset et al. para las citas totales en el ISI WOS (Web of Science) a todos los artículos publicados en una serie de años encuentra un valor de p=0,2 que indica cierta evidencia, pero afirma que una ley de potencias truncada (con un corte) obtiene un p=0,87 (un valor muy bueno). ¿Qué pasará con un autor individual? He buscado en el ISI WOS las publicaciones y su número de citas (a día de hoy) de varios investigadores para comprobar si con los programas de Clauset et al. es válida la hipótesis de que siguen una ley de potencias. Los resultados hasta el año 2008 (inclusive) son los siguientes:

– Edward Witten que tiene 271 artículos y un índice h de 120; obtenemos alpha =1,89 +/- 0,38, con xmin =102 +/- 133, lo que claramente nos hace dudar de la validez de la ley de la potencia, de hecho lo confirma un p=0,001.

– Jorge E. Hirsch, inventor del índice h, que tiene 215 artículos y un índice h de 52; obtenemos un alpha=2,11 +/- 0,29, con xmin=36 +/- 20, un un valor p=0,028. Tampoco sigue una ley de potencia.

– Un investigador español senior con 204 artículos y un índice h de 12; obtenemos alpha=2,33 +/- 0,59, con xmin=4 +/-3, y un p=0,001.

– Un investigador español joven con 48 artículos y un índice h de 8; obtenemos alpha=1,83 +/- 0,50, con xmin=3 +/-4, y un p=0,25.

Son solo 4 ejemplos, pero parece claro que las leyes de potencia no describen bien las citas de investigadores.

Anuncios