Se publica en Science un nuevo coeficiente matemático para el estudio de correlaciones no lineales entre pares de datos

El análisis estadístico de la correlación entre dos variables se mide mediante el coeficiente de correlación de Pearson r (inventado por Francis Galton en 1888 y que Karl Pearson indicó como estimar de forma fiable). Este coeficiente es adecuado para magnitudes que dependen linealmente entre sí; para correlaciones no lineales, David N. Reshef y sus colegas publican hoy en Science un nuevo coeficiente, llamado coeficiente de información maximal o MIC. Este nuevo coeficiente se basa en la teoría de la información introducida por Claude Shannon, que introdujo los conceptos de entropía de una variable aleatoria y de información mutua (MI) entre un par de ellas. Según Terry Speed el coeficiente MIC es el mayor avance en este campo desde que en 1957 Linfoot aplicó el MI para cuantificar las correlaciones entre pares de variables (utilizó el valor [1 − exp(−2MI)]1/2). El gran problema del MI es que estimarlo con precisión es muy difícil cuando se tienen pocos datos (digamos, menos de 1000 datos). Reshef et al. resuelven los problemas del MI introduciendo el MIC y un algoritmo en tres pasos para calcularlo de forma eficiente. ¿Ha llegado el final para el coeficiente de correlación r de Galton-Pearson? Obviamente, no. El coeficiente de correlación lineal rXY entre un par de variables X e Y se puede extender al coeficiente de correlación parcial rXY.Z entre las variables X e Y condicionado a que una tercera variable Z mantenga un valor constante. Reshef et al. no han sido capaces de extender su MIC(X,Y) a un MIC(X,Y|Z); quizás otros investigadores lo logren en los próximos años; mientras tanto r y MIC seguirán siendo utilizados en pie de igualdad. Nos lo ha contado Terry Speed, “Mathematics: A Correlation for the 21st Century,” Science 334: 1502-1503, 16 December 2011, haciéndose eco del artículo técnico de David N. Reshef et al. , “Detecting Novel Associations in Large Data Sets;” Science 334: 1518-1524, 16 December 2011.

El análisis matemático detallado, incluyendo lemas y teoremas, así como los algoritmos de cálculo para estimar el valor del MIC aparecen en la información suplementaria del artículo. Un trabajo matemático como éste, avalado por una artículo Science, promete ser muy utilizado por médicos, biólogos, psicólogos y muchos otros científicos que utilizan las correlaciones entre variables como parte natural de su trabajo. Además, los matemáticos y estadísticos se alegrarán de tener un nuevo juguete para sus desvaríos (que no me regañe nadie, me refiero al desarrollo de infinidad de variantes del MIC con objeto de corregir sus defectos en ciertas circunstancias, que haberlos los habrá).

8 pensamientos en “Se publica en Science un nuevo coeficiente matemático para el estudio de correlaciones no lineales entre pares de datos

  1. jefe, el link de consideraciones adicionales nos lleva a la biblio online. Podrías poner un link mejor porfa?

    Gracias!!

  2. Francis, a ver si esta vez no me cuelo. Ha salido en Nature otro artículo acerca de la expansión del Universo y Lemaitre. Parece que en otra obra posterior, Lemaitre si se reivindica. Me acordé ayer al leerlo.

  3. No conozco en detalle esto que indicas, pero ciertamente, el viejo coeficiente de correlación cruzada entre dos procesos (Uni o multi-dimensionales), se basaba en la presumpcion de que entre ambos procesos (Desde señales de audio, hasta imágenes tridimensionales de R.M.N.) habia una relacion lineal.

    Que: Y (de R^n) = Ak(Matriz de R^nxR^n) · X (de R^n)

    El objetivo era buscar esa matriz que ligaba un proceos a otro, y ello lo daban las correlaciones cruzadas (Mas o menos desfasadas en tiempo, o espacio, o la magnitud que sea).

    Teníamos una teoría de procesos interrelacionados por operadores lineales, y teníamos una herramienta de detección y medición de esa inter-relación.

    Si ahora se ha creado una teoría de procesos relacionados por relaciones no-linelaes, y desarrollado herramientas para detectarla, y medirla, ciertamente, creo que será un nuevo campo, tanto en teoría (Podrán verse si procesos teóricos independientes, en realidad, son descendientes unos de otros), y en la practica.

    La correlación lineal ha sido madre de codificadores de voz, de imágenes, de detección de submarinos, de aviones y su tipo en imágenes de radar, de cardiopatias en registros del corazón, de tumores en imágenes R.M.NN,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

    La correlación no-lineal puede dar cuenta del ligazon entre procesos naturales relacionados entre si, por mecanismos no-lineales.

    Y de mecanismos no-lineales, la naturaleza tiene un buen arsenal.

    Creo que es un gran avance.

    Saludos.

    (Siempre he creido que Shannon inicio un camino que debe llevarnos a grandes sitios. Tengo su tesis en +.pdf, sobre Reles, que cosas…….).

  4. Gracias, muy buen artículo para los que no estamos en primera linea de investigación pero necesitamos estar al tanto!!!!

  5. Hola, gran articulo, me gusta estar al tanto de estas cosas. ¿Alguien conoce algun enlace de donde descargar la información suplementaria del articulo? el que hay lleva a una pagina de biblioteca en la que me parece que no puedes registrarte.

Los comentarios están cerrados.