«

»

Ago 28 2017

Imprimir esta Entrada

Histogramas vivientes: como incide la estadística es nuestra vida

Recientemente la archiconocida cuenta de Twitter @MaxCRoser, perteneciente al investigador de la Universidad de Oxford Max Roser, compartía una imagen mostrando cuán interesante puede ser la visualización de datos (tal y como de costumbre). En ella, se podía ver a un grupo de mujeres dispuestas en varias filas indias adyacentes según su altura, de menor a mayor y de izquierda a derecha. Así, las de menor altura se situaban en las filas de la izquierda, mientras las más altas se situaban a la derecha. Se observa así que las mujeres conforman una suerte de histograma cuya forma es fácilmente reconocible como una campana de Gauss, la cual caracteriza a la distribución Normal. A saber: existe una gran cantidad de mujeres en torno a la altura media, mientras que hay menos mujeres en torno a las alturas más atípicas, y esta distribución se da de manera perfectamente simétrica (existe más o menos el mismo número de mujeres altas que bajas).

 

Esta foto tiene su (curiosa) historia detrás. En el año 1975, Brian L. Joiner, un investigador del departamento de Estadística de la Universidad de Wisconsin (aunque por aquel entonces se encontraba en la Universidad Estatal de Pennsylvania), buscaba la forma de hacer la estadística un concepto más entretenido para sus estudiantes, de forma que dejaran de verla como una ciencia de meras cifras apiladas y empezasen a tomar conciencia de cómo la estadística juega un papel importante en nuestras vidas.

 

La idea de Joiner, cuyos resultados quedaron reflejados en un artículo de la International Statistical Review, fue la de representar conceptos básicos de la estadística y la probabilidad (correlación, distribución Normal, estadísticos descriptivos, etc.) a través de los datos de sus propios estudiantes, pero de una forma muy especial: utilizándoles a ellos mismos. El autor incluso se preocupó porque la muestra fuese representativa, evaluando las diferencias numéricas entre la gente que participó y la que no.

 

Por desgracia, en el artículo accesible hoy día sólo hay cuatro fotos que describen dos situaciones estadísticas: la existencia de la distribución Normal (una de ellas la que encabeza este post) y la existencia de correlación, concretamente entre altura y peso… y entre altura y rendimiento académico (!).

 

Me parece interesante pararse a observar las fotos de la distribución de las alturas entre las estudiantes. Sin haber establecido ninguna hipótesis previa sobre la misma, ha resultado que obedece casi a la perfección la campana de Gauss; esto es una buena prueba de la alta frecuencia con la que la distribución Normal se da en la naturaleza, a pesar de que en los últimos años se haya empezado a dudar de esto, principalmente por la irrupción de datos no generados de forma natural (dicho de otra manera: el famoso Big Data). Y eso sin contar el famoso Teorema Central del Límite (la suma de variables aleatorias independientes e idénticamente distribuidas resulta en otra variable aleatoria con distribución Normal).

 

Aún más interesante me parece la otra foto de la normalidad: en este caso, el histograma lo conforman todos los estudiantes, tanto hombres como mujeres. El resultado es una distribución bimodal: se observa que en la foto hay dos alturas que se dan con la misma frecuencia, una en torno al 5’5 y otro al 5’9, correspondientes a las dos modas de la distribución. Este fenómeno obedece a lo que en estadística denominamos mezcla de distribuciones.

distribucion normal

La mezcla se da cuando una distribución numérica se puede expresar como una combinación lineal de varias distribuciones. En este caso, está claro que hay dos: la altura de las mujeres y la altura de los hombres, estando la de los hombres centrada un poco más arriba que la de las mujeres (i. e. la altura media es superior en hombres). Como ya se ha visto antes, la altura se distribuye normalmente, por lo que el resultado es equivalente a superponer dos campanas de Gauss en un mismo gráfico, pero manteniendo una cierta distancia entre sus máximos (medias), equivalente a la diferencia entre alturas medias. Este fenómeno de distribuciones mezcladas es particularmente interesante y hoy en día está presente en muchos estudios de ciencias de la salud.

 

Lo que Joiner reflejó en estas fotos es, desde un punto de vista estadístico, muy simple y básico, pero gracias a su idea él consiguió algo que seguramente no conseguiría en sus clases: hacer a sus estudiantes partícipes de la materia que estaban aprendiendo, e interiorizar que todos esos fríos números y esos duros cálculos que veían en la pizarra estaban mucho más cerca de ellos de lo que hubiesen imaginado.

 

Ya lo has visto: ¡la estadística está a tu alrededor!

REFERENCIAS

Referencia de las fotos: Joiner, B. T. (1975) Living Histograms. International Statistical Review, 43(3), 339-340.

SOBRE EL AUTOR

Picanúmeros: Estadístico. Máster en Ciencia de Datos. Doctorando. Vine a las redes para hacer (y exponer) cuentas sobre la vida cotidiana, pero también me gusta enseñar la magia de las cifras.

 

Acerca del autor

Azucena Santillán

Enfermera. "Máster en Gestión y Administración de Enfermería" , "MBA en Dirección y Gestión Integrada de Clínicas, Centros Médicos y Hospitales" y "Máster TIC en Enfermería". Doctoranda.

Enlace permanente a este artículo: http://ebevidencia.com/archivos/3792

Y tus amigos, ¿conocen este blog?... Be nice, tell your friends!

%d bloggers like this: