Cómo muestran los histogramas los datos estadísticos

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. Cómo muestran los histogramas los datos estadísticos

Libro Relacionado

Por Deborah J. Rumsey

Un histograma es un gráfico especial que se aplica a los datos estadísticos desglosados en grupos ordenados numéricamente; por ejemplo, grupos de edad como 10-20, 21-30, 31-40, etc. Un histograma proporciona una instantánea de todos los datos, lo que lo convierte en una forma rápida de obtener la imagen completa de los datos, en particular, su forma general.

En un histograma, las barras se conectan entre sí – a diferencia de un gráfico de barras para datos categóricos, donde las barras representan categorías que no tienen un orden particular y están separadas. La altura de cada barra de un histograma representa el número de individuos (llamado la frecuencia) en cada grupo o el porcentaje de individuos (la frecuencia relativa) en cada grupo. Cada individuo del conjunto de datos se divide en una sola barra.

Puede hacer un histograma a partir de cualquier conjunto de datos numéricos; sin embargo, no puede determinar los valores reales del conjunto de datos a partir de un histograma porque todo lo que sabe es en qué grupo se encuentra cada valor de datos.

Aquí hay un ejemplo: Los Premios de la Academia comenzaron en 1928, y una de las categorías más populares es Mejor Actriz en una Película. La tabla muestra los ganadores de los primeros ocho Oscar a la Mejor Actriz, los años que ganaron (1928-1935), sus edades al momento de ganar sus premios y las películas en las que estuvieron. En la tabla se puede ver el rango de edades de 22 a 62 años, mucho más amplio de lo que se podría haber imaginado.

Edades de los ganadores del Oscar a la mejor actriz 1928-1935
YearWinnerAgeAgeMovie1928Laura Gainor22Sunrise1929Mary Pickford37Coquette1930Norma Shearer30TheDivorcee1931Marie Dressler62Min and Bill1932Helen Hayes32The Sin of Madelon ClaudetT1933Katharine Hepburn26Morning Glory1934Collette Colbert31It Happened One Night1935Bette Davis2727DangerousPara

averiguar más sobre

ampliar el conjunto de datos al período 1928-2009. La variable de edad para este conjunto de datos es numérica, por lo que puede graficarla usando un histograma. Desde allí puedes responder a preguntas como: ¿Cómo son las edades de estas actrices? ¿Son en su mayoría jóvenes, viejos, en el medio? ¿Están todas sus edades distribuidas o son similares? ¿La mayoría de ellos se encuentran en un cierto rango de edad, con algunos valores atípicos (actrices muy jóvenes o muy viejas, comparadas con las otras)? Para investigar estas cuestiones, aquí se muestra un histograma de las edades de las actrices del premio Best Award:

Histograma de las edades de los ganadores de los Premios de la Academia a la Mejor Actriz, 1928-2009

Observe que los grupos de edad se muestran en el eje horizontal (x)

.

Se dividen en grupos de 5 años cada uno: 20–25, 25–30, 30–35, . . . 80–85. El porcentaje (frecuencia relativa) de actrices en cada grupo de edad aparece en el eje vertical (y). Por ejemplo, alrededor del 27 por ciento de las actrices tenían entre 30 y 35 años de edad cuando ganaron sus Oscars.

¿Qué pasa si un ganador tiene 30 años? ¿Pertenece al 25-30 o al 30-35? Siempre y cuando sea consistente con todos los puntos de datos, puede poner todos los puntos límite en sus respectivas barras inferiores o ponerlos todos en sus respectivas barras superiores. Lo importante es elegir una dirección y ser consistente. Es una práctica común hacer que los intervalos de barras sean a la izquierda inclusive (es decir, las barras incluyen el punto final izquierdo pero no el derecho).

Leave a Reply