1.2 Para muchos datos, mejor la tabla.
Ya sabes calcular los parámetros centrales de un conjunto de datos. Pero, ¿te servirá lo aprendido en todos los casos? Si quieres saber cuál es el gasto mensual medio que tienes de leche en tu casa no hay mucha dificultad. Basta hallar la media de los litros de leche que habéis consumido durante los doce meses de un año. Pero si fueses el director de una empresa con miles de empleados en toda España y quisieras saber cuál es la edad media de tus empleados, la cosa ya se complica.
Si recuerdas el ejemplo de los sueldos de apartado anterior, había tres empleados que cobraban 950 euros. A la hora de hallar la media podíamos sumar tres veces ese valor o calcular 950·3. En el caso de tres no parece muy interesante, pero si se repitiera el mismo sueldo 231 veces la cosa ya varía, no costaría igual tener que sumar 231 veces una misma cantidad en lugar de multiplicarla por 231. Por eso cuando tenemos muchos datos, los cálculos de los parámetros se realizan a través de la tabla de frecuencia.
El cálculo de los parámetros de centralización a través de las tablas de frecuencia se realiza de la siguiente forma:
MODA: basta fijarse en qué valor de la variable tiene mayor frecuencia absoluta. Recuerda que puede haber dos o más valores cuyas frecuencias sean el máximo valor, en ese caso todos ellos son la moda.
Mediana: como los valores están ordenados en la tabla de frecuencias, el procedimiento consiste en calcular la frecuencia absoluta acumulada. Se divide el número total de datos recogidos (N) entre dos y el primer valor cuya frecuencia absoluta acumulada supera a esa cantidad, es el valor mediano. Esto es debido a que si escribiésemos todos los valores ordenados unos detrás de otros, la frecuencia acumulada nos indica hasta qué lugares llegan cada uno de los distintos valores.
Si la mitad de N coincide exactamente con el valor de la frecuencia acumulada de un valor estaríamos como en el caso del apartado anterior cuando teníamos un número par de valores. En ese caso la mediana es la semisuma de ese valor y el siguiente.
MEDIA: para hallar la media, en lugar de sumar cada valor todas las veces que aparezca, multiplicamos el valor de la variable por la cantidad de veces que aparece (frecuencia absoluta) y la suma de todos esos valores la dividimos entre el número total de valores recogidos. Se aplicaría la fórmula siguiente:
nº detelevisores | nº de hogares |
0 | 6 |
1 | 30 |
2 | 28 |
3 | 21 |
4 | 9 |
5 | 6 |
Ante la inminente entrada en vigor de la televisión mediante TDT, han encargado a Mercedes hacer un estudio actualizado sobre el número de televisores que tiene cada familia en un determinado barrio de la ciudad. Después de recoger y agrupar los datos, Mercedes ha obtenido la siguiente tabla de valores:
Para hallar la media únicamente hay que tener en cuenta que se toma como valor xi de la variable el de la marca de clase.
Una empresa envasadora de espárragos blancos quiere estudiar la posibilidad de lanzar al mercado envases de dos tamaños. Uno para productos más grandes, lógicamente de mayor precio, y otro para los elementos más pequeños. Para ello hace un estudio aleatorio del tamaño de espárragos que va envasando obteniendo los siguientes resultados:
Medida en cm. intervalos |
Nº de espárragos fi |
[7,9) | 25 |
[9,11) | 172 |
[11,13) | 311 |
[13,15) | 413 |
[15,17] | 79 |
Completa la tabla con la frecuencia acumulada, la marca de clase y los valores xi·fi. Después calcula los parámetros de centralización y contesta a las siguientes preguntas.
a) El intervalo modal es [
, ).
b) El intervalo mediano es [
, ).
c) La media, redondeada a dos decimales vale