2.1 Todos pendientes de la media.
Se llaman parámetros de dispersión a una serie de valores que indican lo concentrados o separados que están los datos entre sí y respecto a la media.
Se llama RECORRIDO a la diferencia entre el valor más pequeño y el más grande que se ha recogido. Nos da una primera idea de si los datos están agrupados o están muy separados, al menos los valores menores y mayores.
Para saber lo separado que están los valores de la media, bastaría restarle a cada valor la media y sumar esas diferencias. El problema es que si lo hacemos, el resultado obtenido es cero. Eso es debido a que, al ser la media el centro, las diferencias por arriba y por abajo se complementan y se anulan. Por eso necesitamos utilizar el valor absoluto.
Se define el parámetro DESVIACIÓN MEDIA como la suma de las diferencias entre los valores y la media, en valor absoluto, dividido por el número total de valores. Si los datos son aislados la desviación media vendría dada por la expresión:
En caso de tablas de frecuencias, la única diferencia es que hay que multiplicar cada diferencia por la cantidad de veces que aparece, es decir, su frecuencia.
Para practicar.
Para que realices algún ejercicio sobre recorrido y desviación media utiliza el siguiente enlace a los materiales EDAD de matemáticas realizados por el ISFTIC. Tienes la tabla de datos ya preparada y sólo debes calcular esos valores. Ejercítate varias veces.
|
Para ajustar mejor las diferencias con la media, es corriente elevarlas al cuadrado y de esa forma tenemos un nuevo parámetro. Se define la VARIANZA como la media aritmética de los cuadrados de las diferencias entre los valores de la variable y la media estadística. Suele representarse por s2.
Y para aquellos valores que están agrupados en una tabla de frecuencias basta multiplicar cada diferencia al cuadrado por su frecuencia.
Si en la segunda expresión descomponemos en tres sumandos y tenemos en cuenta cuanto vale la media, podemos reducir la expresión.
Ahora tranquilízate y fíjate en la expresión final. Nosotros sólo tendremos que calcular la suma de los valores , para lo que añadiremos una columna nueva, y después de dividirlo entre el número de valores restarle el cuadrado de la media.
Vamos a retomar el ejercicio de los televisores que resolvimos en el apartado 1.2. Teníamos la tabla siguiente:
nº de televisores (xi) | 0 |
1 |
2 |
3 |
4 |
5 |
nº de hogares (fi) |
6 |
30 |
28 |
21 |
9 |
6 |
En el punto 2 hablamos de una posible encuesta a 15 personas sobre el número de veces que se conectaban a Internet y pusimos tres ejemplos, mediante un diagrama, en los que la media era igual a 3. Calcula ahora las desviaciones típicas de los tres casos.
Se define el COEFICIENTE DE VARIACIÓN como el cociente entre la desviación típica y la media.
Este parámetro tiene la ventaja de que es un número neutro, es decir, no está referido a ninguna medida. Por ello nos permite comparar datos correspondientes a elementos distintos.