3. Gráficas y nubes de puntos

Si te fijas en los pasos que hemos dado hasta este momento, verás que es un proceso muy lógico:

  1. Nos planteamos una pregunta sobre la relación entre dos parámetros.
  2. Tomamos suficientes datos de ambos parámetros sobre la población que nos interesa.
  3. Organizamos estos datos en una tabla simple o de doble entrada.

El siguiente paso será visualizar estos datos en una gráfica, de modo que nos resulte más fácil dar respuesta a nuestra pregunta inicial.

Volvamos a la tabla de doble entrada que vimos en el ejercicio resuelto del apartado anterior, donde comparábamos el número de días mensuales en los que se superaba la concentración máxima de NO2 y de Ozono en el aire:

 

 

El par (0,0) se podría representar como un punto en una gráfica habitual de ejes cartesianos, pero en este caso tenemos que hacer ver de algún modo que la frecuencia de ese par es 7. A continuación verás algunos ejemplos:

a) Histograma tridimensional:

Para representar la información partimos de tres ejes cartesianos.

En los ejes X e Y marcamos los posibles valores de cada variable (en nuestro caso 0, 1, 2 y 3 para X, y 0, 1, 2, 3 y 4 para Y). Cada cuadrado representa un par de valores.

La altura de cada cuadrado será la correspondiente frecuencia de ese par de valores.

Fíjate cómo en nuestro caso el par con mayor frecuencia es el (0,0), que se repite 7 veces, y por tanto es el prisma de mayor altura.

El siguiente sería el (1,4) que tiene frecuencia 5.

 

b) Diagrama de dispersión o de Burbujas:

En este caso partimos de un par de ejes cartesianos X e Y en los que representamos los valores de ambos parámetros.

En lugar de puntos, representamos circunferencias en las que su superficie es proporcional a la frecuencia. Ojo, no son proporcionales los radios sino las superficies.

Los pares de datos que tienen frecuencia 0 no se representan.

 

En el caso en el que tengamos variables continuas, el diagrama de dispersión será diferente, pues en lugar de representar los datos que hemos acumulado en la tabla, haremos una gráfica con todos los pares de datos que tomamos en la fase previa.

Por ejemplo: vamos a representar los valores de Temperatura y Precipitaciones medias mensuales en una determinada estación climatológica que tenías en la autoevaluación del apartado anterior.

 

 

 

c) Diagrama de dispersión o Nube de puntos:

Al igual que el Diagrama de Burbujas, se representa sobre un par de ejes cartesianos.

En este caso, cada punto representa un par de datos de la Variable Estadística Bidimensional.

 

Las Nubes de Puntos también nos ayudan a ver la dependencia entre las variables. Si recuerdas, en el primer apartado vimos que la dependencia podía ser:

  • Dependencia positiva: Al aumentar la variable X, también aumenta la Y.
  • Dependencia negativa: Al aumentar la variable X, disminuye la Y.
  • Sin dependencia: No se observa ninguna relación entre las dos variables.
  • Dependencia funcional: Podemos encontrar una relación exacta entre ambas variables que siempre se cumple. Por ejemplo, si estudias la relación entre el número de cajas de leche y el número de litros que se compra de una marca, tenemos una dependencia funcional, porque cada caja tiene siempre el mismo número de litros.
  • Dependencia aleatoria: No hay una regla exacta que determine la relación entre ambas variables, como en el ejemplo anterior.

Mira las siguientes gráficas, que representan los ejemplos del primer apartado. Verás que es mucho más fácil ver así la dependencia:

Icono IDevice Galería de imágenes
Muestra Imagen Dependencia positiva aleatoria
Dependencia positiva aleatoria
Muestra Imagen Dependencia positiva funcional
Dependencia positiva funcional
Muestra Imagen Sin dependencia
Sin dependencia
Muestra Imagen Dependencia negativa aleatoria
Dependencia negativa aleatoria
Icono de IDevice de pregunta AV - Pregunta de Elección Múltiple

Una compañía química está estudiando el uso de un fertilizante líquido que han inventado en una determinada planta. Para ello miden dos variables: X = "cantidad diaria de fertilizante que se aporta a la planta (en ml)" e Y = "crecimiento de la planta al cabo de 10 días (en cm)".

Los resultados son los siguientes pares de datos:

X
1
2
3
4
5
6
7
8
9
10
Y
2
2.9 3
4
4
4.5 5
4.8 4.9
5.2

Utiliza la gráfica que hay al final del ejercicio para representar estos puntos en los ejes de coordenadas. Para ello, escribe cada par en las columnas X e Y. Ojo, para escribir los números decimales debes utilizar el punto, no la coma.

a) A la vista de la gráfica, ¿crees que existe dependencia funcional?

  
No

b) ¿Cómo clasificarías la dependencia según la nube de puntos?
  
Positiva
Negativa
Sin dependencia

c) La línea verde de la gráfica representa los resultados que se obtienen con el fertilizante de la competencia, ¿con cuál crees que se obtienen mejores resultados?
  
Con el de la compañía
Con el de la competencia