1.1.¡ Errare humanum est!

Dibujo de un hombre sobre un cartel con el mensaje, error 404
Imagen de CyboRoZ bajo licencia Creative Commons

Pues sí, errare humanum est. Equivocarse es condición propia de los humanos, y con los contrastes de hipótesis no va a ser menos.

Ten en cuenta que estamos tomando una decisión según los indicios que hemos obtenido de la muestra. Si la muestra no la hemos elegido bien, es posible que nos equivoquemos. Si las preguntas que le hacemos a los encuestados no las hemos formulado bien o no hemos ofrecido posibilidades claras de respuesta, es posible que nos equivoquemos, si fallamos en los cálculos, es posible que nos equivoquemos. Si... Pero incluso si todo lo hemos hecho bien, si todo el procedimiento es correcto, es posible que tomemos la decisión errónea.

¿Cuándo nos equivocamos al hacer un contraste de hipótesis? Pues fácil, cuando aceptamos la hipótesis nula siendo ésta falsa o cuando la rechazamos siendo cierta.

¿Podría arreglarse esto? Fíjate que mediante nuestros cálculos llegamos a dividir en dos partes los posibles valores de un parámetro que calculamos en la muestra, la región de aceptación y la región de rechazo o región crítica. Si aumentamos la región de aceptación, disminuimos el riesgo de rechazar H0 siendo cierta, pero claro, al entrar más valores en dicha región de aceptación, es más posible que acabemos aceptando H0 aún siendo falsa. O sea, que si intentamos disminuir un tipo de error, aumentamos el otro.

Igual ocurriría al revés, si queremos minimizar el riesgo de equivocarnos al aceptar H0 siendo falsa, aumentaría la región crítica, pero claro, al hacer esto, aumento también las posibilidades de rechazar H0 siendo cierta. Luego una cierta probabilidad de error va a haber siempre.

Observa la siguiente tabla:

     REALIDAD
     H0 es cierta
 H0 es falsa

DECISIÓN QUE SE TOMA 

 Acepto H0
 OK  Error Tipo II
Rechazo H0
 Error Tipo I  OK

 

A estos errores, como ves, se les pone nombre. Así el Error de Tipo I es el error que se comete al rechazar H0 siendo cierta, mientras que el Error de Tipo II es el de aceptar H0 cuando es falsa. ¿Cuál de los dos errores se puede considerar más grave? Pues quizás el primero, el de Tipo I, ya que puede ser peor rechazar cuando es verdad. Bien, pues la probabilidad de que se cometa este Error de Tipo I, se representa con la letra griega "α" y se llama nivel de significación. Este valor, al igual que el nivel de confianza en los intervalos de confianza (1 - α) se fija de antemano, normalmente, con valores pequeños 0,1 ó 0,05, y fijado éste, se intenta minimizar la probabilidad de Error de Tipo II. 

Así, cuando diseñamos un contraste de hipótesis, una de las cuestiones que hay que definir es el nivel de significación, es decir, que riesgo estamos dispuesto a asumir de rechazar la hipótesis nula cuando es cierta. Podrías pensar que por qué no hacer cero ese riesgo, o casi casi cero. El problema, como casi siempre está en los costos, pues mientras menor queramos que sea el nivel de significación, será necesario un tamaño de muestra más grande y eso implica más entrevistas o más tiempo o más dinero si cada prueba requiere la destrucción del individuo (piensa que por ejemplo, comprobar la resistencia de un vidrio seguramente implica la destrucción del mismo.) En el apartado 2.1, te mostramos un vídeo donde explicamos esto un poco más.

Para terminar con la preparación del contraste de hipótesis, nos queda ver qué valor es ese que se calcula y nos permite decidir. Ya en el apartado anterior hemos adelantado que tendrá que ver con el parámetro sobre el que se está haciendo la hipótesis, pero no es exactamente así. Ese valor, más que un valor es una variable aleatoria, pues depende de la muestra que hayamos elegido, se llama estadístico del contraste y la distribución en el muestreo de éste tiene que ser conocida.

En la práctica vamos a usar prácticamente los mismos que hemos usado en los intervalos de confianza y cuyas distribuciones de probabilidad vimos en el tema 4 de la unidad anterior.

Icono IDevice Importante
Camino que se bifurca
Imagen de Ronaldo Maciel bajo licencia Creative Commons

Para resolver un problema por un contraste de hipótesis, hay que seguir los siguientes pasos:

1. Formular de forma clara y concisa la hipótesis nula H0 y la hipótesis alternativa H1.

2. Fijar el nivel de significación α, llamada también probabilidad de Error tipo I. Nos interesa que el error a cometer sea pequeño, por lo que α será de un valor próximo a 0 (0,05; 0,025;...etc)

3. Elegir el estadístico del contraste. Este estadístico tiene que tener una distribución en el muestreo conocida y depender del parámetro que estamos estudiando en el contraste de hipótesis.

4. Hallar las regiones de aceptación y de rechazo. Para ello, debes observar primero si el contraste es unilateral o bilateral.

5. Tomar una muestra en la población y calcular en ella el valor muestral del estadístico del contraste.

6. Observar si el valor calculado en el apartado 5 cae dentro de la región de aceptación o de la región crítica, y decidir por tanto,  si se rechaza la hipótesis nula o se acepta.


Icono IDevice Curiosidad

 


Roland Fisher. Imagen en Wikimedia Commons bajo licencia Creative Commons 

Dentro de la inferencia estadística, un contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es un procedimiento para juzgar si una propiedad que se supone cumple una población estadística es compatible con lo observado en una muestra de dicha población. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.

Fisher está considerado como el padre de la Estadística moderna pues fue pionero en la aplicación de métodos estadísticos al diseño de experimentos científicos, desarrollando técnicas que permitían obtener mayor cantidad de información útil a partir de muestras de datos más pequeñas, introduciendo el principio de aleatoriedad en la recogida de muestras

Trasladó sus investigaciones al campo de la genética en The Genetical Theory of Natural Selection (1930), donde resume sus puntos de vista sobre la eugenesia y el papel de control que ejercen los genes sobre los caracteres dominantes, y en el que considera la selección como la fuerza directriz de la evolución, más que la mutación.

Los contrastes de hipótesis, como la inferencia estadística en general, son herramientas de amplio uso en la ciencia en general. En particular, la moderna Filosofía de la ciencia desarrolla el concepto de falsabilidad de las teorías científicas basándose en los conceptos de la inferencia estadística en general y de los contrastes de hipótesis. En este contexto, cuando se desea optar entre dos posibles teorías científicas para un mismo fenómeno (dos hipótesis) se debe realizar un contraste estadístico a partir de los datos disponibles sobre el fenómeno que permitan optar por una u otra.

Las técnicas de contraste de hipótesis son también de amplia aplicación en muchos otros casos, como ensayos clínicos de nuevos medicamentos, control de calidad, encuestas, etcétera .

 


Icono de iDevice AV - Reflexión
En la siguiente escena de Jclic puedes practicar con lo que hemos visto.
          This browser does not have a Java Plug-in.    
          Get the latest Java Plug-in here.      

Icono IDevice Para saber más

En la presentación que se enlaza, aparece resumida de forma clara lo que es un contraste de hipótesis. Hay algunos conceptos que se escapan un poco de lo que hemos visto en estos apartados y de lo que vamos a ver en los temas de esta unidad, y es que ten en cuenta que, esta presentación está dirigida para alumnos de la asignatura de Bioestadística de la facultad de Málaga. Así que si quieres saber más, échale un vistazo que está muy bien.