2. Actuemos con normalidad
3. Imagen de Mari & Nacho bajo licencia Creative Commons |
Del mismo modo que entre las variables discretas hemos introducido el modelo binomial, entre las variables continuas vamos a introducir un modelo al que se ajusta un gran número de variables de nuestro entorno. Este modelo se va a llamar distribución normal, y su nombre se debe ni más ni menos a que la gran mayoría de variables que se refieren a aspectos físicos, psicológicos, sociológicos, biológicos, etc. se ajustan a este modelo, o sea, que lo normal, es que sea una variable normal.
Cuando comenzaron los estudios estadísticos modernos, se encontró que la proporción de variables continuas que seguían esta distribución era tan elevada, que se llegó a pensar que todas estas variables la seguían.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
- caracteres morfológicos de individuos (no sólo personas, sino también animales o plantas) como la estatura, el peso, perímetros, etc.
- caracteres fisiológicos como el efecto de una dosis de un fármaco o el producido por un abono en un cultivo.
- caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos.
- caracteres psicológicos como el cociente intelectual o nivel de adaptación a un medio.
- nivel de ruido en telecomunicaciones.
- errores cometidos al medir ciertas magnitudes.
- etc.
Y en general, cualquier característica que se obtenga como suma de muchos factores independientes se ajustará a un modelo normal.
La distribución Normal se expresa por N(μ , σ), donde el primer parámetro μ, representa la media de la variable aleatoria y σ la desviación típica.
Antes de continuar, vamos a dar una pequeña pincelada histórica sobre el descubrimiento y evolución de esta importantísima distribución de probabilidad.
|
4. Abraham De Moivre. Imagen en Wikimedia Commons bajo licencia Creative Commons |
La distribución normal fue presentada por primera vez por Abraham De Moivre en un artículo del año 1733, que fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado por Laplace en 1812, y en la actualidad el resultado obtenido se llama Teorema de De Moivre-Laplace, teorema que veremos en el último punto del tema.
Laplace usó la distribución normal en el análisis de errores de experimentos. Gauss, que afirmaba haber usado el método desde 1794, lo justificó rigurosamente en 1809 asumiendo una distribución normal de los errores. El nombre de Gauss se ha asociado a esta distribución porque la usó con profusión cuando analizaba datos astronómicos, llegando a dar la expresión de la función de densidad de estas variables.
Esta distribución también se conoce como "distribución de Gauss" o "campana de Gauss", ¿pillas ahora el jeroglífico del principio del tema?, y en el siguiente apartado verás el porqué. El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie campana) por primera vez en 1872 para una distribución normal.
Algunos autores le atribuyen a Gauss un descubrimiento de esta distribución independiente del de De Moivre. Esta atribución del nombre de la distribución a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler.
El nombre de "distribución normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.
Galton llegó a decir de esta distribución, "Si los griegos la hubieran conocido la habrían adorado como a un Dios"