Ir al contenido principal

La distribución normal

En estadística descriptiva, al representar una variable estadística continua mediante un histograma, la línea quebrada que representa al polígono de frecuencias se aproxima cada vez más a una curva, a medida que los intervalos se hacen más pequeños. Al aumentar el tamaño de la muestra indefinidamente, de modo que la población pueda considerarse infinita, la curva o función de probabilidad adquiere, para muchas variables (estatura, peso, cociente de inteligencia...) una forma característica de campana, llamada campana de Gauss o curva normal.

Fue Gauss quien en el siglo XVIII estudió este tipo de curvas, obteniendo su ecuación matemática.

La denominación de curva normal se debe a que durante mucho tiempo se pensó que todas las distribuciones de frecuencias continuas, para muestras suficientemente grandes, tenían esa forma. Hoy se sabe que eso no es cierto. Hay muchas variables, como las mencionadas anteriormente, que se ajustan a este modelo de distribución, pero otras no.

Variable aleatoria normal

Se dice que una variable aleatoria continua X, que toma valores en el intervalo (-∞, +∞), sigue una distribución normal cuando su función de densidad es:

f(x) = (1/(σ·√2π))e-(1/2)((x - μ)/σ)2

donde μ es la media y σ la desviación típica.

Una variable que sigue una distribución normal de media  μ y desviación típica σ se representa por N(μ,σ); μ,σ son los parámetros de la distribución.

Función de distribución

Dada una variable aleatoria X que sigue una distribución normal, N(μ,σ), su función de distribución se define como:

F(x) = P(X ≤ x) = ∫x-∞f(x)dx =(1/(σ·√2π))∫x-∞e-(1/2)((x - μ)/σ)2

integral que da el área bajo la curva desde -∞ hasta x.

En la distribución normal, el cálculo de probabilidades se traduce en un cálculo bastante complejo de integrales del tipo dado, donde los límites de integración hay que determinarlos en cada caso concreto.

Debido, por un lado, a la frecuente aparición de esta distribución, y por otro, a la complejidad que encierra su cálculo, los resultados de estas probabilidades se encuentran tabulados, de modo que su obtención es sencilla. Pero, como es evidente, no ha sido posible elaborar una tabla para cada par de números (μ,σ), que determinan una distribución normal.

Existe la tabla para el caso μ = 0, σ = 1; es decir, para la normal N(0, 1), llamada normal tipificada. Los demás casos se pueden reducir a éste mediante el proceso de tipificación de la variable.

Tipìficación 

El proceso de tipificación consiste en transformar una variable X que sigue una distribución normal N(μ,σ), en otra que se distribuye según la normal N(0, 1).

Esto se consigue haciendo el cambio de variable:

z = (x - μ)/σ, de donde x = μ + σz

La nueva variable z sigue una distribución N(0, 1).

La función de densidad de una variable N(0,1) es:

f(x) = 1/(√2π)e-(1/2)(x)2

La tabla de la normal N(0, 1)

Es una tabla de doble entrada; en la columna de la izquierda se encuentran los valores de la variable Z comprendidos entre 0 y 3,9, con un cifra decimal. A continuación, hay 10 columnas, numeradas del 0 al 9, que corresponden con la segunda cifra decimal de Z.

Una vez localizado el valor de Z con dos decimales, el número que le corresponde en la tabla representa el área limitada por la función de densidad, el eje X y la recta cuya abscisa es el valor de Z. Es decir, corresponde a P(Z ≤ z) = F(z).

También se utiliza para el problema inverso, es decir, determinar a qué valor de la variable le corresponde una determinada área.

También se pueden calcular probabilidades para una variable N(μ,σ), haciendo el cambio z = (x - μ)/σ.

Os podéis descarga la tabla N(0, 1) en este enlace.

En este archivo, encontraréis tablas para diversas distribuciones, que serán explicadas en su momento.

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores