Ir al contenido principal

Cálculo del coeficiente de correlación

Un ejemplo para comprender mejor lo explicado en esta entrada.

Ejercicio

En esta distribución bidimensional están reflejados las tallas (en cm) y los pesos (en kg) correspondientes a siete personas:

Talla (xi)
170
172
160
168
176
165
169
Peso (yi)
65
70
50
62
72
55
55

Considerando la talla como variable independiente, X:
  1. Calcular la recta de regresión de Y sobre X.
  2. Calcular el coeficiente de correlación de Pearson.
  3. Estimar el peso de unas personas de 163 cm.

Resolución

1) Se elabora primeramente la siguiente tabla:

xi
yi
xi·yi
xi2
yi2
170
65
11050
28900
4225
172
70
12040
29584
4900
160
50
8000
25600
2500
168
62
10416
28224
3844
176
72
12672
30976
5184
165
55
9075
27225
3025
169
55
9295
28561
3025
1180
429
72548
199070
26703

Realizamos los cálculos oportunos:

  • x = 1180/7 = 168.57; y = 429/7 = 61,29
  • σ2x = Σx2i - x2 = 22,727
  • σ2y = Σy2i - y2 = 58,25
  • σxy = Σ(xi·yi)/N - x · y = (72548/7) - 168,57·61,29 = 32,345
  • σxy2x = 32,345/22,727 = 1,423
  • σxy2y = 32,345/58,25 = 0,555
Por lo tanto, la recta de regresión es:

y = (σxy2x)·(x - x) + = 1,423·(x - 168.57) + 61,29

Operando, tenemos:

y = 1,423x - 178,585

2) Coeficiente de correlación de Pearson:

r = σxy/(σx·σy) = 32,345/(√22,727·√58,25) = 0,889

Al ser r positivo, la correlación es positiva, es decir, al aumentar la talla, aumenta el peso y al disminuir la talla, disminuye el peso.

Por ser r próximo a uno, la nube de puntos se ajusta muy bien a la recta de regresión.

3)
y = 1,423x - 178,585

Para x = 163, y = 1,423·163 - 178,585 = 53,364

El recorrido de x es de 160 a 176. Luego, por interpolación, se estima que una persona de 163 cm pesará 53,364 kg.

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores