Ir al contenido principal

Ejercicios de regresión y correlación lineal

 Más ejercicios para entender mejor lo explicado.

Problema 1

Los pesos y longitudes de una muestra de 10 truchas de piscifactoría son las siguientes:

Tabla ejercicio regresión y correlación lineal




Tenemos que hallar el coeficiente de correlación, utilizando el cambio de variable adecuado.

En la variable x = peso haremos el cambio x' = 100x - 54, y en la variable y = longitud el cambio será y' = y/10 - 10.

Construimos la tabla de valores:



Tabla ejercicio 1

  • Media de x': 56/10 = 5,6
  • Media de y': 31/10 = 3,1
  • Varianza de x': 394/10 - (5,6)² = 8,04
  • Varianza de y' : 133/10 - (3,1)² = 3,69
  • Covarianza: 225/10 - (5,6)·(3,1) = 5,14
Recuerda que el coeficiente de correlación no varía cuando hacemos un cambio de variable. Por lo tanto:

rxy = rx'y' = 5,14/(√8,04·√3,69) = 0,94 (aprox.)

Problema 2

Los fabricantes de cierto refresco han estudiado la temperatura media de 10 semanas del año, tomadas al azar y la cantidad de refresco pedido durante cada uno de esos periodos. Los datos obtenidos, están recogidos en la siguiente tabla:


Tenemos que:
  1. Calcular el coeficiente de correlación.
  2. Determinar la recta de regresión.
  3. Estimar los litros pedidos en una semana en la que la temperatura media sea de 35º.

Tabla ejercicio 2

1.

  • x = 183/10 = 18,3
  • y = 405/10 = 40,5
  • 𝝈x = √(4157/10 - 18,3²) = 8,98
  • 𝝈y = √(22687/10 - 40,5²) = 25,06
  • 𝝈xy = 9612/10 - 18,3·40,5 = 220,05
Por lo tanto, el coeficiente de correlación es:

rxy = 220,05/(8,98·25,06) = 0.98 (aprox)

2.

La recta de regresión tiene por ecuación y - y = (𝝈xy/𝝈2x)(x - x)


En este caso será:

y - 40,5 = (220,05/(8,98)²)·(x - 18.3) → y - 40,5 = 2,73(x - 18,3)

3.

Si la temperatura media es de 35º, la estimación que podemos hacer es:

y - 40,5 = 2,73·(35 - 18,3) → 86 millones de litros (aprox.)










Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130 ...

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín...

Diagrama de líneas

Se realiza en un sistema de ejes cartesianos. En uno de los ejes (abscisas) se marcan los datos y en otro (ordenadas) la frecuencia de cada dato. No es necesario que los dos ejes tengan la misma graduación. Se señalan los puntos correspondientes (dato-frecuencia) y éstos se unen con líneas rectas. Estos gráficos se utilizan principalmente para hacer representaciones de series temporales de frecuencia cuyos datos no estén agrupados en intervalos. Ejemplo Representar la serie que refleja el número de salidas al extranjero, en un año, de 730 ejecutivos de una empresa mediante un diagrama de líneas, para: la frecuencia absoluta, la frecuencia relativa. Número de Salidas Número de Ejecutivos (fre.absoluta) Frecuencia Relativa 0 80 0,11 1 100 0,14 2 220 0,30 3 150 0,21 4 60 0,08 5 80 0,11 6 40 0,05 ...