Ir al contenido principal

Ejercicios sobre regresión múltiple

Ejercicio 1

Disponemos de los siguientes datos para 6 familias sobre gasto en libros, número de miembros y renta.

Gasto anual Número de
Miembros
Renta anual
(miles de euros)
20 1 1
30 2 2
45 3 3
35 2 2,5
30 2 1,8
40 2 3,2
  1. Obtener los parámetros de la función lineal que explica el gasto familiar en libros a partir del número de miembros y la renta.
  2. Estudiar la bondad del modelo anterior.
Solución
1.
Las ecuaciones normales del plano de regresión son:
  1. b0N + b1ΣXi1 + b2ΣXi2 = ΣYi
  2. b0ΣX2i1 + b2ΣXi1Xi2 = ΣYiXi1
  3. b0ΣXi2 + b1ΣXi1Xi2 + b2ΣX2i2 = ΣYiXi2
En este caso tenemos:

Y
X1
X2
X21
X1X2
YX1
X22
YX2
20 1 1
1
1
20
1
20
30 2 2
4
4
60
4
60
45 3 3
9
9
135
9
135
35 2 2,5
4
5
70
6,25
87,5
30 2 1,8
4
3,6
60
3,24
54
40 2 3,2
4
6,4
80
10,24
128

Y tenemos:

ΣY = 200; ΣX1 = 12; ΣX2 = 13,5; ΣX21 = 26; ΣX1X2 = 29; ΣYX1 = 425; ΣX22 = 33,73; ΣYX2 = 484,5

Por lo tanto:
  1. b06 + b112 + b213,5 = 200
  2. b012 + b126 + b229 = 425
  3. b013,5 + b129 + b233,73 = 484,5
El plano de regresión que explica el gasto familiar en libros a partir del número de miembros y renta es:

Y = 6,58 + 5,49X1 + 7.01X2


2.

Estudiaremos la bondad del modelo mediante el coeficiente de determinación múltiple: R2 = S2Yt/S2Y.

Se tiene: S2Y = 63,89; S2Yt = Σ(yit - y)2fi = 63,18

Luego, R2 = 0,989. El 98,9% de la varianza del gasto en libros viene explicada por el número de miembros y por la renta.


Ejercicio 2

El plano de regresión que explica el sueldo anual (en miles de euros) a partir del expediente académico (X1) y de la edad (X2) de un grupo de amigos resulta ser: Y = -4,29 + 0,29X1 + 0,24X2. Además, disponemos de la siguiente información: R2YX1X2 = 0,95; R2YX1 = 0,69; R2YX2 = 0,79.
  1. ¿Qué variación cabe esperar en el sueldo ante un aumento de un punto en el expediente
  2. Calcular e interpretar los coeficientes de determinación parcial.
1.

El cambio experimentado por el sueldo (Y) ante un aumento unitario del expediente (X1), viene dado por ∂Y/∂X1 que es 0,29; es decir, cuando el expediente académico aumenta un punto, el sueldo experimenta un aumenta de 290 euros.
2.
El coeficiente de determinación parcial entre el sueldo y la edad, una vez eliminada la influencia del expediente es:

R2(Y,X2/X1) = (R2YX1X2 - R2YX1)/(1 - R2YX1) = (0,95 - 0,69)/(1 - 0,69) = 0,84.

Luego, el 84% de la variación residual del modelo de regresión simple del sueldo sobre el expediente es explicada por la inclusión de la variable edad.

El coeficiente de determinación parcial entre el sueldo y el expediente, una vez eliminada la influencia de la edad es:

R2(Y,X1/X2) = (R2YX1X2 - R2YX2)/(1 - R2YX2) = (0,95 - 0,79)/(1 - 0,79) = 0,76

Luego, el 76% de variación residual del modelo de regresión simple del sueldo sobre la edad es explicada por la inclusión de la variable expediente.

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores