Ejercicios sobre predicción

Tras la teoría, un par de ejercicios. Espero que os sean de utilidad.

Ejercicio 1

Para los empleados de cierta agencia de publicidad se ha estudiado conjuntamente la (X, en decenas de miles de euros) y el que les corresponde en el (Y, en %), obteniéndose la siguiente tabla:

X	1-1,5	1,5-2,5	2,5-4
Y
15	8	1	0
20	2	5	1
25	0	1	7

A partir del modelo lineal que explica el tipo de gravamen en función de la renta anual, tenemos que estimar cuál será el tipo de gravamen a aplicar si la persona tiene una renta de 45000 euros.
Estimar a partir de la función anterior la distribución de la renta disponible después de impuestos (Z).
Comentar la fiabilidad de estos resultados.

Solución

Tenemos que buscar en primer lugar la línea de regresión Y|X. Tras calcular las marcas de clase de la variable X y las distribuciones marginales de las dos variables en estudio, tenemos:

x = 2,1; S²_x = 0,715; y = 19,8; S²_y = 2,097

Resultando el modelo lineal Y = 11,077 + 4,15X. Sustituyendo x = 4,5 en el modelo anterior, obtendremos el tipo de gravamen al empleado con renta 45000 euros: y = 29,75%.

Con los datos disponibles sólo podemos conocer la renta después de impuestos que correspondería a cada intervalo de renta bruta, resumido éste en la marca de clase correspondiente.

Es decir, para cada marca de clase x_i estimamos el valor de Y(y_ti) empleando la función del apartado anterior. Con este resultado podemos estimar el dato correspondiente a la renta después de impuestos z_ti = x_i(1 - y_ti)/100.

x_i	y_ti	z_ti	n_i
1,25	16,26	1,05	10
2	19,38	1,61	7
3,25	24,56	2,45	8

La fiabilidad de los datos anteriores dependerá de la capacidad explicativa del modelo. En este caso, se obtiene un coeficiente de determinación R² = 72,74%, indicando que la fiabilidad de los resultados anteriores es aceptable, pero no demasiado alta.

Ejercicio 2

Para llevar a cabo un estudio sobre la incidencia de la publicidad en el valor de las , se han tomado datos de 100 empresas sobre sus ventas (X, en cientos de miles de euros), y sobre la (Y, en cientos de miles de euros), obteniéndose los siguientes resultados:

Σx_i = 2500; Σx²_i = 75000; Σy_i = 100; Σy²_i = 200; Σx_iy_i = 3500

Suponiendo un modelo lineal, ¿cuál será el valor esperado de las ventas para una empresa que gasta en publicidad dos millones de euros?
Determinar la fiabilidad del resultado anterior proporcionando un margen de error para dicha predicción.

Solución

El primer paso es determinar la recta que explica las ventas en función de la inversión en publicidad. Puesto que Y es la variable explicativa, habrá que obtener la recta de regresión de X sobre Y.

x = 2500/100 = 25; y = 100/100 = 1; S²_y = 2 - 1 = 1; S_xy = 3500/100 - 25·1 = 10

El modelo lineal quedará: X = 15 + 10Y, y por tanto, para un valor de 20 se tiene un xi = 215. Así pues, las ventas esperadas son de 21,5 millones de euros.

R² = 0,8. Éste es un resultado próximo a 1 pero no tanto como sería deseable para afirmar que estamos ante una previsión muy fiable.

Para proporcionar un margen de error para esta predicción emplearemos la varianza residual S²_e = (1 - R²)S²_y = 0,2 y en particular, S_e = 0,45.

Estadística y combinatoria al alcance de todos

Buscar este blog