Ir al contenido principal

Consideraciones sobre las variables explicativas

El desarrollo efectuado a lo largo de este tema para el caso de dos únicos regresores sería ampliable a la situación más general con mayor número de variables independientes, sin que ello supusiera ningún problema conceptual adicional. Nos podemos preguntar cuál será el mayor número de variables explicativas a tener en cuenta.

Evidentemente, los beneficios o las ventas de una empresa vienen influidos por un gran número de factores: precios, costes salariales, nivel de endeudamiento, volumen de recursos propios, etc. Podríamos caer en la tentación de considerar modelos con un montón de variables explicativas, actitud que vendría justificada por el afán de reducir el error, la parte de los beneficios no explicada por el modelo, o equivalentemente, por conseguir coeficientes de determinación tan próximos a 1 como sea posible.

Hay numerosas razones, tanto de naturaleza estadística como económica que desaconsejan esta actitud.

Los modelos tratan de ser simplificaciones de la realidad y, como tales, deben incluir únicamente las variables más relevantes. Además, con frecuencia, gran parte de las variables consideradas están fuertemente correlacionadas, lo que puede dar lugar a errores importantes en la estimación de los coeficientes, problema que recibe el nombre de multicolinealidad.

La consideración de modelos con un elevado número de variables dificulta notablemente la interpretación de los coeficientes, al tiempo que requiere una gran cantidad de observaciones (recuerda que cada parámetro adicional supone la pérdida de un grado de libertad).

En cualquier caso, no debemos caer en el error contrario, de la excesiva simplificación de los modelos, puesto que ello puede acarrear la introducción de sesgos importantes al atribuir a una variable el efecto indirecto debido a otras que hemos omitido. Una forma intuitiva de detectar la ausencia de variables relevantes en la regresión será analizar si los signos de los coeficientes son los adecuados. Supongamos, por ejemplo, que al estimar una función lineal de consumo de gasolina, tomando como variable explicativa el precio, se obtiene una pendiente positiva. Dado lo ilógico de este resultado, cabe sospechar que estamos ignorando alguna variable relevante que actúa sobre la demanda en sentido contrario al precio, como podría ser un aumento del parque móvil.

La determinación del número de variables y la selección de las más adecuadas es un asunto delicado.

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores