Ir al contenido principal

Introducción a la regresión y correlación múltiple

Tanto en economía como en las ciencias sociales en general nos encontramos con qué difícilmente puede aislarse el comportamiento de dos variables del resto, puesto que todo tiene a depender (en mayor o menor grado) de todo.

Esta consideración nos lleva a efectuar un planteamiento general de las técnicas de regresión y correlación que permita tratar situaciones en las que haya más de dos variables implicadas. Así, por ejemplo, el consumo no sólo dependerá de la renta sino también de los precios y los gustos; las ventas de una empresa estarán relacionadas no sólo con la inversión en ventas sino también con la política de precios. De hecho, parte del error en que podríamos incurrir al hacer estimaciones de las ventas a partir de exclusivamente el gasto en I + D + i se deba a la omisión de la incorporación de estas nuevas variables en el proceso de modelización. Por ello, su incorporación al modelo deberá suponer una mejora sustancial en el nivel de explicación del comportamiento del nivel de ventas.

Ahora, podemos imaginar que tras la propuesta de un grupo de amigos, reflexionamos sobre la posibilidad de entrar como socios en una empresa constructora.

Para estudiar el proyecto, decidimos idear alguna función capaz de explicar la marcha de los beneficios del sector de la construcción.

Parece lógico pensar que los beneficios de las empresas (B) dependen de los activos totales de la empresa (A), pero también parece lógico que dependan del número de empleados (P) entre otras causas. Si dispusiéramos de información sobre estas variables para un conjunto de empresas del sector, podríamos realizar algunas estimaciones que nos ayudasen en nuestro proyecto. Sin embargo, como disponemos de más de una variable causa, la regresión simple vista en entradas anteriores no nos sirve para resolver el problema.

Tenemos planteado un problema de regresión múltiple en el que se tratará de determinar la función f que mejor explique la evolución de los beneficios una vez conocidos los valores de las variables causales:

B = f(A, P)

El procedimiento a seguir en la resolución de este tipo de problemas es una extensión del empleado en la regresión simple, en el que surgen nuevos conceptos y problemas específicos, derivados fundamentalmente de la existencia de correlación entre las variables explicativas. Este último punto dará lugar a la introducción de diferentes indicadores de correlación dependiendo de las variables consideradas

Los métodos de regresión y correlación lineal múltiple fueros desarrollados por G.Udny Yule (1871 - 1951).

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores