Ir al contenido principal

Regresión

La regresión es el estudio de los métodos de ajuste, de una curva conocida a una nube de puntos.

La regresión trata de determinar la expresión matemática de la línea que más se aproxima, o que mejor se ajusta, a la nube de puntos. Trata, por tanto, de averiguar cuál es la función que refleja del modo más exacto la relación entre ambas variables.

Regresión lineal

La regresión lineal estudia los distintos métodos, o técnicas, de ajustar una recta a una nube de puntos. Una de las finalidades de este ajuste es poder predecir los valores de una variable a partir de los de otra.

Cálculo de la recta de regresión Y sobre X

Dada una nube de puntos, la recta de regresión que mejor se ajusta a ella tendrá una ecuación de la forma

y = ax + b

Para obtener los valores de a y b, se impondrán dos condiciones:
  • La recta de regresión ha de pasar por el punto P = (x, y), llamado centro de gravedad de la nube de puntos. Esta condición implica que:

y - y = a(x - x)

ecuación de la recta que pasa por el punto (x, y) y cuya pendiente es a.

Por lo tanto:

y = a(x - x) + y 


Sólo queda por determinar el valor de la pendiente de la recta, a.

  • A cada punto Pi, de coordenadas (xi, yi) perteneciente a la nube de puntos, le corresponde, en la recta, el punto Pi, de coordenadas (xi, Yi). Si se llama Di a la diferencia yi - Yi, se impondrá la condición de que la suma de los cuadrados de estas distancias sea mínima. Es decir, Σ(yi - Yi) = ΣDi2 debe ser mínima.
Puesto que Yi pertenece a la recta, Yi = a(xi - x) + y y ΣDi2 = [(yi - y) - a(xi - x)]2 debe ser mínimo.

De esta condición, y mediante un tratamiento matemático, se deduce que el valor de a debe ser:

a = σxy2x

Por lo tanto, la ecuación de la recta de regresión Y sobre X es:

y = (σxy2x)·(x - x)) + y


Al cociente σxy2 se le denomina coeficiente de regresión de Y sobre X y se representa por axy.

El método de obtención de esta recta, minimizando la suma de los cuadrados de las yi - Yi se denomina método de mínimos cuadrados y la recta de regresión se llama también recta de mínimos cuadrados.


Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130 ...

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín...

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuá...