La regresión es el estudio de los métodos de ajuste, de una curva conocida a una nube de puntos.
La regresión trata de determinar la expresión matemática de la línea que más se aproxima, o que mejor se ajusta, a la nube de puntos. Trata, por tanto, de averiguar cuál es la función que refleja del modo más exacto la relación entre ambas variables.
Regresión lineal
La regresión lineal estudia los distintos métodos, o técnicas, de ajustar una recta a una nube de puntos. Una de las finalidades de este ajuste es poder predecir los valores de una variable a partir de los de otra.
Cálculo de la recta de regresión Y sobre X
Dada una nube de puntos, la recta de regresión que mejor se ajusta a ella tendrá una ecuación de la forma
y = ax + b
Para obtener los valores de a y b, se impondrán dos condiciones:
- La recta de regresión ha de pasar por el punto P = (x, y), llamado centro de gravedad de la nube de puntos. Esta condición implica que:
y - y = a(x - x)
ecuación de la recta que pasa por el punto (x, y) y cuya pendiente es a.
Por lo tanto:
Por lo tanto:
y = a(x - x) + y
Sólo queda por determinar el valor de la pendiente de la recta, a.
- A cada punto Pi, de coordenadas (xi, yi) perteneciente a la nube de puntos, le corresponde, en la recta, el punto Pi, de coordenadas (xi, Yi). Si se llama Di a la diferencia yi - Yi, se impondrá la condición de que la suma de los cuadrados de estas distancias sea mínima. Es decir, Σ(yi - Yi)2 = ΣDi2 debe ser mínima.
Puesto que Yi pertenece a la recta, Yi = a(xi - x) + y y ΣDi2 = [(yi - y) - a(xi - x)]2 debe ser mínimo.
De esta condición, y mediante un tratamiento matemático, se deduce que el valor de a debe ser:
Por lo tanto, la ecuación de la recta de regresión Y sobre X es:
Al cociente σxy/σ2x se le denomina coeficiente de regresión de Y sobre X y se representa por axy.
El método de obtención de esta recta, minimizando la suma de los cuadrados de las yi - Yi se denomina método de mínimos cuadrados y la recta de regresión se llama también recta de mínimos cuadrados.
De esta condición, y mediante un tratamiento matemático, se deduce que el valor de a debe ser:
a = σxy/σ2x
Por lo tanto, la ecuación de la recta de regresión Y sobre X es:
y = (σxy/σ2x)·(x - x)) + y
Al cociente σxy/σ2x se le denomina coeficiente de regresión de Y sobre X y se representa por axy.
El método de obtención de esta recta, minimizando la suma de los cuadrados de las yi - Yi se denomina método de mínimos cuadrados y la recta de regresión se llama también recta de mínimos cuadrados.
Comentarios
Publicar un comentario
Puedes añadir tus comentarios. Gracias