Ir al contenido principal

Métodos de interpolación

Cuando se dispone de datos sobre dos variables estadísticas, su información no irá referida, en general, a todos los valores posibles de las variables, sino únicamente a algunos de ellos, pudiendo resultar de interés la obtención del dato correspondiente a un valor posible pero no observado.

La interpolación consiste en la obtención, a partir de un conjunto de observaciones de dos variables, del valor de cada una de ellas para un valor concreto de la otra que se encuentra dentro del campo de variación de los datos observados.

Así pues, a partir de una variable bidimensional (X, Y) que toma valores (xi, yi) i = 1, 2, ..., n, queremos obtener el valor de la variable Y correspondiente a x0, siendo: x1 < x0 < xn. Para ello, suponemos una relación funcional entre las variables, del tipo Y = f(X) de manera que: yi = f(xi) y se tendrá y0 = f(x0). Dicha función recibe el nombre de función de interpolación o interpolatriz.

Interpolación lineal y parabólica

La interpolación parabólica consiste en determinar los parámetros de una parábola que pasa por todos los puntos observados.

Si se dispone únicamente de dos observaciones: (x1, y1), (x2, y2), la función de interpolación será la recta que pasa por esos dos puntos: y = a + bx. Tendremos que determinar, por tanto, sus dos parámetros: la ordenada en el origen (a) y la pendiente (b).

Puesto que la recta pasa por los puntos observados, los parámetros serán la solución del siguiente sistema de ecuaciones:

y1 = a + bx1
y2 = a + bx2

es decir, b = (y2 - y1)/(x2 - x1); a = y1 - [(y2 - y1)/(x2 - x1)]x1

Por lo tanto, la recta de interpolación será:

y = y1 + [(y2 - y1)/(x2 - x1)](x - x1)


Por ejemplo, a partir de los puntos (4, 2) y (8, 10), la expresión es:
y - 2 = (8/4)(x - 4), esto es y = 2x - 6, con lo cual para x0 = 6 se obtiene y0 = 6.

En general, si se dispone de n observaciones: (xi, yi) i = 1,..., n, la parábola de interpolación, que será de grado n - 1, viene dada por la siguiente expresión:

y = a0 + a1x + a2x2 + ... + an-1xn-1

Como esta función ha de pasar por los n puntos, los coeficientes a0, a1, ... an debe satisfacer las siguientes igualdades:

y1 = a0 + a1x1 + a2x12 + ... + an-1xn-1
..........
yn = a0 + a1xn + a2xn2 + ... + an-1xnn-1

Con lo que se tiene un sistema de n ecuaciones con n incógnitas que puede ser expresado de forma matricial. Este sistema tiene solución siempre que el determinante de la matriz X sea no nulo, y esto ocurrirá cuando xi ≠ xj, para i ≠ j, es decir siempre que no haya más de una observación con la misma abscisa.

Método de las aproximaciones sucesivas

Si para completar el trazado de la carreteras llevado a cabo por el ministerio de fomento (expuesto en la entrada anterior) los habitantes de un pueblo deciden construir caminos vecinales que permitan acceder a todas las casas, podríamos obtener (siempre que conozcamos las coordenadas de las casas) la expresión general del trazada vecinal a través de una función interpolatriz.

No obstante, este método podría resultar poco operativo si el número de casas fuese elevado (por ejemplo, con 25 casas se llegaría a un sistema de 25 ecuaciones con 25 incógnitas que puede resultar engorroso).

El método de las aproximaciones sucesivas resulta más sencillo desde el punto de vista operativo. El hecho de que la función de interpolación se vaya obteniendo progresivamente permite introducir en la función una nueva observación (xn+1, yn+1)

Para analizar cómo funciona el método de aproximaciones sucesivas, consideramos solamente dos observaciones: (x1,y1),(x2,y2) a partir de las cuales podemos obtener la recta de interpolación:

y = y1 + [(y2 - y1)/(x2 - x1)](x2 - x1)

Si ahora tenemos un tercer punto, (x3, y3) podemos pasar a tener una parábola de segundo grado mediante la siguiente expresión:

y = y1 + [(y2 - y1)/(x2 - x1)](x2 - x1) + a2(x - x1)(x - x2)

Se puede comprobar que esta función pasa por las dos primeras observaciones. Como además, debe pasar por el tercer punto, se tendrá:

a2 = (y3 - y1 - [(y2 - y1)/(x2 - x1)](x3 - x1))/[(x3 - x1)/(x3 - x2)]

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores