Ir al contenido principal

Entradas

Mostrando entradas de octubre, 2019

Aplicaciones del ajuste

A modo de ejemplo, para entender mejor lo explicado en entradas anteriores, vamos a estudiar una función que permite ajustar la distribución de la renta personal: la ley de Pareto. La función propuesta por Pareto para aproximar la distribución de la renta y la riqueza se puede aproximar como: Y = A/X ɑ , donde X es la renta, Y la proporción de personas que tienen una renta superior a X y A y ɑ parámetros. Dicha función no es lineal, por lo que para estimar los parámetros es aconsejable tomar logaritmos, con lo que resulta: ln Y = ln A - ɑlnX. Mediante los cambios: Y' = ln Y; A' = ln A; X' = -ln X se tendrá la función lineal: Y' = A' + bX'; realizando el ajuste de las nuevas variables por mínimos cuadrados obtendremos A' y ɑ, con lo cual quedarán determinados los parámetros del modelo (A = exp(A') y ɑ). Ejemplo A modo de ejemplo, vamos a estimar el ɑ de Pareto para la siguiente distribución de la renta de un colectivo de familias:

Otros tipos de ajuste

A menudo, las nubes de puntos de una distribución bidimensional presentan  disposiciones gráficas que desaconsejan su ajuste a través de una recta. En algunos puede resultar adecuado  un ajuste de tipo hiperbólico (Y = a + b/X), mientras en otros casos puede darse una relación potencial (Y = aX b ), y en otros puede darse la relación exponencial (Y = ab X ). En cualquiera de las situaciones descritas podría aplicarse el método mínimo-cuadrático, que desde el punto de vista conceptual sigue siendo válido. Sin embargo, se puede comprobar en estos casos que el cálculo de las derivadas parciales de la función a minimizar por mínimos cuadrados conduce a un sistema de ecuaciones no lineales. Para evitar la resolución de este sistema, que puede resultar engorrosa, podemos realizar la función de ajuste mediante cambios de variable, que permiten pasar de las expresiones iniciales a un modelo linealizado en el que podemos aplicar la expresión de la recta mínimo-cuadrática explicada en la

Ajuste lineal

Un ejemplo de ajuste, para que lo explicado en la anterior entrada , resulte más claro. Si partimos de información sobre renta y consumo, la nube de puntos se ajusta mediante una recta: y = a + bx, obteniéndose valores teóricos del tipo: y ti = a + bx i . Esta expresión lineal resultaría también indicada si el Ministerio de fomento decidiera que un tramo recto es la opción más conveniente. En general, este tipo de ajuste será (al igual que la hipótesis de linealidad) de aplicación muy generalizada. Nos interesa determinar los parámetros a y b que minimizan la suma de errores cuadráticos, es decir: E(a, b) = ΣΣ(y j - a - bx i ) 2 n ij Para que la expresión anterior sea mínima deben ser nulas las derivadas parciales respecto a cada uno de los parámetros, esto es: ∂E(a,b)/∂a = -2ΣΣ(y j - a - bx i )n ij = 0 ∂E(a,b)/∂b = -2ΣΣ(y j - a -bx i )x i n ij = 0 Aplicando las propiedades del operador suma, el sistema de ecuaciones normales resulta: Σy j n j = aN +

Método de los mínimos cuadrados

Dada una variable bidimensional (X, Y) que toma valores (x i , y j ) con frecuencias n ij (i = 1,...,k; j = 1,...,l), la nube de puntos que representa una distribución nos permite decidir (o al menos intuir) cuál puede ser la forma de la función que ajusta esos datos. Denotaremos por f esa función que depende de n parámetros: Y = f(X, a 1 ,..., a n ). Debemos obtener, a partir de los datos, una estimación de esos parámetros de manera que la función obtenida sea la que mejor aproxime las observaciones. Así, por ejemplo, en el ejemplo del trazado de carreteras del Ministerio de fomento, el objetivo sería que las vías de comunicación estuviesen lo más próximas posibles a los distintos puntos geográficos considerados (casas, pueblos, ciudades...). Para cada valor observado de la variable independiente X: x i podemos considerar dos valores de la variable dependiente Y, a saber: El valor observado: y j . El valor teórico y ti , que se obtiene mediante la función de ajuste y it = f

Introducción al ajuste

Mediante los métodos de interpolación hemos tratado de obtener una función que pase por el conjunto de puntos suponiendo dependencia funcional entre las variables. El planteamiento del ajuste es diferente en el sentido de que no hay dependencia exacta, sino estadística, y por tanto no existirá una función que pase por todas las observaciones. En este caso, estaremos interesados en buscar aquella que mejor aproxime los datos, proporcionando una idea intuitiva de la relación entre las variables y del comportamiento del fenómeno en líneas generales. Así, a diferencia del camino vecinal que habíamos considerado como ilustración de la interpolación, la carretera trazada por el ministerio de fomento no puede pasar por todas las casas del pueblo, ni siquiera por todos los pueblos de la geografía española. El planteamiento del ajuste conlleva, en primer lugar, decidir cuál será la forma más adecuada de la función, para seguidamente obtener los parámetros que la caracterizan dentro d

Aplicaciones de los métodos de interpolación

Los métodos de interpolación son de aplicación generalizada en estadística. De hecho, algunas de sus aplicaciones ya han aparecido en entradas anteriores: éste sería el caso de la deducción de las expresiones de cálculo de la mediana para datos agrupados (por poner un ejemplo). Además de las aplicaciones anteriores, las técnicas de interpolación tienen gran trascendencia en el ámbito económico, proporcionando a menudo aproximaciones a partir de datos oficiales. Vamos a ver un ejemplo. Ejemplo de aplicación Supongamos que un grupo de estudiantes va a realizar un trabajo sobre la cobertura sanitaria en España desde el año 1980 hasta la actualidad. Cuando se plantean recopilar datos sobre población se encuentran con el inconveniente de que los censos tienen periodicidad decenal, y como consecuencia, a partir de ellos únicamente se dispone de información cada 10 años. Por ejemplo, conociendo la población de hecho en España a 1 de marzo de 1981 y de 1991 que fue, según los censos

Métodos de interpolación

Cuando se dispone de datos sobre dos variables estadísticas, su información no irá referida, en general, a todos los valores posibles de las variables, sino únicamente a algunos de ellos, pudiendo resultar de interés la obtención del dato correspondiente a un valor posible pero no observado. La interpolación consiste en la obtención, a partir de un conjunto de observaciones de dos variables, del valor de cada una de ellas para un valor concreto de la otra que se encuentra dentro del campo de variación de los datos observados. Así pues, a partir de una variable bidimensional (X, Y) que toma valores (x i , y i ) i = 1, 2, ..., n, queremos obtener el valor de la variable Y correspondiente a x 0 , siendo: x 1 < x 0 < x n . Para ello, suponemos una relación funcional entre las variables, del tipo Y = f(X) de manera que: y i = f(x i ) y se tendrá y 0 = f(x 0 ). Dicha función recibe el nombre de función de interpolación o interpolatriz. Interpolación lineal y parabólica

Introducción a la interpolación

Una definición de interpolación podría ser la siguiente: si conocemos una serie de observaciones de dos variables, consideramos una función que pasa por todos esos datos y obtenemos a partir de ella un valor de una de las variables a partir de un determinado valor de la otra que no ha sido observado, pero que se encuentra comprendido en su campo de variabilidad. Este método resulta de gran utilidad para completar la información inexistente en series estadísticas basándonos en la continuidad de las variables. Supongamos que el Ministerio de Fomento ha elaborado un proyecto para elaborar una carretera en un pueblo de manera que pase lo más cerca posible de todas las casas, expropiando, si es necesario, algunas de ellas. En primer lugar, ha de decidirse la forma de la carretera para a continuación determinar su trazado, es decir, por dónde debe transcurrir con el fin de que las distancias de las casas a ella sean lo más cortas posible. Éste es un programa de ajuste: a pa

Ejercicios sobre indicadores espaciales

Como de costumbre, un par de ejercicios para entender mejor lo explicado. Ejercicio 1 En los presupuestos de un país imaginario se dispone de la siguiente información por zonas sobre inversión (en euros/habitante) y número de habitantes: Zona Inversión Número de Habitantes Central 26240 884657 Occidental 75500 160867 Oriental 70500 82848 Tenemos que: Obtener los índices de desigualdad individual de cada zona. Calcular el grado de desigualdad de la inversión en este país imaginario. Solución 1. x i n i x i n i Central 26240 884657 23213399680 Occidental 75500 160867 12145458500 Oriental 70500 82848 5840784000 1128372 41199642180 Media 36512,46 d 1 0,39 d 2 -0,52 d 3 -0,48 Recuerda que d i = ( x /x i ) - 1 2. D = ∑[

Medidas de localización espacial

Desde el punto de vista económico, resulta interesante examinar los factores que influyen en la localización en una actividad determinada zona o región espacial. Estos factores son de índole muy variada, incluyendo entre otros, la disponibilidad de mano de obra, existencia y coste de materias primas y energía, transportes... En efecto, si nos interesa investigar no sólo la posición relativa de un área sino también sus posibles ventajas respecto a la situación global, deberíamos de disponer de instrumentos capaces de describir de algún modo cuáles son las actividades económicas predominantes en ella y en que posición se hallan éstas en relación al conjunto. Este tipo de análisis nos permitiría conocer hasta qué punto un área está impulsando cierta actividad y también distinguir la riqueza relativa de las perspectivas futuras (creo que resulta evidente, por ejemplo, que de poco nos serviría que una zona fuese rica si la mayor parte de su producción dependiera de un sector que atrav

La desigualdad espacial y su medida

Los desequilibrios regionales concebidos como diferencias entre los valores que una magnitud adopta en las distintas unidades espaciales podrían ser cuantificados de distintos modos. Una primer posibilidad viene dada por las medidas de dispersión , que cuantifican hasta qué punto la situación de las regiones puede ser considerada homogénea. Si adoptamos como punto de partida la varianza, medida habitual de la dispersión, es posible observar que su expresión proporciona interpretaciones erróneas al cuantificar la homogeneidad entre regiones. En concreto, esta medida no permitiría distinguir entre estructuras espaciales homogéneas o polarizadas, ya que un mismo valor de S 2 puede ser obtenido como resultado de desviaciones moderadas o a partir de desviaciones pequeñas salvo una relativamente grande. Como consecuencia de su propia interpretación, resulta imprescindible que los indicadores de desigualdad espacial sean descomponibles. Este requisito viene a reflejar únicament

Conceptos de los índices espaciales

Como ya se ha anticipado, un índice espacial podría ser introducido como una medida relativa en la que la situación adoptada como referencia es la correspondiente a cierto ámbito territorial. Desde este punto de vista, en el caso más simple podría admitirse como válida la aproximación genérica efectuada para índices temporales, con sólo sustituir la dimensión temporal por la espacial. Así, dada una magnitud X, cuyo valor analizamos en distintas zonas j = 1,..., h, el índice simple de la zona h respecto al área de referencia r vendría dado por la expresión I hr = X h /X r . A pesar de que la traslación desde indicadores simples temporales a espaciales es aparentemente inmediata, surgen ciertos problemas conceptuales que no siempre tienen solución. Uno de los más frecuentes es el derivado de las definiciones que una misma variable tiene en distintos ámbitos espaciales (por ejemplo, el PIB en distintos países). Por otra parte, el hecho de que la magnitud sea única no garant

Análisis estadístico regional

El análisis espacial presenta una gran importancia en las investigaciones sociales debido a su trascendencia en campos tan diversos como la economía regional, la ecología... Desde el punto de vista económico, la existencia de desequilibrios o disparidades regionales es un fenómeno de interés por sus consecuencias sobre variables tales como la población (desequilibrios demográficos, movimientos migratorios...), la producción o la renta. Esta importancia justifica el protagonismo de los análisis territoriales. En este nuevo tema, voy a intentar explicar el conjunto de instrumentos útiles del análisis regional. Algunos de ellos presentan claras analogías con los índices temporales ya estudiados, mientras otros conducen a expresiones coincidentes con ciertos indicadores de desigualdad. Por otra parte, el análisis regional exige la utilización de modelos matemáticos que permitan estructurar sus teorías, planteamiento que conduce a la elaboración de indicadores de localizac

Ejercicios sobre números índices

Un par de ejercicios para entender mejor lo explicado sobre los números índices. Ejercicio 1 Una empresa dedicada a la metalurgia tiene contratado personal temporal. Para un mejor orden interno, clasifica al personal en peones, obreros cualificados y especialistas. El sueldo medio mensual pagado (en euros) por hora trabajada en los últimos cuatro años ha sido: Año Peones Obreros Cualificados Especialistas 2015 30 36 48 2016 33 47 49,5 2017 36 48 54 2018 38 49,5 55 Tenemos que obtener las series de índices simples que indiquen las variaciones de salarios de cada año respecto al año anterior en cada categoría. En la tabla siguiente figura el número de contratos temporales para esos cuatro años. Tenemos que calcular la serie de índices complejos ponderados, que con base en el 2015, señale las variaciones habidas en los sueldos medios pagados por hora trabajada. Tomaremos como ponderación el núme