Ir al contenido principal

Aspectos avanzados de la mediana

La media aritmética puede ser considerada como el centro de gravedad de la distribución. Los valores bajos llevan a la media a tomar un valor bajo y los altos la llevan a valores altos, de manera que cuando el conjunto de valores es bastante uniforme se compensarán y la media resultará representativa. Para aquellas distribuciones que presenten valores anormalmente altos o bajos, o para las que algún valor tiene más tendencia a presentarse que el resto, es muy probable que la media aritmética supere o quede por debajo de la mayoría de las observaciones. En estos casos sería conveniente buscar un representante de la distribución con mayor capacidad descriptiva que la media. Recuerda que este representante es la mediana.

Para refrescar la memoria sobre la mediana, veamos este sencillo ejemplo:

Consideremos la distribución de salarios para un colectivo de 15 trabajadores de un cierto sector:

Salarios
(en euros)
Número de
Trabajadores
750
1
850
2
900
3
1000
2
1100
1
1250
4
1400
2

Si se toman los datos en orden creciente: 750, 850, 850, 900, 900, 900, 1000, 1000, 1100, 1250, 1250, 1250, 1250, 1400, 1400, se puede comprobar que el valor 1000 ocupa el valor central, lo cual permite afirmar que el 50% de los asalariados percibe un salario inferior a 1000 euros. Hemos calculado la mediana de la distribución.

Bueno, por ahora ha sido repaso. En este ejemplo, resulta inmediato localizar la mediana, pues se dispone de un número impar de datos, y una vez ordenados éstos en forma creciente, se determina fácilmente el valor que ocupa el valor central. Cuando el número de datos es par se tienen dos valores centrales y suele tomarse como mediana la media aritmética de éstos.

Cuando los datos vienen agrupados en intervalos, podemos seleccionar el intervalo mediano: será aquel que representa la primera frecuencia acumulada mayor que N/2. Localizado el intervalo mediano podría pensarse en usar la marca de clase de ese intervalo como la mediana, pero sería únicamente una primera aproximación al valor mediano.

Para determinar cuál es el valor dentro del intervalo mediano que corresponde a la mediana, se puede suponer que las observaciones están uniformemente distribuidas a lo largo del mismo y utilizando la representación del polígono de frecuencias acumuladas  en el tramo que corresponde al intervalo mediano y la semejanza de triángulos, se puede dar una aproximación mejor a la mediana que con la marca de clase del intervalo. Por lo tanto:

Me = Li-1 + ((N/2 - Ni-1)/ni)·ai


A diferencia de los promedios explicados hasta el momento, la expresión de la mediana en el caso de datos agrupados difiere en gran medida de lo que sería el cálculo de este promedio para datos sin agrupar. Éste es un cálculo aproximado de la mediana y la aproximación será mejor cuanto más uniformemente estén repartidas las observaciones de partida en el intervalo mediano.

Un ejemplo:

Gasto/Mes
(Euros)
Hogares
(ni)
Ni
[150-200)
10
10
[200-300)
40
50
[300-450)
62
112
[450-700)
24
136
[700-1000)
4
140

Si queremos calcular el valor mediano del gasto, después de calcular la columna de frecuencias acumuladas queda determinado el intervalo mediano [300-450) y el valor que corresponde a la mediana es:

Me = 300 + ((70 - 50)/62)·150 = 348,39 euros

En el cálculo de la mediana no intervienen todos los valores de la variable y por ello podría ser preferible a la media aritmética en aquellas distribuciones con datos muy irregulares (por ejemplo, en las distribuciones de ingresos).

En general, no es posible obtener la mediana para una población a partir de la mediana de varias subpoblaciones. Únicamente podemos decir que la mediana de la población total será un valor comprendido entre las medianas de las subpoblaciones.


Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores