La media aritmética puede ser considerada como el centro de gravedad de la distribución. Los valores bajos llevan a la media a tomar un valor bajo y los altos la llevan a valores altos, de manera que cuando el conjunto de valores es bastante uniforme se compensarán y la media resultará representativa. Para aquellas distribuciones que presenten valores anormalmente altos o bajos, o para las que algún valor tiene más tendencia a presentarse que el resto, es muy probable que la media aritmética supere o quede por debajo de la mayoría de las observaciones. En estos casos sería conveniente buscar un representante de la distribución con mayor capacidad descriptiva que la media. Recuerda que este representante es la mediana.
Para refrescar la memoria sobre la mediana, veamos este sencillo ejemplo:
Consideremos la distribución de salarios para un colectivo de 15 trabajadores de un cierto sector:
Salarios (en euros) | Número de Trabajadores |
750
|
1
|
850
|
2
|
900
|
3
|
1000
|
2
|
1100
|
1
|
1250
|
4
|
1400
|
2
|
Si se toman los datos en orden creciente: 750, 850, 850, 900, 900, 900, 1000, 1000, 1100, 1250, 1250, 1250, 1250, 1400, 1400, se puede comprobar que el valor 1000 ocupa el valor central, lo cual permite afirmar que el 50% de los asalariados percibe un salario inferior a 1000 euros. Hemos calculado la mediana de la distribución.
Bueno, por ahora ha sido repaso. En este ejemplo, resulta inmediato localizar la mediana, pues se dispone de un número impar de datos, y una vez ordenados éstos en forma creciente, se determina fácilmente el valor que ocupa el valor central. Cuando el número de datos es par se tienen dos valores centrales y suele tomarse como mediana la media aritmética de éstos.
Cuando los datos vienen agrupados en intervalos, podemos seleccionar el intervalo mediano: será aquel que representa la primera frecuencia acumulada mayor que N/2. Localizado el intervalo mediano podría pensarse en usar la marca de clase de ese intervalo como la mediana, pero sería únicamente una primera aproximación al valor mediano.
Para determinar cuál es el valor dentro del intervalo mediano que corresponde a la mediana, se puede suponer que las observaciones están uniformemente distribuidas a lo largo del mismo y utilizando la representación del polígono de frecuencias acumuladas en el tramo que corresponde al intervalo mediano y la semejanza de triángulos, se puede dar una aproximación mejor a la mediana que con la marca de clase del intervalo. Por lo tanto:
Me = Li-1 + ((N/2 - Ni-1)/ni)·ai
Si queremos calcular el valor mediano del gasto, después de calcular la columna de frecuencias acumuladas queda determinado el intervalo mediano [300-450) y el valor que corresponde a la mediana es:
Me = Li-1 + ((N/2 - Ni-1)/ni)·ai
A diferencia de los promedios explicados hasta el momento, la expresión de la mediana en el caso de datos agrupados difiere en gran medida de lo que sería el cálculo de este promedio para datos sin agrupar. Éste es un cálculo aproximado de la mediana y la aproximación será mejor cuanto más uniformemente estén repartidas las observaciones de partida en el intervalo mediano.
Un ejemplo:
Gasto/Mes (Euros) | Hogares (ni) | Ni |
[150-200)
|
10
|
10
|
[200-300)
|
40
|
50
|
[300-450)
|
62
|
112
|
[450-700)
|
24
|
136
|
[700-1000)
|
4
|
140
|
Si queremos calcular el valor mediano del gasto, después de calcular la columna de frecuencias acumuladas queda determinado el intervalo mediano [300-450) y el valor que corresponde a la mediana es:
Me = 300 + ((70 - 50)/62)·150 = 348,39 euros
En el cálculo de la mediana no intervienen todos los valores de la variable y por ello podría ser preferible a la media aritmética en aquellas distribuciones con datos muy irregulares (por ejemplo, en las distribuciones de ingresos).
En general, no es posible obtener la mediana para una población a partir de la mediana de varias subpoblaciones. Únicamente podemos decir que la mediana de la población total será un valor comprendido entre las medianas de las subpoblaciones.
Comentarios
Publicar un comentario
Puedes añadir tus comentarios. Gracias