Ir al contenido principal

Aspectos avanzados de la moda

Partiendo de una representación gráfica de la distribución, bien sea un diagrama de barras o un histograma, la característica que más resalta en la primera visualización posiblemente sea su máximo, y si se trata de comparar dos distribuciones gráficas, una comparación inmediata antes de calcular cualquier tipo de promedio consistirá en ver si una es más apuntada que la otra. Puesto que al dar el valor que determina el máximo de la representación gráfica se tiene una primera impresión de la distribución, también de este modo estamos resumiendo la información inicial.

Se define la moda (esto es repaso de lo ya explicado) como aquel valor de la variable que presenta el valor de mayor frecuencia.

Su cálculo es inmediato cuando los datos están sin agrupar, salvo que haya más de un valor con esta frecuencia máxima, en cuyo caso se podría hablar de distribuciones bimodales, trimodales...

Al igual que con la mediana, el cálculo de la moda para datos agrupados es un algo más complejo. 

En una distribución de datos agrupados, antes de determinar el valor de la moda habrá que localizar el intervalo que la contiene, que se llama intervalo modal.

Puede parecer que el problema de determinar la moda ya está resuelto, pues localizado el intervalo modal, el representante del intervalo (la marca de clase) nos indicará la moda de la distribución. Ciertamente, es un valor aproximado de la moda, pero se puede hacer mejor.

Por ejemplo, busquemos el precio más frecuente para los automóviles vendidos el último mes por los concesionarios de una determinada marca de coches en una ciudad:

Precio
(miles de euros)
Número de
Coches
[9-13)
8
[13-16)
12
[16-22)
15
[22-30)
6
[30-50)
5

El intervalo de mayor frecuencia es el [16-22), pero debemos tener en cuenta que abarca más valores de precios que los dos anteriores a él, por lo que no tiene que corresponder a este intervalo el precio que más veces se ha presentado. Vamos a hacer el cálculo de las alturas para determinar el intervalo modal.

Precio
(miles de euros)
Número de
Coches
ai
hi
[9-13)
8
4
2
[13-16)
12
3
4
[16-22)
15
6
2,5
[22-30)
6
8
0,75
[30-50)
5
20
0,25

Dentro del intervalo modal, parece razonable que nos inclinemos por una moda más cerca de aquel intervalo contiguo de mayor altura. Esto supone que la distancia de la moda a los intervalos contiguos debe ser inversamente proporcional a la altura de éstos.

Si denotamos por a y b las distancias respectivas a los intervalos anterior y posterior al modal tendremos:

a·hi-1 = b·hi+1

Aplicando una propiedad de las proporciones tenemos:

a/hi+1 = b/hi-1 = (a + b)/(hi+1 + hi-1)

De donde obtenemos el valor de a:

a = (hi+1/(hi-1 + hi+1)·ai

Como la moda es Mo = Li-1 + a, se tiene que:

Mo = Li-1 + (hi+1/(h1-1 + hi+1))·ai

En este ejemplo, la moda resulta:

Mo = 13 + (2,5/(2 + 2,5))·3 = 14,67

El cálculo de la moda con datos agrupados resulta más sencillo si todos los intervalos tienen la misma amplitud, pues en este caso el intervalo modal corresponderá con el de mayor frecuencia.

Con la moda tenemos una nueva medida de síntesis de la información, con interpretación clara y cálculos sencillos, que no se ve afectada por valores extremos.

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Ejemplo de tabla de frecuencia para una variable cuantitativa continua

Cuando el estudio se refiere a una variable cuantitativa continua, como el peso, la talla, velocidad, etc., o cuando tratándose de una variable cuantitativa discreta, el número de observaciones es muy grande y la cantidad de valores diferentes que toma la variable también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos recibe el nombre de clase. Por ejemplo: En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno que tenga una estatura intermedia), se han obtenido los siguientes resultados en metros: 1,55 1,66 1,69 1,63 1,64  1,67 1,63 1,56 1,62 1,68 1,68 1,62 1,66 1,62 1,69  1,56 1,57 1,60 1,65 1,64 1,67 1,69 1,63 1,64 1,60  1,62 1,63 1,71 1,62 1,72 1,61 1,61 1,64 1,60 1,70  1,76 1,65 1,65 1,68 1,66 Para su estudio, se procede a la agrupación de los datos en intervalos o clases. Primero se observa cuáles son los valores