Ir al contenido principal

Entradas

Mostrando entradas de mayo, 2019

La moda

La moda es el valor que más se repite en una serie de datos . Es, por lo tanto, el valor de mayor frecuencia. Se representa por Mo . La moda puede no existir; es el caso en que todos los datos se repitan el mismo número de veces. Por ejemplo, en la serie de números 2, 4, 6, 8 no hay ninguna moda. Puede ocurrir también que haya dos datos de máxima frecuencia; entonces hay dos modas y la serie se llama bimodal. Por ejemplo, en la serie 2, 2, 2, 3, 3, 4, 5, 5, 5, hay dos modas, el 2 y el 5. Del mismo modo, se puede hablar de series trimodales, si tienen tres modas, o multimodales si tienen más modas.

Cálculo de la mediana

Algunos sencillos (creo) ejercicios para entender mejor lo explicado en la anterior entrada . Ejercicio 1 Tenemos que calcular la mediana para estos datos: x i 1 2 3 4 n i 3 9 7 3 Resolución x i n i 1 3 2 9 3 7 4 3 N = 22 Tenemos que N = 22, par N/2 = 11 El primer dato cuya frecuencia absoluta acumulada sobrepasa N/2 es el 2, por lo que Me = 2. Ejercicio 2 Tenemos que calcular la mediana de las alturas en centímetros de 30 alumnos de una clase de 2º de Bachillerato: Altura n i [156-160) 2 [160-164) 5 [164-168) 8 [168-172) 6 [172-176) 3 [176-180) 1 [180-184) 5 Resolución Se construye la tabla: Altura n i Marc

La mediana

La mediana es el valor de la variable que ocupa el lugar central en una serie ordenada de datos. Por lo tanto, la mediana divide a la serie de datos por la mitad, de forma que deja la misma cantidad de valores por debajo de ella que por encima. Se representa por Me. En las series que tienen valores extremos, la mediana es más representativa que la media, puesto que en el valor de la mediana no influyen esos datos extremos. Cálculo de la mediana La mediana no tiene una expresión algebraica o fórmula como la media. En su cálculo, podemos distinguir tres casos: La frecuencia absoluta de los datos es uno Si el número de datos N es impar, la mediana es el valor central; ocupa el lugar (N + 1)/2. Si el número de datos N es par, la mediana es la media aritmética de los dos datos centrales La frecuencia absoluta de los datos es mayor o igual que uno Para encontrar en este caso el valor central, se ordenan los datos y se calculan las frecuencias absolutas acumuladas

Otras fórmulas para la media aritmética

Veamos algunas formas de calcular la media aritmética, que pueden resultar más fáciles y útiles. x =  ∑x i f i , donde x i son los datos y f i = n i /N las frecuencias relativas. x =  ∑x i P i /100, donde x i son los datos y P i = (n i /N)·100 el porcentaje de aparición de cada dato Ejemplo Vamos a calcular la media aritmética de la siguiente serie a partir de las frecuencias absolutas, frecuencias relativas y porcentajes: x i 0 1 2 3 4 n i 1 2 4 6 5 Construimos la tabla con los datos necesarios: x i F.absoluta n i x i ·n i F.Relativa f i x i ·f i P i x i ·P i 0 1 0 0,06 0,00 5,56 0,00 1 2 2 0,11 0,11 11,11 11,11 2 4 8 0,22 0,44 22,22 44,44 3 6 18 0,33 1,

Otras propiedades de la media aritmética

La desviación de un dato x i respecto de la media x es la diferencia que existe entre el dato y la media. Se representa  por la letra d i , d i = x i - x . Propiedades Propiedad 1 La suma de los desviaciones de los datos x i respecto de la media aritmética, x , es cero. Es decir: ∑d i = ∑(x i - x ) = 0 Ejemplo: Las edades de cinco amigos son: 18, 16, 17, 18 y 19 años. Tenemos que calcular ∑d i = ∑(x i - x ) x = (18 + 16 + 17 + 18 + 19)/5 = 17,6 años Edades (x i ) Desviaciones 16 -1,6 17 -0,6 18 0,4 18 0,4 19 1,4  ∑d i  = ∑(x i  -  x ) = 0 Propiedad 2 Si se multiplican o dividen todas las frecuencias absolutas de una serie de datos por un mismo número, la media aritmética no varía. Esta propiedad permite calcular la media aritmética de una serie de datos a partir de sus frecuencias absolutas, frecuencias relati

Propiedades de la media aritmética

La media aritmética es representativa de la serie cuando no hay valores muy separados. En el cálculo de la media, los valores extremos tienen mucho peso. Esto no ocurre con otras medidas de centralización, como la mediana o la moda. Esto se puede entender mejor con un ejemplo: Ejemplo El sueldo medio de cinco amigos que ganan 750, 850, 900, 950 y 1000 euros al mes es: x = (750 + 850 + 900 + 950 + 1000)/5 = 890 euros/mes Si mantenemos todos los sueldos iguales, salvo el primero. que asciende a 5000 euros, el sueldo medio se transforma en 1740 euros. Evidentemente, en este segundo caso, la media aritmética no representa el salario de los cinco amigos, ya que cuatro de ellos cobran menos que el sueldo medio. Como se ve en este ejemplo, con sólo cambiar un dato por otro que se diferencia mucho de los demás, la media aritmética varía considerablemente.

Cálculo de la media aritmética

Unos cuantos ejercicios, para repasar lo aprendido en esta entrada . Ejercicio 1 Preguntando a 30 personas el número de mensajes de whatsapp que recibió la semana anterior, obtuvimos las siguientes respuestas: Número de mensajes 0 1 2 3 4 Número de personas 5 7 9 6 3 Tenemos que calcular la media aritmética del número de mensajes. Resolución Para calcular la media aritmética hay que tener en cuenta que cada dato se repite el número de veces que indica su frecuencia absoluta, es decir, el cero se repite 5 veces, el 1 se repite 7 veces ... Este cálculo se realiza más cómodamente añadiendo a la tabla anterior una columna que indique el resultado de multiplicar cada dato por su frecuencia: N.º de mensajes (x i ) N.º de personas (n i) x i ·n i 0 5 0 1 7 7 2 9 18 3 6 18 4 3 12

La media aritmética

Supongamos que x 1 , x 2 , ..., x n son los n valores que toma una distribución estadística. La media aritmética se representa por x y es: x = (x 1 + x 2 + ... + x n )/n Es el cociente entre la suma de los datos y el número total de datos. Cálculo de la media aritmética para datos sin agrupar Podemos distinguir dos casos: Datos con frecuencia absoluta igual a uno. La media aritmética, en este caso, es, si N es el número total de datos: x = (x 1 + x 2 + ... + x n )/N = ∑x i /N Datos con frecuencia absoluta mayor que uno. Suponemos que el dato x 1 se registra n 1 veces, el x 2 n 2 veces, el x p n p veces y el número total de datos es N. La media aritmética de una distribución de este tipo es: x = (x 1 n 1 + x 2 n 2 + .... + x p n p )/(n 1 + n 2 + ... + n p ) Que es lo mismo que: x = ∑x i n i /N NOTA: El signo ∑ es la letra sigma mayúscula del alfabeto griego. Indica que hay que sumar todas las frecuencias, n i , desde la p

Introducción a las medidas de centralización y dispersión

La estadística descriptiva tiene la finalidad de analizar los datos de una serie y describir su comportamiento. Para facilitar la tarea, se utilizan tablas de frecuencia y las representaciones gráficas. Pero esto no es suficiente; es necesario reducir los datos a unos cuantos números que proporcionen una idea clara de la misma. Estos números reciben el nombre de parámetros. Los parámetros ponen de manifiesto los rasgos principales, o características, de una distribución de frecuencias o tabla de frecuencias. Las características hacen referencia a la mayor o menor concentración de los datos, a su dispersión, a la forma que toma su representación gráfica... Si en una empresa, por ejemplo, se quiere hacer un estudio de los salarios de los empleados, puede parecer interesante saber cuál es el salario medio, cual es el sueldo de la mayoría (que no tiene porqué coincidir con el salario medio), cuál es el salario para el que hay tantos inferiores como superiores, etc. Estas característi

Pirámide de población

La pirámide de población es una representación gráfica que refleja la composición de una variable respecto a su edad y sexo. Estudia conjuntamente una variable cualitativa o atributo, el sexo, y una variable cuantitativa, la edad. Se representan en un sistema de ejes cartesianos, utilizando dos cuadrantes. En la parte positiva del eje X suele ir representado el número de mujeres, mientras que la parte negativa representa el número de varones. En el eje de coordenadas, eje Y, se representan las edades. La forma que suele tener el gráfico es de una pirámide, y es a este hecho al que debe su nombre. El estudio de la pirámide permite analizar la distribución de la población, descubrir los accidentes que ha sufrido: guerras, catástrofes..., conocer si tiende a crecer o no, y hacer previsiones para el futuro (para reformar el sistema de pensiones, por ejemplo). Interpretación de una pirámide de población La forma que adquiere la pirámide refleja si se trata de una población jo

Cartogramas y pictogramas

Estos dos tipos de representaciones gráficas no se suelen utilizar mucho, y están en desuso, pero como en esta vida nunca se sabe, yo os las explico, por si alguna vez os toca trabajar con ellas. Cartogramas Los cartogramas son representaciones gráficas que se utilizan para reflejar las series espaciales. Consisten en señalar sobre un mapa, mediante colores o rayados de distinta intensidad, la distribución geográfica de un determinado fenómeno. Para representar un cartograma hay que dibujar un mapa y representar en él las distintas comarcas, autonomías, provincias..., según interese en cada caso. Para interpretar un cartograma, basta observar el mapa, que se confecciona la mayor parte de las veces con datos numéricos y otras con rayados de distinta intensidad. Pictogramas Son representaciones gráficas llamativas, a veces a modo de chiste o parodia, que se elaboran con dibujos alusivos a la serie que se representa. Tienen como ventaja su fácil comprensión, pero carecen

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín

Histogramas

Esta representación gráfica se utiliza para series atemporales cuando los datos están, o no, agrupados en intervalos. Utiliza un sistema de representación cartesiana. Para construir un histograma se representa sobre el eje de abscisas la amplitud del intervalo. Se levantan unos rectángulos que tienen por base dichas amplitudes, con la condición de que el área de cada rectángulo sea proporcional a la frecuencia del intervalo que representa. Como el área de un rectángulo es base por altura, y la base viene determinada por la amplitud del intervalo, conviene distinguir dos casos: Todos los intervalos tienen la misma amplitud . Si todos los intervalos tienen la misma amplitud, basta con construir rectángulos cuya altura sea igual a su frecuencia. El área de cada rectángulo será la amplitud de cada intervalo multiplicada por su frecuencia. Todos los intervalos no tienen la misma amplitud . Las bases de los rectángulos siguen siendo las amplitudes de los intervalos. Para ob

Diagrama de sectores

El diagrama de sectores consiste en dividir un círculo en sectores circulares, de modo que la amplitud de cada sector sea proporcional a la frecuencia del dato que representa . Para conseguirlo, basta con aplicar una simple regla de tres, tantas veces como sea necesario. O sea, si 360º representan el número total de datos, N, Xº representarán la frecuencia de un determinado dato. Una vez obtenido el número de grados que corresponde a cada valor o modalidad de la variable, con el compás, trazamos una circunferencia; se dibuja el radio de la misma y, a partir de él, con el transportador de ángulos, se miden los grados que corresponden al primer valor; se pinta el sector circular correspondiente y se continua del mismo modo con el siguiente dato, hasta completar los 360º. Este tipo de gráfico se utiliza principalmente para representar series atemporales espaciales y atemporales de frecuencia. El diagrama de sectores tiene la desventaja de requerir bastantes cálculos, a p

Diagrama de barras

Para representar una serie en un diagrama de barras se utiliza un sistema de ejes cartesianos. En el eje de abscisas se representan los valores de la variable, y en el eje de ordenadas sus frecuencias. Por los puntos marcados en el eje de abscisas se dibujan las barras, cuya longitud queda determinada por la frecuencia de cada dato. No es necesario que las escalas utilizadas en cada uno de los ejes sean iguales. Se utilizan para representar las series temporales y atemporales para datos no agrupados. En algunos casos, las barras o columnas se trazan horizontalmente. En tales casos, la variable se representa en el eje de ordenadas, y la frecuencia, en el de abscisas. El diagrama de barras es muy útil cuando se quieren contrastar distintos aspectos de una misma variable . Esto se consigue dibujando las columnas referentes a un aspecto a continuación de las otras con diferentes colores, o bien superponiendo las columnas de los distintos aspectos, cada una con un color. E

Diagrama de líneas

Se realiza en un sistema de ejes cartesianos. En uno de los ejes (abscisas) se marcan los datos y en otro (ordenadas) la frecuencia de cada dato. No es necesario que los dos ejes tengan la misma graduación. Se señalan los puntos correspondientes (dato-frecuencia) y éstos se unen con líneas rectas. Estos gráficos se utilizan principalmente para hacer representaciones de series temporales de frecuencia cuyos datos no estén agrupados en intervalos. Ejemplo Representar la serie que refleja el número de salidas al extranjero, en un año, de 730 ejecutivos de una empresa mediante un diagrama de líneas, para: la frecuencia absoluta, la frecuencia relativa. Número de Salidas Número de Ejecutivos (fre.absoluta) Frecuencia Relativa 0 80 0,11 1 100 0,14 2 220 0,30 3 150 0,21 4 60 0,08 5 80 0,11 6 40 0,05