Ir al contenido principal

Covarianza

A partir del estudio de dos variables estadísticas X e Y y de sus medidas de centralización y dispersión, se define una nueva medida llamada covarianza.

La covarianza mide la variación conjunta de ambas variables. Se representa por σxy y se define como:

σxyΣ((xi - x)·(yi - y))/N

O bien:

σxy = Σxiyi/N - y

Ejemplo

Tenemos que calcular la covarianza existente entre las calificaciones de matemáticas y física, y las calificaciones de matemáticas y literatura del ejemplo anterior.

Resolución

  • Cálculo de la covarianza entre las puntuaciones de matemáticas y física.
Sea X la variable puntuación en matemáticas e Y la variable puntuación en física. Para calcular la covarianza, se construye la siguiente tabla:

xi
yi
(xix)
(yiy)
(xix)(yiy)
xi·yi
2
4
-2,5
-1
2,5
8
6
6
1,5
1
1,5
36
8
7
3,5
2
7
56
5
6
0,5
1
0,5
30
5
7
0,5
2
1
35
1
0
-3,5
-5
17,5
0
27
30


30
165

  1. Media de las puntuaciones en matemáticas: x = 27/6 = 4,5
  2. Media de las puntuaciones en física: y = 30/6 = 5
  3. Covarianza (utilizando la primera fórmula, que suele ser la más usual):
σxy =  30/6 = 5


  • Cálculo de la covarianza entre las puntuaciones en matemáticas y literatura.
Sea en este caso X la variable puntuación en matemáticas, y la variable Y puntuación en literatura

xi
yi
(xix)
(yiy)
(xix)(yiy)
xi·yi
2
8
-2,5
2
-5
16
6
3
1,5
-3
-4,5
18
8
6
3,5
0
0
48
5
7
0,5
1
0,5
35
5
7
0,5
1
0,5
35
1
5
-3,5
-1
3,5
5
27
36


-5
157

  • Media de las puntuaciones en matemáticas: x = 27/6 = 4,5
  • Media de las puntuaciones en literatura: y = 36/6 = 6
  • Covarianza:
σxy = -5/6 = -0.833


Interpretación de la covarianza

Una covarianza positiva indica que ambas variables crecen o decrecen  simultáneamente. Cuando mayor sea la covarianza, más estrecha es la relación entre las variables.

Una covarianza negativa indica que cuando la variable crece, la otra decrece y viceversa. Cuanto menor sea la covarianza, puesto que es negativa, más estrecha es la relación entre las variables.

La covarianza cero o muy próxima a cero indica que no existe relación entre las variables.

Ejemplo

En el caso de las puntuaciones en matemáticas y física hay una covarianza positiva, lo que indica si un alumno tiene una puntuación alta en matemáticas, también la tendrá en física, y si la tiene baja en matemáticas, también la tendrá baja en física.

En el caso de las puntuaciones en matemáticas y literatura, la covarianza es negativa y próxima a cero, lo que indica que no casi relación en las variables.

Comentarios

Entradas populares de este blog

Ojivas

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva, y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual. Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia. Ejemplo Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas, desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que aparecen reflejados en la siguiente tabla. Complementos N.º de empleados [50-60) 16 [60-70) 20 [70-80) 32 [80-90) 28 [90-100) 20 [100-110) 10 [110-120) 4 130 ...

Polígonos de frecuencias

Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero. Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más distribuciones, ya que, así como es difícil representar dos o más histogramas en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias. La suma de las áreas de los rectángulos de un histograma de amplitud constante, es igual al área limitada por el polígono de frecuencias y el eje X. Ejemplo Vamos a construir a partir del histograma explicado en la entrada anterior , su correspondiente polígono de frecuencias. Ejemplo de polígono de frecuencias Interpretación de un polígono de frecuencias El polígono de frecuencias resume, en una sola lín...

Diagrama de líneas

Se realiza en un sistema de ejes cartesianos. En uno de los ejes (abscisas) se marcan los datos y en otro (ordenadas) la frecuencia de cada dato. No es necesario que los dos ejes tengan la misma graduación. Se señalan los puntos correspondientes (dato-frecuencia) y éstos se unen con líneas rectas. Estos gráficos se utilizan principalmente para hacer representaciones de series temporales de frecuencia cuyos datos no estén agrupados en intervalos. Ejemplo Representar la serie que refleja el número de salidas al extranjero, en un año, de 730 ejecutivos de una empresa mediante un diagrama de líneas, para: la frecuencia absoluta, la frecuencia relativa. Número de Salidas Número de Ejecutivos (fre.absoluta) Frecuencia Relativa 0 80 0,11 1 100 0,14 2 220 0,30 3 150 0,21 4 60 0,08 5 80 0,11 6 40 0,05 ...